본문 바로가기

ML & DL 이야기/내가 보려고 하는 논문 리뷰

[Paper Review] Popularity Prediction with Federated Learning for Proactive Caching at Wireless Edge

Abstract

  • Edge caching에 앞서서 file popularity prediction은 굉장히 중요한 역할을 한다.
  • Popularity prediction을 위한 보편적인 방법은 centralized learning이다.
    • request information와 사용자의 개인 정보를 수집해야 한다.
    • 이 과정에서 privacy-disclosure 문제가 발생할 수 있다.
  • 본 논문에서는, 이러한 priacy 이슈에 대응하기 위해 연합학습을 사용한다.
  • 정보의 공개 없이 base station에서 popularity prediction을 진행하기 위해서는, 각 유저의 weighted sum을 base station으로 전송하여야 한다.
  • 본 논문에서는, 실제 데이터셋을 이용한 시뮬레이션을 통해 centralized learning과 거의 유사한 성능을 보임을 입증한다.

Introduction

  • 앞으로 발생 할 file popularity 예상은 불가능하지만, popularity prediction이 edge caching을 위한 key task가 될 것이다.
  • 기존에는 prediction을 위한 수단으로 중앙화된 머신러닝을 사용하였지만, 모든 유저로부터 데이터를(request의 historical number) base station이나 central processor으로 수집하는 과정에서 privacy 문제가 발생한다.
    • 수집하는 데이터에는 personal data(e.g. 나이 또는 성별 등의)가 포함될 수 있기 때문이다.
  • Personal information을 로컬에서 처리할 수 있는 distributed learning framework를 디자인하여야 한다.
    • 본 논문에서는 연합학습을 그 해답으로 사용한다.

연합학습이란?

 

  • 최근 들어, 연합학습은 wireless problem에 대응하기 위한 수단으로 소개되고 있다 [1-5].
  • [3]은 심층 강화학습을 사용하여 base station에서의 proactive caching 문제를 해결하였다.
    • Base station도 caching policy를 최적화하기 위한 participant로 활용되었다.
  • [3]과 [4]는 결국 base station 내부에 user의 request 또는 location data가 저장되어 있기 때문에, privacy 이슈가 남아있다.
  • 본 논문에서는, 연합학습을 사용하여 user preference 공개 없이 file popularity(proactive edge caching을 위한)를 예측하는 기법을 소개한다.

 

논문 진행 순서

  1. 연합학습을 사용한 popularity prediction을 진행하기 위해 request data를 예시로 활용한다.
  2. User preference를 숨기면서 popularity prediction을 진행하기 위해, 어떠한 정보를 base station으로 전송할지 선정해야 한다.
  3. 본 논문에서는 file popularity, user preference와 activity level이 정적일 때, 각 유저의 정보들이 weighted sum 형태로 주어진다면, base station에서 file popularity를 에측할 수 있음을 보인다.
  4. 각 유저의 historical request records로 학습되는 preference-weighted popularity를 학습시키기 위한 neural network 구조를 디자인한다.
  5. 동적인 popularity를 갖는 실제 상황에서, 본 논문에서 제안하는 기법이 centralized learning과 유사한 cache-hit ratio 수치를 보임을 확인한다.

 


System Model

  • Base station(BS)이 core network에 연결되어 있다고 가정한다.
  • 각 셀에는 K 수의 유저가 있고, 유저들은 F 파일에 대한 request를 요청한다.
  • Mobile Edge Computing(MEC)의 서버는 각 BS와 함께 위치하고, 셀의 file popularity를 예측한다(proactive caching을 업데이트함으로써).
  • 시간은 each with cache update duration에 따라 이산화된다.
  • 셀의 file popularity는 각 사용자의 preference와 activity level에 따라 정해진다 [6].
  • 하나의 time period에서 하나의 셀에 대한 file popularty는 아래 수식과 같이 나타낸다.

그림 1. File popularity를 나타내는 수식.

 

  • 위 수식 우측의 p는, 셀에 있는 모든 유저가 f 번째 파일에 대한 request를 요청하였음을 의미한다.
  • user preference와 user activity level은 아래와 같다.

 

그림 2. User preference를 나타내는 수식.
그림 3. User activity level을 나타내는 수식.

 

  • 하나의 time period에서 셀의 file popularity는 첫 request에 담긴 유저의 activity level과 preference에 따라 얻어질 수 있다 [6].
  • 하나의 time period에서 각 파일에 각 유저가 request를 요청하는 횟수를 request record라고 한다.
  • 연합학습을 사용하여 file popularity prediction을 할 때에는, 각 유저의 request records가 유저의 로컬 디바이스에만 저장된다.
  • 하나의 time period가 시작될 때, MEC 서버는 취합된 file popularity와 model parameters를 유저에게 broadcast한다.
  • 직전 단계에서 최초로 전달 받은 model parameter(global model)를 기반으로, 각 유저는 로컬에 담긴 각자의 own historical request records를 학습시켜 local model을 생성한다.
  • 해당 time period가 끝나갈 때, 각 유저는 local model을 MEC 서버로 업로드하고, MEC 서버(이하 'BS')에서는 이를 취합하고 caching policy를 최적화한다.
    • MEC 서버가 Base station이라는 의미는 아니지만, 본 논문에서는 MEC 서버를 base station으로 보아도 무방하다.

 


Predicting Popularity with Federated Learning

A. Uploaded Information of Each User

  • User information의 공개 없이, 어떠한 정보를 BS에 전송할지 결정하는 과정이 필요하다.
  • 각 유저들이 predicted popularity를 보내는 것이 최선이지만, 각 유저는 request records만을 갖고 있으므로 앞선 정보를 갖는 것이 불가능하다.
  • BS에서 initialized popularity를 얻어내면, 이후 단계를 진행하기 수월하다.
    • Initialized popularity는 연합학습의 개념이다.
  • 다른 방법은, 각 유저의 predicted user preference를 전송하는 것이다.
  • 이 방법이 가능한 이유는, 각 유저의 request records를 통해 추정된 유저의 preference가 supervised learning의 label로 사용될 수 있기 때문이다.
    • 이를 통해, BS에서는 predicted file popularity를 얻어낼 수 있다.
  • 하지만 각 유저의 personal information을 숨기기 위해서는, 각 유저가 업로드하는 user preference와 file popularity를 weighted sum 형태로 업로드하여야 한다.
  • k 번째 유저가, t 시간에 갖는 preference-weighted popularity는 아래와 같다.

그림 4. preference-weighted popularity을 나타내는 수식.

 

B. Predicting Preference-weighted Popularity at Each User

C. Predicting File Popularity at the BS

 

Reference

 

[1] .S. Samarakoon, M. Bennis, W. Saad, and M. Debbah, “Federated learning for ultra-reliable low-latency V2V communications,” in Proc. IEEE GLOBECOM, 2018.

[2] W. Y. B. Lim, N. C. Luong, D. T. Hoang, Y. Jiao, Y.-C. Liang, Q. Yang, D. Niyato, and C. Miao, “Federated learning in mobile edge networks: A comprehensive survey,” arXiv preprint arXiv:1909.11875, 2019.

[3] X. Wang, Y. Han, C. Wang, Q. Zhao, X. Chen, and M. Chen, “In-edge AI: Intelligentizing mobile edge computing, caching and communication by federated learning,” IEEE Netw., vol. 33, no. 5, pp. 156–165, Sep. 2019.

[4] M. Chen, O. Semiari, W. Saad, X. Liu, and C. Yin, “Federated echo state learning for minimizing breaks in presence in wireless virtual reality networks,” arXiv preprint arXiv:1812.01202, 2018.

[5] Z. Yu, J. Hu, G. Min, H. Lu, Z. Zhao, H. Wang, and N. Georgalas, “Federated learning based proactive content caching in edge computing,” in Proc. IEEE GLOBECOM, 2018.

[6] D. Liu and C. Yang, “Caching at base stations with heterogeneous user demands and spatial locality,” IEEE Trans. Commun., vol. 67, no. 2, pp. 1554–1569, Feb. 2019.