.
안녕하세요. 에이치비킴 입니다.
본 포스팅을 살펴보기에 앞서, 연합학습의 개념에 대해 알고 계시면 큰 도움이 될 것 같습니다.
이번 논문 리뷰는 논문이 작성된 포맷에 맞춰 순서대로 살펴 볼 예정입니다.
논문명: Federated Learning for Internet of Things: A comprehensive Survey (Dinh C. Nguyen, Pubudu N. Pathirana, and Jun Li)
1. INTRODUCTION
@ 기존 머신러닝 기법에서의 cloud server 및 data center는 방대한 양의 IoT 데이터에 의해 치명적 한계를 가질 수 있다.
@ Cisco에 따르면, 2021년에 850 ZB 만큼의 데이터가 쏟아져 나올 것으로 예상한다.
@ 이 데이터에는 사람, 머신, 네트워크 상에서 발생할 수 있는 모든 데이터를 포함된다.
@ 하지만, global data center의 트래픽은 20.6 ZB 만큼의 데이터를 수용할 수 있다.
@ 위와 같은 현상(데이터 양의 증가)으로 인하여 적절한 네트워크 자원과 지연율을 갖출 수 없게 된다.
@ 모델 구축을 위한 Third-party 서버는 privacy와 관련한 문제를 일으킬 수 있다.
@ privacy 보호 및 효율적 IoT 네트워크 구축이 필요하다. -> 연합학습의 필요성
@ 연합학습이란, 분산 협업적인 AI 접근 방식이다.
- 실제 데이터셋의 공유 없이, 하나의 중앙 서버와 다수의 장치들이 조화를 이루는 학습 방식을 의미한다.
- IoT 환경에서, 다수의 장치들은 IoT 장치들을 의미한다.
@ With its innovative operational concept, FL can offer various important benefits for IoT applications as follows:
- Data Privacy Enhancement
- Low-latency Network Communication
- Enhanced Learning Quaility
@ The key contributions of this article are highlighted as follows:
- Presenting a state-of-art survey on the application of FL in IoT networks
- Discussing the opportunities created by FL in many key IoT services, namely IoT data sharing, data offloading and caching, attack detection, localization, mobile crowdsensing, and IoT privacy and security
- Performing a holistic investigation and analysis of the potential of FL in a number of IoT applications
- From the survey of FL-IoT services and applications, the key lessons learned are highlighted
- Comparison and Our Contributions
@ Table. 1에서 Limitations을 집중하여 살펴볼 것
- Structure of the Survey
2. FL AND IOT: STATE OF THE ART
- Federated Learning
@ 연합학습의 개략적 구조가 Fig. 2에 나타나있다.
@ IoT 환경에서 쓰이는 FL-IoT 시스템의 구조가 Fig. 3에 나타나있다.
@ 연합학습 네트워크 구조의 2가지 형태가 Fig. 4에 나타나있다.
- Centralized Federated Learning (CFL)
- Decentralized Federated Learning (DFL)
@ DFL은 CFL과 다르게, 훈련과정에서 중앙 서버가 존재하지 않는다.
- 모든 클라이언트가 peer-to-peer(P2P) 형태로 연결되어 있다.
- 현대의 기술과 어우러져서, 블록체인과 같은 P2P 기반 통신 기술로도 활용할 수 있다.
- Internet of Things
@ IoT Data Analytics
@ Intelligent Service Provision
- Visions of the Use of FL in IoT
@ The use of FL enables distributed data learning by leveraging computational capabilities of IoT devices to achieve an common objective, such as offloading latency minimization
@ Enabled by the privacy enhancing features of FL, federated attack detection and defense solutions can be realized using FL where each IoT device joins to run an AI model, such as a DNN, in order to train the threat model to fight against adversaries
@ FL is able to provide new directions for enabling smart IoT applications, such as smart healthcare, smart transportation, and smart city
3. FL FOR IOT SERVICES
@ 연합학습과 IoT 기술을 접목한 state-of-the-art survey에 관하여 살펴본다.
- FL Serving as an Alternative to IoT Data Sharing
@ 연합학습은 차량 간 통신에서 분산된 데이터를 활용하는 데에도 사용된다.
@ [1]에서는 Internet of Vehicles(IoV)를 위한 비동기 연합 데이터 공유 프레임워크를 제안한다.
- [1]의 프로토콜이 Fig. 5에 표현되어 있다.
@ 각 차량은 연합학습의 클라이언트들로 간주되며, macro BS(MBS)를 중앙 서버로 간주한다.
@ IoV에서 활용할 수 있는 기술은 traffic prediction, path selection 등이 있다.
@ 축적된 차량 데이터를 기반으로 하는 global model을 통해, MBS는 최선의 경로를 찾기 위한 계산을 진행한다.
- Based on an actor-critic reinforcement learning framework
@ 이 과정을 통해 참여하는 노드들을 good/bad로 분류하고, sharing cost를 최소화하기 위한 최적화 과정을 진행한다.
@ 데이터 공유 과정에서의 security와 reliability 향상을 위해 블록체인 기술이 활용될 수 있다.
@ 블록체인이 활용 가능한 이유(reward 개념이 어떻게 포함되어있는가)
- 블록체인을 활용하면, reward 개념이 도입되어야 한다.
- reward 개념이 도입된 것은, good/bad로 분류하여 각각의 라벨에 맞는 최적화 과정을 제공하기 때문이다.
- FL for the Optimization of Iot Data Offloading and Caching
- FL for IoT Attact Detection
@ 연합학습과 같은 분산 학습 환경에서는, 연합학습 구조 내부에서 공격 검출 능력을 갖고 있는 것이 필수적이다.
@ 연합학습에서의 privacy 보호 장점을 극대화하기 위한 방법은, 위협에 대항할 수 있는 모델로 훈련되어지기 위해 각각의 IoT 장치들이 DNN 모델에 함께하는 것 이다.
@ 이러한 과정이 Fig. 6에 나타나있다.
@ 우선 각 IoT 장치들이 retraining set을 만들기 위해 가상의 적 샘플을 생성한다.
@ 이 값이 서버에 전송되면, 서버는 global model을 계산하여 local devices에 재전송한다.
@ 다수의 장치들의 협력을 통해 모델 훈련 과정에서 공격 위험성을 완화시키고, 위협 검출 능력을 향상시킨다.
- FL for IoT Localization
- FL for IoT Mobile Crowdsensing
@ 연합학습은 secure한 UAV-based crowdsensing 기법에도 사용된다.
- [2]의 프로토콜이 Fig. 7에 표현되었다.
@ UAV에서의 blockchain 또한 decentralize 학습 방법이다.
@ UAV에 blockchain ledger을 사용함으로써 안전하고 투명한 UAVs의 학습 및 검증이 이루어질 수 있게끔 한다.
@ local 학습 결과 업데이트 과정에서의 privacy를 향상시키기 위해, local 별 privacy 기법을 적용한다.
- aggregate에서의 accuracy 성능이 보장되어야 한다.
@ MNIST 데이터셋으로 성능을 검증한 결과, high utility of UAVs 및 low aggregation error, 그리고 적은 수준의 latency 성능을 보이는 것을 확인하였다.
- FL-Based Techniques for Privacy and Security in IoT Services and Networks
- All Taxonomies of FL-IoT Services
4. FL FOR IOT APPLICATIONS
@ 3장에서 보다 확장된 적용 범위를 다룬다.
- A wide range of key IoT applications, including smart healthcare, smart transportation, UAVs, smart city, and smart industry
- Fig. 8에 표현되었다.
- FL for Smart Healthcare
@ 유행병이 크게 창궐하고 있는 최근, 연합학습은 감염 질병에 대응할 수 있는 잠재력을 가짐이 확인되었다 [3].
- [3]의 프로토콜은 Fig. 9에 표현되었다.
@ 코로나 환자의 CT scan images가 병원들 간 blockchain 형태로 전송된다.
@ 연합학습을 통해 모델 업데이트 guidance를 정하고, 이를 통해 image classification performance를 향상시킬 수 있다.
@ 34,006개의 CT scan images를 통해 검증된 결과로, a high COVID-19 image classification 및 low data loss를 보였다.
- FL for Smart Transportation
- FL for Unmanned Aerial Vehicles (UAVs)
@ FL for UAV Network Management, forming a hybrid spatio-temporal sensing system [4].
@ 각 UAV는 연합학습의 클라이언트의 역할을 한다.
@ 각 UAV는 원본 데이터의 공개 없이, 각 coverage area에 대한 대기질 지수를 모니터링한다.
- By cooperating UAVs with a central server with a light-weight model like DenseMobileNet
@ 작업 중의 UAV 에너지 소비를 제어하는 것과 함께, 공기 품질 예측을 제공하는 것이 궁극적 목표이다.
@ CNN 또는 SVM 기반 알고리즘과 비교하였을 때, 제안하는 알고리즘이 better accuracy in air quality estimation with privacy protection and energy efficiency를 보였다.
- FL for Smart City
- FL for Smart Industry
@ 실제 현장에서 사용되는 연합학습과 IoT의 예시를 살펴본다.
- FL for Robotics and Industry 4.0
- Efficient FL for Industrial Edge-Based IoT Networks:
- Communication-Efficient FL for Industrial Edge-Based IoT
- Network Resource-Efficient FL for Industrial Edge-Based IoT
- FL Implementation and Testbeds in Industrial IoT
- All Taxonomies of FL-IoT Applications
5. CONCLUSION
@ FL is an emerging distributed AI approach that has sparked great interest to realize privacy-enhancing and scalable IoT services and applications.
Reference
[1] Y. Lu, X. Huang, K. Zhang, S. Maharjan, and Y. Zhang, “Blockchain empowered asynchronous federated learning for secure data sharing in Internet of Vehicles,” IEEE Trans. Veh. Technol., vol. 69, no. 4, pp. 4298–4311, Apr. 2020.
[2] Y. Wang, Z. Su, N. Zhang, and A. Benslimane, “Learning in the air: Secure federated learning for UAV-assisted crowdsensing,” IEEE Trans. Netw. Sci. Eng., early access, Aug. 5, 2020, doi: 10.1109/TNSE.2020.3014385.
[3] R. Kumar et al., “Blockchain-federated-learning and deep learning models for COVID-19 detection using CT imaging,” Jul. 2020. [Online]. Available: arXiv: 2007.06537.
[4] Y. Liu et al., “Federated learning in the sky: Aerial-ground air quality sensing framework with UAV swarms,” Jul. 2020. [Online]. Available: arXiv: 2007.12004.
[5] T. Hiessl, D. Schall, J. Kemnitz, and S. Schulte, “Industrial federated learning—Requirements and system design,” May 2020. [Online]. Available: arXiv:2005.06850.