닫기

기획특집

[IoT 네트워크 지능화 기술] ‘연결’ 이후 ‘서비스’에 고민…네트워크 머신러닝 적용 시도 활발

URL복사

[첨단 헬로티]
그동안 인더스트리4.0의 가장 큰 화두는 ‘연결’이었다. 그러나 사람들은 지금 연결 다음을 고민하게 됐다. 연결된 이후에 새로운 서비스와 부가가치를 디바이스, 네트워크에 담아야 하는데 그게 쉽지 않은 것이다. 또 하나는 기존 구축한 네트워크와 IoT 디바이스로는 기하급수적으로 증가하는 데이터를 효율적으로 처리하기 어려졌다. 따라서 조금 더 인텔리전스한 기술이 IoT 도메인에도 있었으면 좋겠다는 요구가 나오게 됐다. 최근 IoT 네트워크 지능화 기술 동향에 대해 IoT DevCon 2018 컨퍼런스’에서 ETRI 홍용근 팀장이 발표한 강연 내용을 정리했다. [편집자 주]

 

 

 ▲ETRI 홍용근 팀장

 

현재 IoT 네트워크 지능화 관련 국내연구 기관으로는 KSB(융합연구단)가 있다. KSB는 Knowledge-converged Super Brain의 약자로, 전자통신연구원, 표준연구원, 에너지연구원, 원자력연구원, 4개의 기관이 모여서 융합으로 연구를 진행하고 있다. 이 기관이 하는 일은 △상태를 모니터링하여 데이터를 수집하고 △수집된 데이터를 정제하고 △정제된 데이트를 바탕으로 기계학습과 지식을 추출하고 △도메인의 전문가 지식과 융합하여 추론 및 최적화함으로써 △예측, 예방, 최적화 지능 서비스 제공하는 것을 목표로 하고 있다.

 

IoT의 화두

 

IoT 참조 모델을 보면, 가장 밑단에는 센서, 디바이스, 액추에이터 등으로 이루어진 Things가 있다. 그 위에는 커넥티비티, 에지 컴퓨팅, 데이터 수집으로 구성된 에지(Edge)가 있으며, 그것이 더 모여서 클라우드/빅데이터가 되고 다시 서비스나 디바이스로 구현된다.


예전에는 센서나 액추에이터, 디바이스로부터 획득한 데이터가 중간에 아무런 처리 과정 없이 대부분 클라우드로 보내졌다. 그렇게 보내진 데이터는 학습과 연산을 통해서 다시 내려오게 되는데, 지금까지는 디바이스 개수도 많지 않고 투입되는 데이터양도 많지 않아서 별 문제없었지만, 최근 사물인터넷이 확장되면서 여러 가지 서비스가 나오고 AI 기술이나 빅데이터 기술이 접목되면서 수집되는 데이터양이 많아지게 됐다. 때문에 중간의 에지에서 지능적으로 처리해줄 수 있는 기술이 요구됐다.


IoT 도메인을 보자. 예전에는 가장 큰 화두가 ‘연결(Connectivity)’이었다. 그 전에는 연결이 안 됐기 때문에 생기는 문제들이 많았지만, 지금은 연결이 잘 되고 있어 사람들은 연결 다음을 고민하게 됐다. 연결된 이후에 새로운 서비스, 새로운 부가가치를 디바이스와 네트워크, 서비스에 담아야 하는데 그게 쉽지 않은 것이다. 무조건 연결만 시켜주면 새로운 부가가치와 새로운 서비스가 많이 나올 것처럼 생각했는데 막상 연결해 놓고 보니 그렇지 않았다. IoT 서비스 도메인이라고 하는 스마트 팩토리, 스마트 그리드, 스마트 빌딩 분야에서 새로운 뭔가가 필요하게 되었다.


또 하나의 특징은 기존 구축한 네트워크와 IoT 디바이스로는 기하급수적으로 증가하는 데이터를 효율적으로 처리하기 어려웠다. 따라서 조금 더 인텔리전스한 기술이 IoT 도메인에도 있었으면 좋겠다는 요구가 나오게 됐다.


예전에는 디바이스나 센서로부터 수집된 데이터가 중간 에지를 거치지 않고 클라우드 서버로 넘어가다 보니 처리하는 데 시간이 걸리고 ‘정크(쓰레기) 데이터’를 보유하게 되는 함정도 있었다. ‘쓰레기’가 아닌 유용한 데이터가 되기 위해서는, 일단 모든 데이터를 전처리해야 한다. 그리고 전처리된 결과를 서비스와 연관되게 값을 부과하고 필요하다면 데이터 분석까지 들어가서 로우 데이터(Raw Data)를 인포메이션(Information)으로 바꾸고, 여기서 조금 더 진화가 되면 서비스를 더 정확하게 하기 위한 Knowledge, 더 나아가 Wisdom까지 전개해야 한다. 지금은 클라우드나 서버로 가기 전에 중간 단계에서 전처리나 데이터 분석을 통해서 로우 데이터를 인포메이션으로 바꾸는 작업이 연구되고 있다.

 

왜 머신러닝인가

 

본격적으로 네트워크 머신러닝을 살펴보자. 전통적인 네트워크는 다양한 네트워크 디바이스/노드와 서버 중간에 로컬 네트워크, 코어 네트워크, 에지 네트워크 등 여러 형태의 네트워크가 있지만, 수집된 데이터를 처리하지 않고 그대로 서버로 넘겨버리는 방식이었다. 최근 네트워크는 네트워크에 인텔리전트를 가미한 인텔리전트 디파인드 네트워크(Intelligent Defined-Network) 형태로 발전했다.


오늘날 우리가 사용하고 있는 인터넷이나 네트워크는 단순히 정보 전달에만 머물지 않고 엔터테인먼트, 금융, 홈쇼핑 등 다양한 서비스를 제공하는 만능의 네트워크가 되어가고 있다. 이를 위해서는 기존 전통적인 네트워크 방식에서 탈피하여 지능이 가미된 네트워크로 가야하는데, 최근 네트워크에도 지능화를 요구하는 시도가 진행되고 있다.


그러면 왜 머신러닝인가. 그 필요성을 몇 가지 예에서 찾을 수 있다. 올 1월에 중국에서 발표한 자료에 의하면, 네트워크에 대한 관리가 예전보다 훨씬 복잡해졌다. 최근에는 5G와 같은 새로운 서비스가 등장하고 있으며, 네트워크 퍼블리티가 점점 복잡하고 다양해져서 기존 방식으로는 새로운 요구사항을 충족시키기 어렵다.


지금까지 서비스들은 룰 베이스 프로그램에 기반한 응용이었다. 이것을 ML(머신러닝) 기반 응용으로 바꾸면 교통, 보안, 비즈니스 분야에서 새로운 서비스도 가능하다. 예를 들어, 단순히 흘러 다니는 데이터를 좀 더 인포메이션 인지할 수 있고 교통 상황을 예측하며 계측과 분류 또한 좀 더 효율적으로 할 수 있다. 뿐만 아니라 리소스 관리와 네트워크 어댑션을 효율적으로 할 수 있고 네트워크 퍼포먼스를 좀 더 높일 수 있다.


그런데 보통은 ML을 다 적용할 수 있지만, 통신이나 네트워크에 적용하기 위해서는 해결해야 할 과제가 있다. 적용했을 때 에러가 나거나 성능이 떨어지면 매달 비용을 내고 있는 사용자 입장에서는 용납할 수 없기 때문이다. 특히, 자율자동차 경우에는 치명적인 사고가 유발될 수 있기 때문에 통신이나 네트워크 분야에서 ML 적용은 매우 보수적이다.


그러면 네트워크 머신러닝으로 무엇을 할 수 있을까. 간단히 말하면 DDOS Attack을 미연에 방지할 수 있다. 많은 연구 사례도 있는데, 일반인들은 URL이 카톡이나 문자로 왔을 때 정상적인 URL인지, 피싱으로 유도하기 위한 URL인지 알기가 어렵다. 그런데 정상적인 URL과 피싱을 위한 URL을 학습시키면 제공된 URL을 보고서 악의적인 목적의 URL인지 아닌지를 알아차릴 수 있다.


교통 분류도 보통 우리가 5가지 툴로 트래픽을 분류하는데, 기존 알려진 것들은 새로운 서비스나 응용이 나왔을 때 트래픽 분류가 쉽지 않다. 그때 머신러닝을 적용하면 좀 더 효율적으로 분류할 수 있다. 여기서 네트워크 머신러닝은 Supervised learning, Unsupervised learning, Reinforcement learning으로 분류할 수 있으며, ETRI는 Reinforcement learning(강화학습)쪽에 좀 더 많은 연구의 초점을 맞추고 있다.


그리고 국내 논문에서 나온 내용을 보면, Supervised learning, Unsupervised learning, Reinforcement learning에 대해서 문제점과 실제 사용했던 기계학습 알고리즘에 관한 연구들이 있다. 예전의 전통적인 AI나 ML에서 사용했던 기법을 네트워크 분야에 적용하고 있고 또 어느 정도 성능은 나오고 있다.

 

IoT 네트워크 머신러닝 연구 동향

 

IoT 네트워크 분야에 머신러닝을 적용하려는 시도 또한 다양하게 이루어졌다. 우리가 IoT라고 했을 때, IoT에서 ‘I’는 TCP/IP 기반의 인터넷이라는 공감대는 다 가지고 있다. 그러다 보니 네트워크 머신러닝은 IoT, 특히 네트워크에 적용하려는 연구가 많은데, ETRI가 직접 참여하고 있는 IETF 표준화기구에서 오래전부터 연구가 되었다.


IETF는 인터넷 프로토콜, TCP/IP 프로토콜을 만드는 곳이다. 현재 우리가 쓰고 있는 HTTP 등을 만드는 곳인데, 여기에 네트워크 머신러닝을 도입해보자고 해서, 맨 처음에는 NMLRG(Network Machine Learning Research Group)이 이러한 동기부여를 가지고 시작했다. 최근 네트워크는 아주 복잡해지고 변수가 많기 때문에 사람이 다 최적화시키기에는 어렵고, 머신러닝이 많이 사용되고 있기 때문에 이것을 네트워크에 접목하면 좋겠다는 취지였다. 2015년 11월 IETF 94차 회의를 했고 97차까지 2년 정도하다가 문을 닫았다. 문을 닫은 이유는 네트워크에 머신러닝을 적용하기 위해서는 네트워크에 문제가 뭔지 그리고 네트워크에 머신러닝을 어떻게 적용했을 때에 효과가 있는지 등에 대해서 모든 사람이 공감할 수 있도록 만드는 일이 쉽지 않아서였다. 그러다가 97차 이후에 또 새로운 그룹이 만들어졌다.


이것 역시 국제 표준화 그룹이다. IDNET(Intelligent Defined-Network)는 98차 회의 때부터 시작됐다. 여기서 중요한 결론 몇 가지를 소개하면, 첫째는 강화학습의 머신러닝 알고리즘을 네트워크에 접목하려다 보니 일부 잘 들어맞지 않았다. 둘째는 MNEST라는 가장 기본적인 데이터를 가지고 점점 더 진화는 했지만, 네트워크에서는 표준화된 데이터 포맷이 없기 때문에 출발하는 선도 다르고 이해하는 바도 달랐다. 셋째는 스킬십이 달랐다.

 

팀 구성원을 보면 3분의 2인 7명은 네트워크 전공자이고 다른 3명은 AI 머신러닝 전공자이다. 두 그룹이 네트워크 머신러닝을 개발하고 있는데, 좀 어렵다. 이유는 원래 전통적으로 네트워크를 했던 사람들은 AI나 머신러닝을 잘 모른다. 그리고 AI 머신러닝을 했던 사람들은 네트워크를 잘 모른다. 그런데 네트워크 분야에 AI나 머신러닝을 접목하기 위해서는 그 분야를 다 잘 알고 있어야 하는데, 그런 사람이 없다. 그러다 보니 두 그룹의 접합점을 찾기가 쉽지 않고 전문성의 갭이 컸다. 넷째는 역시 데이터 문제인데 오픈된 데이터와 소스, 모델이 없다. 오픈된 데이터와 소스, 모델을 누군가가 개발을 하더라도 오픈하지 않는다.


다섯째는 인공지능의 알파고와는 달리 네트워크에서 집중해야 하는 분야가 너무 차이가 많다는 것이다. 왜냐 하면 네트워크에 머신러닝을 적용하기 위해서는 우리가 고려해야 할 요소가 무수히 많고 그러다 보니 범위가 매우 넓고 복잡하다는 문제점이 있다. 마지막으로, 네트워크는 워낙 빨리 진화하고 있기 때문에 그에 발맞춰서 알고리즘이나 모델을 만들었는데 또 다른 기술이 나오면 그 기술을 또 튜닝해서 해야 하기 때문에 어려운 점이 있다.


해결 방법으로 네트워크에 AI 머신러닝을 접목해보자는 차원에서 small scop에 네트워크를 한 번 해보는 논의가 전개됐다. 그리고 오픈 데이터와 오픈 소스, 오픈 알고리즘을 통해서 통일된 툴로써 문제를 풀어보자는 등등의 결과물이 나왔다.
유스케이스를 보면, Traffic Prediction , Qos Management, Application Detection, QoE Management 4가지 분야로 좁혀서 문제를 풀어보자 해서 진행되고 있다.

 

최근 2017년 11월에 열린 98차 회의에서는 좀 더 구체화해서 네트워크 매니지먼트에서 AI 머신러닝을 해보자는 논의가 있었다. 그래서 SDN에서 라우팅 문제, 네트워크 QoS 문제, 네트워크 트래픽 분석 문제, 리소스 관리 문제, 그리고 관련 프로젝트로 해서 네트워크 관리 측면에서 문제를 풀어보자 해서 진행되고 있다.


현재 유럽표준화기구인 E N I ( Experiential Net work Intelligence)에서도 진행되고 있고 중국쪽에서 많은 활동을 하고 있다. 최근 진행된 것으로는 ITU-T에서 새로운 그룹 FG-ML5G가 만들어졌다. 부회장에 KT 백승복 씨가 맞고 있고 WG1을 이끌고 있다.

 

ETRI와 KT가 함께 WG1에서 문서를 만들고 있고 표준화를 진행 중인데, 알고리즘이나 메커니즘을 개발하기 보다는 유스케이스와 서비스, 리콰이어먼트를 하고, WG2에서는 데이터 포맷과 ML 테크놀로지를, WG3에서는 ML-aware 네트워크 아키텍처를 하고 있다.






주요파트너/추천기업