인공지능 기술의 발전(1) – 인공신경망과 딥러닝의 출현 By. 정성원 센터장
안녕하세요. 빅데이터 러닝센터의 정성원 센터장입니다. 센터장 기고글을 통해 다양한 데이터 분석에 대한 내용을 다룰 예정입니다. 그 첫번째로 인공지능 기술의 발전에 대한 내용을 살펴보겠습니다.
여러분은 인공지능이란 단어를 들으면 무엇이 생각나십니까? 똑똑하고 유능한 아이언맨의 인공지능비서 자비스가 생각납니까? 아니면 인류를 몰살시키려 했던 터미네이터의 슈퍼인공지능 스카이넷이 생각나십니까? 인공지능이란 만물의 영장인 인간의 지적능력의 일부 또는 전체를 인공적으로 구현해 놓은 것을 뜻합니다. 인공지능은 유용한 도구로써 설계된 제한된 범위의 AI인 Narrow AI 아이언맨의 자비스, her의 사만다와 같이 인간과 같은 사고가 가능한 Strong AI 터미네이터의 스카이넷, 어벤져스의 Vision과 같이 인간보다 최소 1,000배 이상 뛰어난 Super AI로 구분해 볼 수 있습니다. Narrow AI는 방대한 데이터를 학습하여 지능적인 행동이나 결정을 할수 있도록 구현된 컴퓨터 프로그램으로 특정한 작업에 대해서는 인간수준의 성능을 발휘하나 다른 작업에는 적용할 수 없습니다. 이세돌 9단을 이긴 알파고는 바둑은 잘하지만 다른 것은 할 수 없는것과 같습니다. 애플 Siri, 아마존 Alexa와 같은 음성인식시스템, 이미지분류시스템, 자율주행시스템, 추천시스템, 수요예측시스템, 고객행동예측시스템, 사기적발시스템은 모두 Narrow AI 범주에 들어간다고 볼 수 있습니다.
AGI(Artificial General Intelligence)는 아직 만들어지지 않았고 전문가들은 대체적으로 2047년경에 출현할 것으로 전망하고있습니다. 인공지능은 1950년대에 태동하였으며 3번의 중흥기와 2번의 암흑기를 거쳤습니다. 2번의 암흑기는 1970년대와 1990년대에 였습니다. 3번의 중흥기는 인공지능의 개념이 정립되었던 1950~1960년대에 한번, 인공신경망이 등장한 1980년대에 또 한번, 그리고 2010년대 딥러닝의 등장으로 시작된 3차 중흥기입니다. 2020년대 생성형AI의 등장으로 더욱 3차 중흥기가 발전하고 있습니다. 인공지능을 만드는 기술에도 많은 변화가 있었습니다. 1950년대에서 1980년대까지는 논리/규칙기반으로 인공지능을 만들었고 이를 전문가시스템이라 불렀습니다.1980~1990년대는 인공신경망을 통한 인공지능을 구현하였는데 1980년대에 인공신경망(Artificial Neural Network)이 출현하면서 인공지능의 2차 중흥기를 맞이하게 됩니다. 인공신경망을 충분히 학습시킬 컴퓨터파워가 부족하였고 훈련시킬 데이터가 부족하여서 1990년대 후반에 들어 두번째 암흑기를 불러왔다고 합니다. 1990~2010년대에는 정형데이터기반의 머신러닝에 의해 인공지능을 구현하였는데, 정답을 미리 알려주면서 학습시키는 방법으로 인공지능을 구현하였으므로 특징(Feature)의 설계의 능숙도에 따라 인공지능의 성능이 좌우하게 되었습니다. 2010년대 이후에는 빅데이터 기반 딥러닝에 의해 인공지능을 구현하고 있습니다 딥러닝은 사람이 일일히 특징(Feature)을 설계하지 않더라도 컴퓨터가 스스로 학습하여 특징(Feature)을 설계하므로 사람의 노력은 상대적으로 적게 들어가고 더 큰 컴퓨터 파워를 필요로 하게 되었습니다. 1986년에 출현한 인공신경망 알고리즘의 하나인 다층 퍼셉트론(MLP)은 인간 뇌 속 신경망을 흉내낸 컴퓨터 프로그램으로 인간의 뇌속의 신경망이 전기신호에 동작하는 것과 마찬가지로, 인공신경망은 데이터의 처리를 통해서 최적값을 찾아가는 프로그램이었습니다. 즉, 학습할 데이터와 이를 통해 생성된 인공신경망을 검증할 데이터가 필요한 것입니다. 따라서 데이터가 많고 학습 시키는 프로그램을 수행할 컴퓨터의 성능이 좋으면 좋을수록 성능이 우수한 인공지능을 만들 수 있다고 할 수 있습니다. 인공신경망은 학습을 통해 모델의 성능을 향상시킨다는 측면에서 머신, 즉 컴퓨터를 데이터를 통해 학습시킨다는 의미에서 머신러닝(Machine Learning)이라고 부르게 되었습니다. 이 머신러닝은 학습의 단계와 학습된 모델을 사용하는 예측의 단계로 나누어 볼 수 있는데, 학습의 단계는 충분한 데이터가 필요하고 학습하는데 소요되는 시간도 많이 필요하게 됩니다. 이렇게 생성된 모델에 새로운 문제를 제시하면 머신러닝 모델은 정답을 예측하게 되는 것인데, 컴퓨터파워가 증가된 현시점에서 예측은 순식간에 이루어 진다고 보면 됩니다. 알파고에게 데이터인 인간의 기보를 주고 학습시키는데는 많은 시간이 걸렸지만 이세돌 9단과 바둑을 둘 때는 제한된 시간내에 순간적으로 예측하여 바둑을 둘 수 있었던 것 과 같은 내용입니다.
미국에서 열리는 이미지 인식대회가 있었는데 이는 천개이상의 물체에 대한 백만개 이상의 이미지를 학습하여 모델을 만들고 얼마나 정확히 물체를 식별할 수 있는지를 겨루는 대회였습니다. 이 대회는 수년동안에 걸쳐서 진행되었지만 정확도 80%를 넘는 모델이 없어서 마의 80%라는 벽이 있었습니다. 2012년 캐나다 토론토대학교의 제프리 힌트 교수는 SuperVision이라는 팀을 이끌고 이 이미지 대회에 참가하여 마의 80% 벽을 허물고 당당히 84%의 정확도를 이루었고 이 팀이 사용한 인공신경망 알고리즘은 DBN(Deep Belif Nets) 이였습니다. 이는 인공신경망 알고리즘의 할아버지 격인 MLP를 딥하게 발전시킨 알고리즘이라 하여서 딥러닝(Deep Learning) 이라고 불리웠는데, 세부적으로는 심층신경망(Deep Neural Network, DNN), 합성곱 신경망(Convolutional Neural Network, CNN), 순환 신경망(Recurrent Neural Network, RNN), 제한 볼츠만 머신(Restricted Boltzmann Machine, RBN), 심층 .Q-네트워크(Deep Q-Networks) 등의 알고리즘이 있습니다.
딥러닝을 더욱 발전시킨 기업은 바로 Google이였는데, 구글은 딥러닝 기술을 적용하여 레이어 기반의 사진의 정보를 구체화하여 다양한 종류의 사진을 구분하여 낼 수 있었습니다. 구글포토에 1억명 이상의 이용자들이 올린 500억장이 넘는 사진들을 기반으로 각 피사체가 갖는 특징(Feature)을 알고리즘이 직접 판단하고 분류하고 사진에 담긴 정보를 이해하는 수준에 도달하게 되었습니다. 그래서 구글포토는 단순히 "개"가 아니라 "프렌치불독"이나 "옐로래브라도"를 입력해도 해당 사진을 찾아줄 정도가 되었습니다. 딥러닝은 다양한 영역에서 인간의 한계를 뛰어넘는 인공지능으로 발전하는 원동력이 되었습니다. 미국 스타트업기업 Enlitic은 각종 의학 영상자료를 토대로 환자의 암세포를 식별하고 5년 후의 생존율을 예측하는 Smart 의료기기를 개발하였는데, 이는 방사선 전문의 보다 더 정확하게 악성종양(암) 세포를 분류할 수 있다고 합니다. 유방암 판별의 경우 세포를 6642가지 유형으로 분류하여 이중에 암세포를 분류해 낸다고 합니다. 미국 스타트업기업인 Lapetus는 딥러닝을 적용하여 인간의 기대수명을 예측하고 이를 보험료 산정에 반영하였다고 합니다. 미국의 대표적인 빅테크 기업인 Microsoft 사는 2015년 딥러닝 알고리즘을 기반으로 화남,경멸, 역겨움, 두려움, 행복, 무감정, 슬픔, 놀람 등 8가지 감정을 분석하는 API방식의 AI 서비스 제공하였습니다만 2022년 6년 사생활침해 우려로 서비스 중단하였습니다. 이제 딥러닝을 통해 개발된 인공지능은 인간의 감정까지 인식하게 되었습니다. to be continue...
센터장 기고글은 8월 Monthly Leaf에서 '인공지능 기술의 발전(2) – 벡터공간모델과 생성형 AI'로 이어집니다. 다음호에서 만나요! |