알파고와 바둑

알파고는 바둑을 어떻게 둘까

작년 3월 알파고 (Alphago)는 세계적으로 큰 주목을 받았다. 인공지능이 접근할 수 없는 영역인 바둑에 도전했기 때문이다. 알파고는 작년 3월에 이세돌 9단과 5번에 걸쳐서 대국을 진행했었다. 당시 전문가들은 알파고가 이기기 어려울 것으로 전망했었다.

그러나 이러한 전망을 뒤엎고 알파고는 5번의 대국 중 4번을 이겨서, 인공지능 산업에 큰 파문을 불러왔다. 인공지능 불가능 영역이었던 바둑을, 알파고가 초월함으로써 인공지능의 빠른 진화를 예고한 것이다. 이에 따라 미래창조과학부는 인공지능 산업의 급히 발전을 예상했고, 향후 5년간 1조 원을 투자하겠다는 계획을 밝혔다.

올해 알파고는 또 한 번, 전 세계로부터 주목을 받고 있다. 알파고가 1년여의 학습 끝에 세계 챔피언인 커제 9단을 꺾으며 바둑 정복에 성공했기 때문이다. 구글은 알파고가 이번 대국을 끝으로 바둑 은퇴를 선언하고 새로운 영역의 출발점에 설 것이라고 밝혔다.

기존 알파고는 16만 건의 기보로 배우는 지도학습 (Supervised Learning)과 함께 바둑 지능을 학습시켰다. 이와 달리 이번 알파고 2.0은 지도학습 없이 스스로 바둑을 배워 바둑 지능을 익혔다. 이는 알파고가 인간을 뛰어넘은 새로운 방식으로 바둑을 두도록 한다.

알파고 지능만 개선 된 게 아니다. 알파고를 뒷받침하는 슈퍼컴퓨터의 하드웨어도 대폭 개선했다. 딥 마인드는 “알파고에 필요한 계산력을 줄임과 동시에 연산처리속도 (CPU)는 15배에서 20배로 끌어올렸다”라고 밝혔다.

알파고가 인공지능의 금기 영역인 바둑을 넘어설 수 있는 이유는, 머신러닝 (Machine Learning)에서 첨단기술인 ‘딥 러닝 (Deep Learning)’을 기반으로 설계됐기 때문이다. 그렇다면 알파고는 딥 러닝 기반으로 어떻게 동작하는 것일까?

인공지능 산업 영향력에 대해서 이해하는 사람은 많지만, 인공지능에 대한 개념을 알고 있는 사람은 드물다. 인공지능과 알파고 동작 원리에 대해서 알아보자.

알파고가 이세돌을 이겨서, 바둑업계에 큰 충격을 줬었다. ⓒ Flickr

인공지능과 딥 러닝

인공지능은 ‘지능을 기계로 구현한 것’이다. 참고로 지능은 문제를 해결할 수 있는 능력으로 정의될 수 있다. 그래서 인공지능은 문제를 해결하기 위해서 스스로 작업을 진행할 수 있는 능력으로 정의할 수 있다. 지능을 갖기 위해서는 학습이 필요하다.

기계에서도 마찬가지다. 기계가 학습할 방법은 크게 두 가지이다. ‘지식공학’과 ‘경험학습’이다. 지식공학은 전문가에 의한 학습을 말한다. 이러한 학습방법에 대표적인 예로, 규칙기반을 들 수 있다. 전문가에 의해서 입력된 규칙대로 기계가 자동 수행하는 것이다. 이러한 시스템의 대표적인 예로, 의사들이 사용하는 ‘의료 진단 보조 시스템’이 있다. 의료 진단 보조 시스템은 의사가 환자의 증세를 입력하면, 기존에 전문가들이 기록한 결과를 보여주는 시스템이다.

지식공학은 전문가에 의해서 입력한 데로 작업을 수행하기 때문에, 결과가 정해져 있다. 반면에 경험학습은 경험해서 스스로 답을 찾아가는 방식이다.

대표적인 예로 머신러닝을 들 수 있다. 뒤에서 자세히 다루겠지만, 머신러닝은 기계에 적용된 경험학습으로 정의할 수 있다. 지식공학은 특정 수학 공식을 주어, 조건 값의 입력 시 답을 찾아가게 하는 방식이다. 반면에 경험학습은 조건과 답을 주고 공식을 찾아가게 하는 방식이다. 그래서 지식공학은 ‘연역적 추론’에 가깝지만, 경험학습은 ‘귀납적 추론’에 가깝다.

정리하면 인공지능을 구현하는 방법은, 지식공학과 머신러닝으로 나눌 수 있다. 그런데 지식공학은 사람이 입력한 데로 동작하게 하기만 하면 되기 때문에, 경험학습보다 비교적 구현이 쉽다.

반면에 머신러닝은 기계가 조건과 결과를 보고, 스스로 추론하게 하므로 구현이 어렵다. 그러나 추론과정은 머신러닝이 주목받게 하는 가장 큰 이유이다. 추론능력은 기계가 스스로 경험하게 해서, 여러 분야에 적용할 수 있다는 점이다.

딥 러닝의 구조도. ⓒ 위키미디어

머신러닝의 알고리즘은 매우 많다. 이미 20여 년 전부터 머신러닝 관련 알고리즘 연구가 진행되어 왔기 때문이다. 그중 현재 가장 주목받고 있는 알고리즘은 바로 ‘딥 러닝’이다. 참고로 알파고 역시 딥 러닝을 기반으로 하고 있다.

딥 러닝은 인간신경망인 ‘뉴런’에서 착안한 알고리즘이다. 우리의 뇌는 경험 정도에 따라 뉴런 수가 달라진다. 경험 정도가 클수록 뉴런생성 수가 늘어나는데, 이는 우리가 기억을 더 잘할 수 있게 한다. 그리고 우리의 사고에도 영향을 미친다. 예를 들어 A라는 사람이 폭력적인 것을 계속 경험한다면 폭력 관련 뉴런 수는 늘어나게 되는데, A의 폭력성이 증가하게 된다.

딥 러닝은 이러한 사람의 학습구조에 착안해서 만들어진 알고리즘이다. 다시 말해 딥 러닝은 특정 학습의 경험 정도에 따라서 수학적인 가중치가 달라진다. 이는 기계에 특정 조건을 줬을 때, 같은 기계라도 행동방식이 달라지게 하는 특징이 있다.

마이크로소프트에서 개발한 ‘테이 (Tay)’로 예를 들겠다. 테이는 인공지능 채팅로봇이다. 테이는 인종차별 발언을 해서, 사회적으로 큰 질타를 받았다. 이러한 발언의 배경은 사람들과 채팅에 막말하는 경험을 했고, 딥 러닝은 이를 학습했다. 만일 차별이 아닌 화합에 대한 내용을 익혔다면, 결과는 달라졌을 것이다.

딥 러닝 기반의 알파고

알파고는 이러한 딥 러닝 방식을 적용하고 있다. 일반적으로 바둑을 계산해야 할 경우의 수는 250의 150제곱이다. 몬테카를로 (Monte-Carlo) 시뮬레이션을 사용하는 알파고는, 딥 러닝 방식 없이 바둑을 둔다면 이 모든 경우의 수를 계산해야 한다. 이는 우주의 원자 개수보다 많은데, 현실적으로 불가능하다. 그래서 알파고를 딥 러닝 기반으로 학습시켜서, 경우의 수를 줄이는 것이다.

경우의 수를 줄이는 방법은 크게 두 가지이다. 하나는 경우의 넓이를 줄이는 것이다. 이때 사용하는 알고리즘은 ‘정책망 (Policy Network)’이다. 딥 러닝으로 학습한 알파고는 사용자 패턴을 인지해서 사용자가 둘 가능성이 가장 높은 수와 가장 낮은 수를 계산함으로써, 고려해야 할 경우의 수를 줄여나간다. 다시 말해 19X19 바둑 공간에서 둬야 할 넓이를 줄여나가는 것이다.

이러한 수를 줄였다면, 가치망이 작동된다. 이러한 수를 뒀을 때, 어떤 방식으로 바둑 대전이 전개될지 예상한다. 그런데 ‘가치망 (Value Network)’은 바둑승률 예상을 시뮬레이션으로 하는 것이 아니라, 기존 학습에서 유사한 상황을 비교해서 승률 정도를 계산하게 한다.

학습 데이터에서 유사한 데이터를 추출하는 알고리즘의 경우, 컨볼루션 알고리즘 (Convolution Algorithm)을 사용한다. 주로 얼굴인식 알고리즘에 사용된다. 이러한 방법으로 모든 경우의 수를 시뮬레이션하지 않고, 결과확률로 계산해 바둑을 둔다. 이는 바둑의 모든 경우의 수를 고려하지 않는 사람처럼 바둑을 두게 한다.

알파고는 이러한 방식으로 직관을 흉내 내면서 바둑을 두는 것이다. 참고로 알파고의 학습방법에는 전문가에 의해서 직접 바둑 움직임 규칙을 받는 ‘지도학습 (Supervised Learning)’과 스스로 바둑을 두면서 익히는 ‘강화학습 (Reinforcement Learning)’으로 나뉜다.

이세돌과의 대국 때, 알파고는 16만 기보를 익히는 지도학습과 스스로 100만 번을 두면서 익히는 강화학습을 병행했었다. 그러나 이번 알파고 2.0은 기존 알파고를 기반으로 강화학습만 병행했다.

사람들의 기존 기보를 익히면, 학습은 빠르다. 그러나 사람이 두는 바둑 방식에 얽매이게 된다. 딥 러닝 방식에 의해서 ‘사람이 두는 방식’의 뉴런이 형성되기 때문이다. 일종의 고정관념이 만들어지는 것이다.

앞으로 창의적인 생각도 인공지능에 의해서 나올지도 모른다. 창의적인 생각이란 문제 해결에서 나오는데, 인공지능이 다양한 문제들을 사람의 시각에서 벗어난 생각을 해낼 수 있을지 모르기 때문이다.



공지 있습니다.
개인사정으로 본 사이트는 더이상 업데이트 되지 않습니다.하지만 아래 사이트에서 꾸준히 업데이트 되고 있으니 참고 하세요.

최신 기사는 '정리해 주는 남자' 에서 고화질 사진은 'HD 갤러리' 에서 서비스 되고 있습니다.

md.sj

사건사고 오늘의이슈 주요뉴스 연예정보 상품리뷰 여행 푸드 알쓸신잡 자동차 과학이야기 HD,UHD사진 고화질바탕화면 음악소개 소프트웨어

    이미지 맵

    이전 글

    다음 글

    Economy & Life/알.쓸.신.잡 다른 글