DDOLKONG
[매경의 창] 챗GPT와 바드, 누가 더 똑똑한가 본문
김남국 뉴스 꿰고 있는 바드
재무제표 볼 줄도 알지만
유전알고리즘·코딩 물었을 때
그나마 대화가 됐던 건 챗4
아직은 월 20弗 아깝지 않아
AI가 세상을 씹어먹는 듯한 요즘이다. 기술의 패러다임 전환이라 할 만하다. 언어 모델을 대상으로 포문을 연 '트랜스포머 어텐션' 기술이 진격 중이다. 심지어 천년의 도전이라던 단백질 3차원 구조 문제까지 거의 끝장내 버릴 정도가 되었다. 이 새로운 패러다임의 핵심은 '관계의 노골적 추구'다.
관계는 이미 여러 학문의 주요 하부 구조를 이루어왔다. 물리적 위치나 추상적 개념도 관계 있는 주변 대상이나 개념들에 의해 상대적으로 정의된다. 컴퓨터과학과 인공지능 분야에서도 관계 추구는 이미 핵심 주제이기는 했다. 그렇지만 트랜스포머 어텐션처럼 노골적으로 관계를 추구한 접근법은 없었다.
구글 브레인은 2017년 '어텐션은 당신이 필요로 하는 전부다'라는 도발적인 제목의 논문을 발표했다. 간단히 말하면 이 접근법은 입력으로 들어온 개체들 간의 '추상화'시킨 '관계'를 반영하고 그 행위를 반복한다. 개체의 표현(인코딩)은 다른 개체들과의 관계에 의해 결정된다. 서로 물리고 물리면서 상대적 변형을 거듭하며 정착한다. 아무렇게나 개체를 표현해놓고 시작해도 관계를 반영하면서 상대적으로 형성된다. 관계를 반영하는 와중에 수많은 행렬 곱셈이 개입된다. 행렬 곱셈은 공간 변환에 해당한다. 이 변환 행렬들의 내용물을 채우는 작업이 주 학습 과정이다. 감당할 수 있는 공간 크기의 상한이 무참히 깨지고 1조 차원 수준도 가능해졌다.
챗GPT가 기선을 제압했고, 구글 바드(Bard)가 서비스를 시작했다. 우리나라에서는 네이버와 카카오가 서비스를 준비 중이다. 한국어 훈련 데이터가 많다고 한글 대화에 더 유리한 것은 아니다. 심층 지식은 언어의 범위를 넘어선 곳에 있다. 가장 큰 감상 포인트는 이미 시작된 챗4와 바드의 대결이다. 필자는 바드가 한글 서비스를 시작한 지난주부터 챗4와 바드에 동시에 질문을 던지면서 살펴보기 시작했다. 분야에 따라 둘의 실력 차가 의외로 선명하다..
*최근 정보의 반영: 우선 챗4는 2021년 9월까지의 데이터만 사용해서 훈련했다는 제약을 계속 언급한다. 바드는 그저께 나온 김남국 관련 뉴스까지 알고 있다. 바드 1승.
*전문적 과학기술 대화: 샘플로 필자의 전문 분야인 유전알고리즘, 둘 다 기반으로 하고 있는 기술인 트랜스포머를 주제로 잡았다. 유전알고리즘의 몇 가지 개념에 대한 대화를 해보면 챗4는 대화가 되는 수준이고, 바드는 대화가 안 되는 수준이다. 트랜스포머의 어텐션 맵과 정보 흐름 구조에 관한 대화는 챗4가 근소하게 앞선 느낌이다. 챗4 1승.
*기업과 투자에 관한 질의: 기업이 경제 환경에 영향을 받는 형태 등에 대한 대화는 어느 쪽 손을 들기 힘들다. 재무제표의 내용을 물으면 확연한 차이가 난다. 챗4는 우리나라 전자공시시스템(DART)의 공개 재무제표를 안 보고, 바드는 본다. 2차원 테이블로 되어 있는 재무제표를 파싱해서 1차원 입력으로 학습시킨다. 바드 1승.
*코딩 능력: 챗3.5 때부터 깊은 인상을 남긴 주제다. 코딩은 조금만 수준을 높이면 틀리는 경우가 많은데 지적을 하고 수정을 부탁하면 둘 다 나름 노력을 한다. 하지만 챗4는 말귀를 알아듣는 느낌이고, 바드는 말귀를 못 알아듣는 느낌. 챗4의 여유 있는 1승.
네 꼭지의 평가에서 2대2로 균형을 보이지만, 과학기술이나 코딩의 논리를 깊이 알아듣는 부분에서는 챗4가 우세하다. 바드 우세 부분을 챗4가 따라잡는 것보다, 챗4 우세 부분을 바드가 따라잡는 것이 더 어려워 보인다. 챗4에 월 20달러 내길 중단하고 바드를 쓸 정도는 아니다. 하지만 구글이 보통 기업인가? 볼 만한 추격전이 있을 것이다.
https://n.news.naver.com/mnews/hotissue/article/009/0005132194?cid=1082884&type=series&cds=news_edit#w