하이퍼클로바X, 글로벌 오픈소스 AI보다 한 수 위…다국어 능력도 확인

입력2024-04-04 13:29:29

[스포츠서울 | 표권향 기자] 네이버 클라우드가 초대규모 인공지능(AI) ‘하이퍼클로바X’의 성능이 글로벌 오픈소스보다 우수한 성적을 거뒀다.

네이버 클라우드가 3일 공개한 테크니컬 리포트에 따르면 하이퍼클로바X의 성능 평가 종합 점수가 글로벌 오픈소스 모델보다 높다. 특정 국가 언어 능력뿐 아니라, 보편 지식, 프로그래밍 등 다양한 분야 문제 해결력까지 갖춘 소버린 AI로서 평가받았다.

폐쇄형으로 개발된 모델들과의 비교에서도 하이퍼클로바X가 우수한 점수를 획득했다. 한국어 능력 부문에서는 세계 최고 수준 모델을 포함한 4개 모델 중 1위에 올랐고, 영어 능력 분야에서도 2위를 기록했다.

하이퍼클로바X의 사전학습 데이터는 대부분 △한국어 △영어 △코드 데이터로 구성했다. 양질의 사전학습 데이터 구축을 위해 짧거나 반복적인 저품질 문서는 데이터셋에서 제외했고, 개인정보가 포함된 데이터도 삭제했다. 또한 정렬학습을 통해 사용자의 의도와 지시를 AI가 더 잘 이해할 수 있도록 모델을 고도화했다.

또한 학습 데이터의 대부분을 차지하는 한국어와 영어 정보를 활용해 제3의 언어로 추론하는 능력을 갖췄다. 일본어·아랍어·힌디어·베트남어 등 아시아 국가 언어 능력을 평가에서 하이퍼클로바X가 주요 오픈소스 모델을 포함해 9개 모델 중 가장 높은 점수를 획득했으며, 중국어에서만 2위를 기록했다.

기계 번역 평가에서도 하이퍼클로바X의 다국어 능력이 입증했다. 한국어를 일본어로, 일본어를 한국어로 번역하는 능력은 실제 서비스 중인 번역 모델 등 10개의 모델 중 1위를 차지했으며, 영어를 한국어로 번역하는 정확도도 10개 모델 중 가장 높은 점수를 얻었다.

유강민 네이버 클라우드 리더는 “하이퍼클로바X의 다국어 추론, 기계 번역 능력을 측정한 실험은 지역 또는 문화권 특화 목적으로 개발한 AI가 해당 국가 언어 외에도 여러 언어에서 일정 수준 이상의 능력을 갖출 수 있음을 실증한 것”이라며 “특정 문화권에 더 적합한 배경지식과 함께 다국어 능력까지 보유해 한층 활용도가 높은 소버린 AI의 가능성을 하이퍼클로바X가 보여주고 있다”고 했다.

이번 리포트에서는 하이퍼클로바X의 안전성을 위한 노력도 소개됐다. △사회적 이슈와 편향 △불법적 행동 등을 주제로 질의 데이터를 수집했다. 이를 기반으로 레드티밍을 수행해 모델의 취약점을 보완했다.

성낙호 네이버클라우드 하이퍼스케일 AI기술 총괄은 “테크니컬 리포트를 통해 하이퍼클로바X의 성능 경쟁력이 다시 한번 입증됐다”며 “한국 특화 지식뿐 아니라, 프로그래밍과 수학적 추론, 다국어 능력과 안전성까지 확보한 소버린 AI의 ‘모범 사례’로서, 하이퍼클로바X 구축 경험을 활용해 향후 다양한 지역 및 국가의 특화 초대규모 AI를 만드는 데에도 적극적으로 나설 것”이라고 설명했다.

gioia@sportsseoul.com

기사추천