[스포츠서울 | 장강훈 기자] SK텔레콤이 오픈소스 커뮤니티 허깅페이스(Hugging Face)에 독자 구축 LLM인 ‘A.X(에이닷 엑스) 3.1’을 공개했다. 한국어 대화 성능에 집중했던 A.X 3.0과는 달리 A.X 3.1에서는 추론모델로의 확장 가능성을 고려해 코드와 수학성능을 대폭 향상시켰다.

이로써 SKT는 프롬 스크래치 방식의 A.X 3.1 모델 2종(표준, 경량)과 대규모 학습에 기반한 A.X 4.0 모델 2종(표준, 경량) 등 총 4개의 모델을 오픈소스로 공개했다. 해당 모델들은 학술 연구나 상업 이용 등에 자유롭게 활용 가능하다.

‘A.X 3.1’은 340억개(34B)의 매개변수를 기반으로 SKT가 프롬 스크래치(From Scratch·모델의 맨 처음 단계부터 모두 직접 구축) 방식으로 모델 구축과 데이터 학습 등 전 단계를 직접 진행했다.

자사 A.X 4.0(72B)와 비교할 때 절반 이하의 매개변수로 구성했지만, 같은 한국어 서비스에 적용될 경우 약 90% 수준의 성능을 발휘한다. 사용자들은 A.X 3.1과 4.0 중에서 사용 환경에 더 적합한 성능과 효율을 고려해 선택할 수 있다. 또 대표적인 한국어 능력 평가 벤치마크인 KMMLU)에서 ‘A.X 3.1’(69.20)는 ‘A.X 4.0’(78.3) 대비 88%, 한국어 및 한국 문화 벤치마크인 CLIcK에서는 ‘A.X 3.1’(77.1)가 ‘A.X 4.0’(85.7) 대비 90% 수준의 성능을 기록했다.

SKT는 그 동안 확보한 우수한 LLM 기술 역량을 바탕으로 과학기술정보통신부가 주관하는 ‘독자 AI 파운데이션 모델 사업’에 지원했다.

SKT 컨소시엄은 반도체, 모델, 데이터, 서비스로 이어지는 독자 기술 기반의 풀스택 AI를 구현하고, 개발하는 모델을 국내 AI 생태계의 다양한 기업들에 오픈소스로 개방하는 것을 목표로 하고 있다. 더불어 기존 규모를 뛰어넘는 초거대 AI 모델 개발에 도전한다. 텍스트뿐만 아니라 이미지, 음성, 비디오 등 다양한 형태의 데이터를 통합적으로 처리할 수 있는 ‘옴니모달(Omni-Modal)’ 기술을 적용할 예정이다.

현재 AI 업계의 표준으로 자리잡은 트랜스포머 구조를 넘어서는 혁신적인 신규 구조 연구도 추진, 이를 통해 글로벌 AI 경쟁에서 독자적인 기술 경쟁력을 확보할 계획이다.

SKT 김태윤 파운데이션 모델 담당은 “각 분야 선도기업들과 컨소시엄 구성으로 향후 소버린 AI 분야에서 새로운 성과를 만들어낼 것”이라며 “국내 AI 생태계를 종합적으로 고려해 혁신적인 인공지능 모델을 선보일 계획”이라고 자신했다. zzang@sportsseoul.com

기사추천