[스포츠서울 | 표권향기자] 챗지피티(ChatGPT)의 등장으로 올해 초부터 생성형 인공지능(AI)에 대한 관심이 뜨겁다. 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)에서 추진 중인 ‘AI 학습용 데이터 구축 사업’도 이러한 변화에 따라 초거대 AI를 위한 고품질·대규모 데이터 구축을 중심으로 사업이 추진되고 있다.
정보통신기술(ICT) 서비스 및 플랫폼 개발 전문 기업인 비디는 올해 ‘초거대 AI’ 영역 자유공모를 통해 ‘초거대 AI 사전학습용 헬스케어 질의응답 데이터’ 구축 과제를 제안하고, 기술과 수행 역량의 우수성을 인정받아 데이터 구축 사업자로 선정돼 관련사업을 진행하고 있다고 21일 밝혔다.
비디는 지난 2020년 부터 AI 학습용 데이터 구축 사업에 참여하고 있으며, △데이터 수집·정제·가공 처리 도구 △데이터 수집 공정관리 플랫폼에 대해 축적된 기술을 기반으로 사업을 이어가고 있다.
특히 이번 과제에서는 데이터 구축에 필요한 데이터 수집·정제·가공 처리 도구에 초거대 AI 구축을 위한 단계별 데이터 처리 효율화 기술과 대량 데이터 분산 처리 기술 등을 적용했다.
또한 데이터 수집 공정관리 플랫폼은 오디오·프리텍스트·센싱데이터 등과 같이 다양한 유형의 데이터들을 수집·정제·흐름 제어하는 과정에서 실시간 모니터링은 물론, 작업자별 공정 수치를 시각화함으로써 데이터 품질 보증이 가능하다.
김용목 비디 전무는 “생성형 AI에 대한 기대가 큰 상황에서 해당 과제를 수행할 수 있어 기쁘게 생각한다”며 “자체 기술로 확보된 구문 정확성 검증 도구와 대화 데이터 정제 가공 솔루션을 적극 활용해, 데이터 품질을 확보함으로써 AI 모델 성능 향상에 기여할 것”이라고 말했다.
gioia@sportsseoul.com
기사추천
0