{스포츠서울 | 필리핀 특파원 방영수} 현대 사회에서는 정치, 경제, 문화 등 다양한 분야에서 통역과 번역에 대한 수요가 그 어느 때보다 증가하고 있으며 이러한 수요에 발맞추어 인공지능(AI) 기반 자동번역 기술 또한 나날이 발전하고 있다.

이에 자동번역 기술의 성능은 데이터의 규모와 번역 품질에 좌우되므로 우수한 번역 품질을 기반으로 한 대량의 데이터 구축이 필수적이다.

한국과 경제, 문화적 교류는 활발하지만 언어 자원이 부족한 필리핀 타갈로그어와 같은 특수 외국어는 번역 말뭉치 데이터의 규모가 작아 자동번역 시 고품질의 번역 결과물을 기대하기 어렵다.

이러한 문제를 극복하기 위해 문화체육관광부 국립국어원은 2021년 8월부터 한국어-외국어 병렬 말뭉치 구축 사업을 추진해 왔다.

2021년 1차 사업에서는 한국어를 8개 언어(베트남어, 인도네시아어, 태국어, 인도 힌디어, 캄보디아어, 필리핀 타갈로그어, 러시아어, 우즈베크어)로 번역한 800만 어절의 병렬 말뭉치를 성공적으로 구축했다.

성과에 힘입어 2차 사업에서는 1차 사업보다 구축 데이터의 규모를 확대하여 10,000,000어절의 병렬 말뭉치를 구축했고, 2023년 5월부터 11,040,000어절을 구축하고 있다.

말뭉치 구축의 사업은 한-필 언어 간 직접적인 상호 데이터 교환을 바탕으로 수행되며 이는 각국의 현지 상황에 적합한 표현으로 실제 사용자들의 문화에 더욱 가까워질 것으로 예상된다.

결과적으로 양국의 문화적 거리가 좁아질 것이며 양국 간 통상, 사업, 공무, 방위 산업, 교육 등의 분야에 교류가 활발해질 것으로 기대된다.

또한, 한국어를 공부하는 필리핀 학생들과 필리핀어를 공부하는 한국 학생들의 언어적 장벽이 낮아질 것이며, 이는 직업 경쟁력을 높이는 데 일조할 것으로 기대된다.

본 사업을 위해 “한국어-외국어 병렬 말뭉치 구축 사업단”의 연구 책임자인 이정희 교수(경희대학교)와 필리핀 타갈로그어 전임 연구원 전지연 박사(강원대학교)가 필리핀국립대학교 언어학과(학과장 Maria Kristina S. Gallego)의 주최로 열리는 심포지엄에 참석하기 위해 이달 3일부터 6일까지 필리핀을 방문했다.

4일에 열리는 심포지엄에서 발표는 이정희 연구 책임자, 알드린 리 교수(UP언어학과, 본 사업단 필리핀 타갈로그어 최종 감수자), 통역은 배경민 교수(UP 언어학과 교수, 본 사업단 검수 팀장)가 맡았다.

같은 날 UP 한국학연구소와 UP SWF의 Jayson D. Petras 박사 및 관련 교수들을 만나고 UP Diliman EDGARDO CARLO L. VISTAN II 총장을 만나 병렬 말뭉치 구축을 소개하고 필리핀 타갈로그어 말뭉치를 구축하기 위해 협력할 수 있는 방안들을 함께 이야기 나누었다.

5일에는 KWF를 방문해 ARTHUR P. CASANOVA위원장과 말뭉치의 구축 및 활용 방안에 대해 면담을 했다.

또, 같은 날 오후 라살대학교의 응용언어학과를 방문해 말뭉치 구축에 대해 해당 대학의 교수와 학생들에게 본 사업의 소개 및 질의응답을 진행했다. 이곳에서는 필리핀 언어학회 임원들이 함께 참석해 말뭉치의 활용 방안에 대해 같이 고민하는 시간을 가졌다.

대표단의 이번 필리핀 방문에 대해 이정희 교수는 “한국어-필리핀 타갈로그어 병렬 말뭉치 구축 사업이 더 효율적인 방식으로 양국의 이익을 증대시킬 수 있기를 기대한다”고 전했다.

bangsu2000@naver.com

기사추천