국민대학교

국민인! 국민인!!
국민대 소프트웨어학부 강승식 교수 연구팀, “한국어 형태소 분석과 단어 임베딩” 기술 개발

 

국민대학교(총장 임홍재) 소프트웨어학부 강승식 교수 연구팀이 딥러닝 언어처리에서 필수적으로 요구되는 한국어 형태소 분석기(KLT2000)를 파이썬 플랫폼에서 편리하게 활용할 수 있는 임베딩 기술을 개발했다.

 

KLT2000 형태소 분석기는 국내외 최고 수준의 언어처리 기술로써 국민대 강승식 교수 연구팀은 이를 기반으로 한국어 워드 임베딩 모델을 개발하였다. 이 모델은 딥러닝 언어처리 기술 수준을 한 단계 향상시키는데 활용되며 국내외 연구자들이 자유롭게 사용할 수 있다.

 

한국어 워드 임베딩 모델은 IT융합 시대의 국가경쟁력 확보를 위해 SW기반 원천기술 확보를 목적으로 수행되었던 과학기술정보통신부의 차세대정보컴퓨팅 사업(과제명: “한국어 정보처리 원천기술 연구개발”)의 결과물로 구축된 국내 최대 규모의 한국어 원시말뭉치(7억3천만 어절, 4천9백만 문장)를 기반으로 개발되었다.

 

한국어 워드 임베딩 기술은 한국어 단어들을 벡터로 구성하여 “서울 – 대한민국 + 일본”이라는 벡터 연산을 통해 ‘동경’을 추론하는 기능과 단어 유사도 계산을 통해 가장 유사한 단어들을 추출하는 연산이 가능하다. 단어 벡터를 이용한 추론 기능과 단어간 유사도 계산 및 연관관계 분석 기술은 대용량 텍스트 분석, 딥러닝 언어처리, 텍스트마이닝 등 한국어 언어처리와 관련된 다양한 연구 분야에서 활용되어 언어처리 기술과 자연어처리 분야의 학문 발전에 매우 큰 기여를 할 것으로 기대된다.
 

관련기사8건

순번 언론사 제 목
1 머니투데이 국민대 강승식 교수, '한국어 형태소 분석과 단어 임베딩' 개발
2 교수신문 국민대 강승식 연구팀, “한국어 형태소 분석과 단어 임베딩” 기술 개발
3 에듀동아 강승식 국민대 교수팀 “한국어 형태소 분석과 단어 임베딩 기술 개발”
4 베리타스알파 국민대 소프트웨어학부 강승식 교수 연구팀, '한국어 형태소 분석과 단어 임베딩' 기술 개발
5 디지털타임스 국민대 소프트웨어학부 강승식 교수 연구팀, “한국어 형태소 분석과 단어 임베딩” 기술 개발
6 아시아타임즈 [15일 대학가 소식] 한국외대·중앙대·광운대·연세대·국민대·서울시립대·동국대
7 인공지능신문 '한글을 더 빛나게, AI를 더 가치 있게'... 2021 인공지능 학습용 데이터 활용 경진대회 개회식
8 열린뉴스통신 국민대 소프트웨어학부 강승식 교수 연구팀, “한국어 형태소 분석과 단어 임베딩” 기술 개발