입술어 식별 AI, 청각장애인에 도움

2023-03-09 08:41:04

우리 나라에는 청력장애 인구가 2054만명이나 있다고 한다. 이들은 수화로 교류하는외에 입모양을 보면서 소통하기도 한다. 그런데 개인의 경험, 시각감수능력, 언어리해능력 등 요소의 영향으로 입모양을 보면서 말뜻을 알아차리는 데는 한계가 있다. 하여 사람들은 AI기술을 리용해 입모양을 보고 말뜻을 알아내는 시도를 해보았다.

즉 인공지능으로 입술어(입모양으로 하는 말)를 식별하도록 하는 것인데 그 핵심기술 기틀은 시각식별과 자연언어 처리이다. 구체적으로 말하면 기계 시각기술을 리용해 사람얼굴을 사진 속에서 련속 식별해내는 동시에 그중 련속적인 입모양 변화특징을 뽑아 입술어 식별 모형에 입력하고 그 사람의 입모양에 대응되는 발음을 식별해낸 후 가능성이 제일 큰 표달 구절을 내보내는 것이다. AI가 입술어 번역기 역할을 하는 셈이다.

북경리공대학교 계산기학원 부교수이며 인터넷및안전연구소 소장인 염회지는 “시각식별과 자연언어 처리는 각자 방대한 기술체계와 부동한 기술로선이 있지만 그 본질을 따져보면 모두 대량의 입술어 데이터로 AI 모형을 훈련시키고 문장 출력의 정확성을 추구하는 것”이라고 이에 대한 설명을 해주었다.

최근년간 AI업계의 거두들은 앞다투어 입술어 식별 경쟁에 나서서 여러가지 시도를 했다. 입술어를 읽는 AI가 흥기하게 된 데는 강렬한 수요가 있고 거대한 기술 추동이 있기 때문이라고 염회지는 설명하면서 입술어 식별이 청각 장애인들에게 편리를 제공할뿐더러 공공안전예방 등 여러 령역에서 거대한 역할을 일으키고 있다고 덧붙였다. 거기에 AI 계산법, 계산력 및 데이터 애로들이 부단히 돌파되면서 AI기술이 입술어 식별에서 큰 성공을 거두고 현실로 되는 것이다.

하지만 우리 나라 인공지능 입술어 식별기술은 현재 걸음마 단계에 처해있으며 AI를 리용해 정확하게 입술어를 식별해내자면 아직 갈길이 멀다고 염회지는 소개했다. 인류의 언어는 복잡성을 띠고 있다. 인류의 언어중 30% 정도는 직접 입술로 말을 통해 내보내지만 70%는 육안을 통해 파악하기 어렵다. 기계가 시각으로 구분해내기 어려운 부분이 상당히 있다. 어조, 방언, 구음 등도 말하는 사람마다 다를 수 있고 또 수염에 입이 가리울 경우 아예 입술이 보이지 않을 수도 있다. 하여 정확한 식별에 난도가 있는 것이다.

각종 난제들이 앞을 막긴 해도 갈수록 많은 AI기업들이 인공지능 입술어 식별 경쟁에 뛰여들고 있는 현실이다. 하여 더 완벽하고 정확한 입술어 식별 AI가 연구되고 출시되기를 기대하는 마음이다.

  신화넷

  •  
  • 많이 본 기사
  • 종합
  • 스포츠
  • 경제
  • 사회

주소:중국 길림성 연길시 신화가 2호 (中国 吉林省 延吉市 新华街 2号)

신고 및 련락 전화번호: 0433-2513100  |   Email: webmaster@iybrb.com

互联网新闻信息服务许可证编号:22120180019

吉ICP备09000490-2号 | Copyright © 2007-

吉公网安备 22240102000014号