바로가기 메뉴
본문 바로가기
주요메뉴 바로가기
ETRI소식 상상을 현실로, 진화하는 ICT세상, 고객과 함께 ICT미래를 열어가겠습니다.

연구개발보도자료

ETRI, 시각장애인용 음성키보드시스템 개발

ETRI, 시각장애인용 음성키보드시스템 개발

- 오는 4월 30일(수) 기술이전설명회 개최 -

정보통신환경에서 시각장애인도 문서작성시 정상인에 가깝게 정확한 문장을 작성할 수 있도록 도와주는 시각장애인용 음성키보드시스템이 국내연구진에 의해 개발되었다.

한국전자통신연구원(ETRI, http://www.etri.re.kr) 음성처리연구팀(팀장 박준)은 시각장애인을 위한 컴퓨터 인터페이스 및 음성받아쓰기 기술개발 과제의 일환으로 키보드입력을 음절단위의 음성으로 변환해 주는 "시각장애인용 음성키보드시스템"을 개발하였다.

동 기술은 오는 4월 30일(수) 오후 2시에 서울 강남에 소재한 정보통신연구진흥원 교육장에서 기술이전설명회를 개최할 예정이다.

이번에 개발한 음성키보드시스템은 음절단위 합성DB를 사용하였으며, 총 5가지 목소리(성인남자2인, 성인여자1인, 남자 어린이 1인, 여자 어린이 1인)를 지원하여 시각장애인 각자가 듣고 싶은 목소리를 선택하여 사용할 수 있다.

기술내용 및 특성

기존 시스템은 한국어의 소리변환의 원리에 의해 시각장애인이 입력한 글자를 정확하게 소리값으로 변환해주지 못하고 있어 시각장애인이 오타가 많은 문서를 작성하게 된다.

즉, 몫요일이라고 잘못 입력했어도 합성기에서 나는 소리는 몫요일과 목요일의 소리값의 차이가 없어 시각장애인은 오타를 검출하지 못하게 된다.

그러나 본 기술에서는 이러한 문제점을 해결하기 위해 시각장애인에 특화된 발음변환 기술로 대표종성 및 대표자음을 원래의 자음과 모음에 맞게 풀어 읽어주는 기능을 가지고 있다. 즉 몫요일을 단순히 목요일로 읽어줄 수 도 있지만 목기역(ㄱ)시옷(ㅅ)요일 과 같이 풀어 읽어줌으로써 시각장애인에게 자모단위로 정확하게 발음열을 소리로 전달하여 오타 검출을 가능하게 해준다.

본 기술은 문장단위의 자연성을 위주로 대규모 합성DB를 사용하는 기존 서버급 음성합성기술과 달리, 음색당 10M(8KHz, 8Bits기준) 합성DB를 사용하여 음절단위 음성합성에 적합하도록 개발되었다. 따라서 음성단위 발성의 명료도가 매우 우수하며, 합성DB의 메모리 요구량 및 연산량도 매우 적어 개인용 PC 등의 탑재가 용이하다.

응용 분야

본 기술은 카드번호, 계좌번호, 주민번호 및 전화번호, 사람이름 및 지명읽기 등과 같이 간단한 단어의 합성을 요구하는 편집음성합성 분야에서 사용될 수 있다. 또한 소용량 합성기를 필요로 하는 PDA나 교육용 또는 게임용 CD-ROM 타이틀 등에도 응용될 수 있다. 주개발자인 ETRI 김종진 선임연구원은 "이번에 개발된 음성키보드시스템을 통해 시각장애인들도 정상인과 비슷한 수준의 문서작성 능력을 갖추게 되었다"며, "궁극적으로 국민 정보화 격차 해소와 정보이용능력 향상을 통한 복지정보통신 구현에 기여할 것"으로 기대했다.

TOP