loading

음성인식

ReadSpeaker VoiceEz™는 사람의 음성을 듣고 명령을 수행하게 하는 리드스피커코리아(舊 보이스웨어)의 음성인식기 브랜드로 소리의 음향학적인 구조를 정확히 파악, 그 특징을 추출하며 음성 DB와 비교하여 인식한 단어를 출력하고 이를 각종 검색 또는 입력의 수단으로 사용합니다.
단어 인식부터 비정형 자연어 음성인식 강점을 모두 갖춘 최고의 음성인식 솔루션입니다. 고객센터는 물론 스마트폰, 내비게이션, 로봇, 가전 등의 음성인식 적용은 음성만으로 제어가 가능해 생활을 더 편리하게 만들어 줍니다.

음성 DATA -> 전처리 모듈 - > 인식모듈 -> 인식결과

리드스피커코리아(舊 보이스웨어)의 높은 인식률을 자랑하는 인공지능 기반의 음성인식 기술은
편집 과정을 거치지 않고도 실시간 자막 생성을 가능하게 합니다.

제품개요

음성인식을 통해 얻은 음성 데이터를 분석하여 문자로 변환해 주는 음성인식 자막은 영화나 동영상의 자막을 임의로 편집하지 않아도 자동으로 생성해 줘 시청 단계에서 실시간 자막을 볼 수 있습니다. 또한, 스마트폰이나 태블릿에서 음성을 자막으로 자동 변환해 주는 청각장애인용 제품에도 응용 가능하여 미디어 접근성을 높여 주고 정보격차를 해소해 줍니다.

제품특징

다양한 곳에 적용되는 실시간 자막 생성은 시간 절약은 물론 미디어 접근에 제한이 있는 청각장애인에게도 무한 정보 제공을 가능케 합니다.

text인식 엔진 1등
Full Text 인식 엔진으로써 국내 최고 수준의 높은 인식률을 자랑합니다.
국산 소프트웨어
순수한 국산 소프트웨어 솔루션으로 안정된 시스템의 유지보수가 용이합니다.
프로세싱
다양한 분석 프로세싱을 고려한 인식 서버 설계로 국내 최고 수준의 인식속도로 음성파일 처리 가능합니다.
음성 인식률 향상
자체 음성인식 모델링 방법론 보유는 물론, 다수의 프로젝트 성공 경험을 통한 음성 인식률 향상 모델링 및 튜닝을 적용합니다.
알고리즘
RNN(Recurrent Neural Network) 기반 알고리즘을 적용합니다.
키보드
안정적인 인식률을 위한 필수 기술 적용으로 화자의 말을 정확하게 인식하여 자막 생성을 합니다.
영상
영화, 애니메이션, 방송 등의 실시간 자막 생성이 가능합니다.
그래프
다년간의 연구와 경험으로 우수한 컨설팅과 높은 시스템 안정성을 제공합니다.

적용분야

영화를 보고있는 남자
영화, 애니메이션

편집 과정을 생략하고 상영 중 실시간 자막 생성이 가능합니다.

동영상
각종 동영상

다양한 영상 시청 시 실시간 자막 시청이 가능합니다.

생방송
생방송

끊김, 시간차 등의 오류 없이 실시간 방송 자막 생성이 가능합니다.

보청기
청각 장애인용

대부분의 영상에 실시간 자막 생성이 가능해 사용자의 제한이 없습니다.

번역기
번역기

음성을 인식하고 텍스트 변환으로 번역기에 적용 가능합니다.

AI 고객센터
AI 고객센터

고객의 요청 내용을 음성 인식하여 텍스트로 생성해 상담원에게 보여줍니다.

Platform Support

구분 음성인식자막
OS Linux
CPU Intel Xeon 8Core / 16Thread
RAM 64GB
GPU Nvidia RTX 2080 TI 이상
기타 최대 12 CH 연결 기준 STT 서버 권장 사양