주요 업무
연구했던 분야를 고려하여 액션파워에서의 연구 주제를 정합니다.
[음성, 음향 관련 연구개발]
- AI 받아쓰기 서비스 다글로가 여러분의 이야기를 더 정확히 받아 쓸 수 있도록 Speech-to-Text 기술을 개발합니다.
- 여러 화자가 등장하는 음성에서 누가 이야기를 하는지 구분해주는 Speaker Diarization 기술을 개발합니다.
- 목소리를 생체암호로 사용해 본인을 확인하는 Speaker Identification/Verification 기술을 개발합니다.
- 잡음이 섞여 있거나 녹음 상태가 좋지 못한 음성을 복원해주는 Speech Enhancement 기술을 개발합니다.
- 음성의 특정 구간이 어떤 음성인지 정확히 추출하고 분류해주는 Sound Event Detection/Classification 기술을 개발합니다.
- 액션파워는 최고의 음성인식 모델을 만들어 가고 있습니다. 하지만 아직 풀어야 할 문제들이 많습니다. 이 문제들을 여러분들과 같이 고민하고 해결해 나가길 원합니다.
[자연어처리 관련 연구개발]
- 우리 생활이 더 편리해지기 위해서는 받아쓰기만으로 만족할 수 없습니다. 받아쓴 글을 요약하고, 정리하는 Text Summarization 기술을 개발합니다.
- 정리된 내용을 잘 검색할 수 있도록 지식을 체계화 하는 Text Classification 기술을 개발합니다.
- 체계화된 지식을 바탕으로 찰떡같이 원하는 정보를 검색하고 답변하는 Question Answering 기술을 개발합니다.
[컴퓨터비전 관련 연구개발]
- 음성 뿐만 아니라, 영상에도 많은 정보가 있습니다. 저희는 영상에 있는 음성정보를 받아쓰기 하는 것부터 시작해서, 이미지처리 기술도 함께 개발하고 있습니다.
- 요즘에는 영상이 넘치도록 많습니다. 그 중에서 내가 원하는 정보가 있는 부분은 어디일까요? 꼭 필요한 곳만 콕 집어보거나, 중요 장면만 모으는 Video Timestamping, Video Summary 기술을 개발합니다.