语音识别(Automatic Speech Recognition 简称ASR)将连续语音内容自动转换成文本,让机器轻松听懂人类的语音。
技术特点:
语音合成(TextToSpeech 简称TTS)将文本信息转化成语音信息,让机器像人类一样能说会道,支持多语种、多领域语音合成。
技术特点:
自然语言理解(Natural Language Understanding,简称NLU)根据说话人说的文本内容判断说话人的意图,正确理解语音中所包含的要求,做出正确的应答,实现人机对话。
技术特点:
优浪拥有完全自主知识产权的声纹识别(Voiceprint Recognition,简称VPR)技术,该技术能根据语音中声纹特征,来自动判断说话人身份。
技术特点:
语种识别(Language Identification,简称LID)在语音中自动判定待识别语音的语种类型。
技术特点:
关键词检出(Key Word Spotting,简称KWS)在连续语音流里面自动检测出用户关心的关键词、敏感词。
技术特点:
固定音频检索根据音频模板片段,从海量语音中快速搜索并找到与音频模板一致或者相似的音频片段所在的位置。
技术特点:
情绪识别通过分析用户说话时的语音波动来判断用户的情绪状态。
技术特点:
在数字化的多媒体数据中嵌入隐蔽的音频信息标记,隐蔽性强,安全性高。
技术特点:
支持以中文为核心到其他多种语言的互译,其中包括英语、日语、韩语、维吾尔语。
技术特点: