功能介绍

  • 一句话语音
  • 录音文件识别
  • 实时语音识别

对时长较短(60s以内)的语音进行识别,实时地返回转译文本,适用于较短的语音交互场景,如语音搜索、指令、消息等

/static/images/intro/sound/oneword.png

技术优势

识别准确率高

识别准确率高

结合传统音频处理以及前沿深度学习的方式打造,准确识别音频内容

智能断句纠错

智能断句纠错

基于大规模语言模型,智能预测语境并进行断句与纠正文本,使输出文本更合理

快速解码预处理

快速解码预处理

支持各种数据形式的调用,保持精度的同时加速了识别处理

自定义热词

自定义热词

支持用户自定义关键词,提高各种场景中的识别准确率

适用场景广

适用场景广

支持多种垂直领域,例如社交、UGC、会议场合等

应用场景
社交聊天
用于社交聊天平台,语音内容的审核,过滤涉及色情、低俗、敏感等内容
/static/images/intro/sound/exp_1.png
UGC社区
用于UGC社区,对包含音频的用户内容进行审核,如直播音频、FM电台等
/static/images/intro/sound/exp_2.png
视频直播字幕
用于视频及直播平台,根据语音内容自动生成字幕、减少内容创作环节
/static/images/intro/sound/exp_3.png
电话/会议实时转写
用于电话记录、会议记录、实时讲语音内容转为文字自动记录
/static/images/intro/sound/exp_4.png
音频数据录入
使用于广泛的音频内容转化为文字数据应用,可接入到任何平台应用中
/static/images/intro/sound/exp_5.png

零门槛免费试用

基于云端的自助式服务,提供标准化API接口,可免费试用,对效果满意后按每月API调用量付费。

立即试用或直接联系 400-867-9688