一句話識別
對時長較短(一分鐘以內(nèi))的語音進行識別,適用于較短的語音交互場景,如語音搜索、語音指令、語音短消息等,可集成在各類App、智能家電、智能助手等產(chǎn)品中。
如有任何需求或疑問,請直接聯(lián)系:010-57281389。
如有任何需求或疑問,請直接聯(lián)系:010-57281389。
產(chǎn)品優(yōu)勢
識別準確率高
國內(nèi)獨創(chuàng)的字級LC-BLSTM/DFSMN-CTC建模,相對業(yè)界傳統(tǒng)CTC方法降低了20%的錯誤率,大幅提高了語音識別的精度。
超快的解碼速率
國內(nèi)獨創(chuàng)的LFR解碼技術(shù),在不損失識別精度的情況下,將解碼速率提高了3倍以上,大幅縮短了反饋時間,提升用戶體驗。
獨創(chuàng)的模型優(yōu)化工具
可以結(jié)合模型優(yōu)化工具子產(chǎn)品,針對特定的領(lǐng)域定制專屬模型,最大限度的提升識別效果。
廣泛的領(lǐng)域覆蓋
支持金融、保險、司法、電商、智能家居等多個領(lǐng)域。
適用場景
語音搜索
支持各種場景下的語音搜索,比如地圖導(dǎo)航、瀏覽器搜索等?梢约傻饺魏涡问降氖謾C應(yīng)用中,最大限度的解放雙手。
語音指令
通過語音命令控制智能設(shè)備,實現(xiàn)快捷便利的操作。比如控制空調(diào)的開關(guān)、電視的換臺等?梢约傻街悄芗揖拥仍O(shè)備中。
語音短消息
通過語音發(fā)送或者接收短消息。在不方便打字的情況下實現(xiàn)快速便捷的短信操作,比如音頻短信轉(zhuǎn)文字。
更多產(chǎn)品與服務(wù)
錄音文件識別
對用戶上傳的錄音文件進行識別,上傳完之后24小時內(nèi)完成識別并返回識別文本?捎糜诤艚兄行恼Z音質(zhì)檢、庭審數(shù)據(jù)庫錄入、會議記錄總結(jié)、醫(yī)院病歷錄入等場景。
了解更多
實時語音識別
對不限時長的音頻流做實時識別,達到“邊說邊出文字”的效果,內(nèi)置智能斷句,可提供每句話開始結(jié)束時間。可用于視頻實時直播字幕、實時會議記錄、實時法庭庭審記錄、智能語音助手等場景。
了解更多
語音合成
語音合成服務(wù),通過先進的深度學(xué)習(xí)技術(shù),將文本轉(zhuǎn)換成自然流暢的語音。目前有多種音色可供選擇,并提供調(diào)節(jié)語速、語調(diào)、音量等功能。適用于智能客服、語音交互、文學(xué)有聲閱讀和無障礙播報等場景。
了解更多
語言模型自學(xué)習(xí)工具
用戶可以自行上傳數(shù)據(jù),對阿里的語音技術(shù)進行深度定制,從而提升特定業(yè)務(wù)領(lǐng)域的識別準確度。目前僅支持上傳文本數(shù)據(jù)對語言模型進行定制,未來會推出上傳音頻數(shù)據(jù)對聲學(xué)模型進行定制。
了解更多