百度的人工智能新產(chǎn)品,是一個(gè)計(jì)算機(jī)速記員
執(zhí)牛耳網(wǎng)編輯Aira 發(fā)表于 2017-03-16 22:05
閱讀數(shù): 13313
百度用人工智能技術(shù)做了新產(chǎn)品。
百度硅谷實(shí)驗(yàn)室(SVAIL)周一上線了網(wǎng)頁應(yīng)用 SwiftScribe,基本的功能是把音頻資料轉(zhuǎn)錄成文字。在一篇博客文章中,項(xiàng)目主管 Tian Wu 說他們解決了一個(gè)重要的“痛點(diǎn)”:消耗大量時(shí)間的逐字聽寫轉(zhuǎn)錄。
SwiftScribe 目前還處在內(nèi)測階段,并未開放,不過你可以通過一個(gè)演示示例了解它是怎么工作的。SwiftScribe 支持上傳時(shí)長 1 個(gè)小時(shí)以內(nèi)的 wav 或 mp3 文件,目前只接受英文。接下來它需要花點(diǎn)時(shí)間生成文字,官方說法是,1 分鐘的錄音需要不到 30 秒、1 小時(shí)的錄音需要 20 分鐘左右。
接下來你會(huì)在網(wǎng)頁上看到轉(zhuǎn)錄好的文字,但這并不意味著轉(zhuǎn)錄結(jié)束。文本不會(huì)區(qū)分大小寫、沒有標(biāo)點(diǎn)符號(hào),更沒有分段,你需要在文本框中手動(dòng)編輯,然后再做導(dǎo)出。這個(gè)過程也會(huì)被百度記錄,就像所有的人工智能學(xué)習(xí)過程一樣,它用來幫助算法糾正錯(cuò)誤,提高準(zhǔn)確率。
文本框底部有一排工具欄,播放按鈕開啟,一個(gè)高亮的標(biāo)識(shí)會(huì)跟隨語音標(biāo)出閱讀的進(jìn)度,方便你停下來查看這個(gè)單詞對應(yīng)的語音。這個(gè)工具欄還有變速、標(biāo)記的功能。
這個(gè)過程就相當(dāng)于用機(jī)器算法取代了速記員、聽寫員的工作?!癝wiftScribe 會(huì)在廣泛的領(lǐng)域內(nèi)帶來積極影響,提高生產(chǎn)力,包括醫(yī)療機(jī)構(gòu)、法律、商業(yè)和媒體。”Tian Wu 在博客中說,專業(yè)領(lǐng)域的人工聽寫效率低,1 小時(shí)的錄音往往需要花費(fèi) 4-6 個(gè)小時(shí),每分鐘語音的成本在 1 美元,SwiftScribe 能把完成工作的時(shí)間平均縮短 40%。
Tian Wu 在接受采訪時(shí)表示,他們以后還會(huì)增加對視頻文件的語音識(shí)別支持,也會(huì)添加自動(dòng)插入標(biāo)點(diǎn)符號(hào)等功能。
語音識(shí)別并不是什么新鮮事物,你手機(jī)里的各種語音助理比如 Siri、 Cortana 都基于此,用戶關(guān)心的唯一問題可能是到底識(shí)別的準(zhǔn)確性有多高。
按照 Tian Wu 的介紹,SwiftScribe 基于他們的最新研究成果 Deep Speech 2。2014 年百度的首席科學(xué)家吳恩達(dá)剛剛?cè)肼毎俣炔痪?,就帶著一個(gè) 10 人的團(tuán)隊(duì)開發(fā) Deep Speech,一套語音識(shí)別系統(tǒng)。
當(dāng)時(shí)的研究重點(diǎn)在怎么提高嘈雜環(huán)境下的英語語音識(shí)別準(zhǔn)確率。百度收集了 9600 個(gè)人 7000 小時(shí)的語音樣本,添加了 15 種噪聲,把樣本擴(kuò)充到 10 萬小時(shí)。吳恩達(dá)說這套系統(tǒng)的錯(cuò)誤率比同期的微軟 Bing Speech、Google Speech API 等競爭對手低 10%。
2015 年,硅谷人工智能實(shí)驗(yàn)室又發(fā)表論文公布了 Deep Speech 2 ,這個(gè)系統(tǒng)開始學(xué)習(xí)漢語,也提高了對不同英語口音識(shí)別的能力。
到 2016 年,百度利用 Deep Speech 技術(shù)推出基于 Android 的語音輸入應(yīng)用 TalkType,強(qiáng)調(diào)輸入法對“語音優(yōu)先”。同一年,Deep Speech 2 還入選了《MIT 評(píng)論》評(píng)出的“ 2016 年十大突破技術(shù)”,入選的理由是“語音識(shí)別技術(shù)讓智能手機(jī)變得更易操作”。
可以確定的是,百度之后還會(huì)花費(fèi)更多的精力、更多的錢來支持人工智能的研究,這是李彥宏反復(fù)提及的最新故事。
上個(gè)月的財(cái)報(bào)電話會(huì)議上,李彥宏說會(huì)壓縮百度糯米和百度外賣的補(bǔ)貼和營銷費(fèi)用、公司的未來在人工智能領(lǐng)域:“人工智能是改變互聯(lián)網(wǎng)和傳統(tǒng)工業(yè)的一個(gè)巨大機(jī)會(huì)。”
與之對應(yīng)的是,百度 2016 年的營收漲了 6.3%、凈利潤少了三分之二。這是百度自成立以來,年度凈利潤首次下跌。而百度總收入中,依然有九成以上來自廣告業(yè)務(wù)。
0條評(píng)論