您的位置:首頁 >新聞 > 熱點新聞 >

搜狗推出“唇語識別”技術(shù),準確率最高達 90%

12 月 14 日,搜狗 推出了一種人機交互新技術(shù)——“唇語識別”。據(jù)介紹,唇語識別是一項集機器視覺與自然語言處理于一體的技術(shù),可以直接從有人講話的視頻中,通過識別說話人唇部動作,來解讀說話者所說的內(nèi)容。

搜狗官方表示,通過復雜端到端深度神經(jīng)網(wǎng)絡技術(shù)進行中文唇語序列建模,經(jīng)過數(shù)千小時的真實唇語數(shù)據(jù)訓練,搜狗“唇語識別”系統(tǒng)在非特定人開放口語測試集上,該系統(tǒng)達到 60%以上的準確率,在垂直場景命令集如車載、智能家居等場景下甚至已經(jīng)達到 90%的準確率。

關(guān)于唇語識別技術(shù)的作用,搜狗方面表示古代僧侶和神父通過唇語讀懂信徒心里所想以顯示神奇。而在 2003 年的倫敦劫鈔案中警察就是在唇語識別專家的幫助下破的案。未來,唇語識別技術(shù)可以輔助語音交互及圖像識別,在日常生活、安防、公益等各個領(lǐng)域?qū)崿F(xiàn)廣泛應用。

比如在車載場景下,周圍噪音過大時會對語音指令產(chǎn)生干擾,在安防領(lǐng)域,由于目前多數(shù)監(jiān)控只有攝像頭沒有麥克風,而唇語識別則可以幫助公安人員獲取重要的講話信息,為公共安全提供有效支持。另外,唇語識別還有機會幫助先天性聽障人群或老年人,幫助他們更好地與人交流。

據(jù)了解,這并非業(yè)界首個唇語識別技術(shù),早在 2003 年,英特爾便開發(fā)了“視聽說識別系統(tǒng)”軟件,供開發(fā)者研制能讀懂“唇語”的計算機;2016 年,谷歌 DeepMind 音文唇語識別系統(tǒng)便已經(jīng)可以支持 17500 個詞,新聞測試集識別準確率達 50%以上。

最新動態(tài)
相關(guān)文章
跨村聯(lián)建產(chǎn)業(yè)園 推動文旅融合規(guī)范化促...
各路豪杰搶灘氣泡水市場 各品牌誰能笑...
原材料價格持續(xù)上漲 汽車零部件企業(yè)能...
我國共有4.6萬家保險經(jīng)紀相關(guān)企業(yè) 保險...
核桃編程頻繁電話 短信騷擾用戶被多次...
小電科技2020年凈利虧損1.1億元 分銷費...