語(yǔ)音是人類交流的重要方式,但說(shuō)話者的健康狀態(tài)(例如神經(jīng)疾病、癌癥、外傷等原因?qū)е碌穆曇粽系K)和周圍環(huán)境(噪音干擾、傳播介質(zhì))往往會(huì)影響聲音的傳輸和識(shí)別。研究人員一直在改進(jìn)通用語(yǔ)音識(shí)別和交互技術(shù),這些技術(shù)可以很好地處理細(xì)微的聲音或嘈雜的環(huán)境。多通道聲波傳感器可以提高聲音識(shí)別的精度,但因體積較大而無(wú)法佩戴。近期,清華大學(xué)的研究團(tuán)隊(duì)開發(fā)了一種基于石墨烯的智能可穿戴人工喉(AT),可以實(shí)現(xiàn)語(yǔ)音感知和發(fā)聲。研究成果發(fā)表在《Nature Machine Intelligence》期刊,論文的標(biāo)題“Mixed-modality speech recognition and interaction using a wearable artificial throat”。
該研究團(tuán)隊(duì)通過(guò)激光直寫技術(shù)在超薄聚酰亞胺薄膜上轉(zhuǎn)化出基于石墨烯的智能可穿戴人工喉(AT),實(shí)現(xiàn)了對(duì)聲音信號(hào)和機(jī)械運(yùn)動(dòng)的混合模態(tài)的感知,使AT能夠獲得低基頻信號(hào),同時(shí)具有抗噪聲的語(yǔ)音感知能力。實(shí)驗(yàn)結(jié)果表明,混合模態(tài)AT能夠檢測(cè)基本語(yǔ)音元素(音素、聲調(diào)和單詞),平均準(zhǔn)確率達(dá)到99.05%。此外,通過(guò)集成AI模型,AT識(shí)別出了喉切除術(shù)患者含糊說(shuō)出的日常詞匯,準(zhǔn)確率超過(guò)90%。同時(shí),AT還可以通過(guò)熱聲效應(yīng)實(shí)現(xiàn)聲音的播放功能,以恢復(fù)患者的發(fā)聲能力。
該研究提出的AT具有制作工藝簡(jiǎn)單、性能穩(wěn)定、抗噪性強(qiáng)、可集成發(fā)聲等特點(diǎn),使其成為下一代語(yǔ)音識(shí)別和交互系統(tǒng)的有力工具。
注:此研究成果摘自《Nature Machine Intelligence》雜志,文章內(nèi)容不代表本網(wǎng)站觀點(diǎn)和立場(chǎng),僅供參考。