【環(huán)球網(wǎng)科技 記者 林迪】4月23日消息,Google人工智能研究團隊的高級產品經(jīng)理Sagar Savla向包括環(huán)球科技在內的媒體介紹了一款基于Android系統(tǒng)的應用程序—— Live Transcribe,即通過將自動字幕技術融入日常會話,從而減少現(xiàn)實世界中的對話障礙。
據(jù)Sagar Salva介紹稱,Live Transcribe是其團隊的最新工作成果,它是一款運用自動語音識別技術將現(xiàn)實世界中的實時對話轉錄為手機屏幕上可閱讀的文本的安卓應用程序。Live Transcribe能實現(xiàn)實時的連續(xù)轉錄,支持70多種語言,還可以進行快速切換的雙語模式。
據(jù)世界衛(wèi)生組織統(tǒng)計,目前全球有4.66億人患耳聾或聽力障礙,到2050年,這個數(shù)字預計將增加到9億人。
值得一提的是,以往耳聾和聽障人士多依賴于人工轉錄服務,這些服務的費用十分昂貴,并且需要提前很久預約,因此難以在日常對話中頻繁使用。Live Transcribe能夠讓人們只需使用手機的麥克風便可隨時隨地進行語音轉錄。
Sagar對記者表示:“該應用的自動語音識別系統(tǒng)分為三個部分。第一個部分是聲學模型,主要辨別單詞中的不同音節(jié);第二個部分是發(fā)音模型,將辨別出來的不同音節(jié)組成實際的單詞;第三部分是語言模型,會根據(jù)識別出來的單詞增加適當?shù)臉它c符號停頓。”
據(jù)了解,為了使Live Transcribe盡可能直觀,在模式上有幾種可考慮的模式:計算機、平板電腦、智能手機乃至小型投影儀,最后決定專注于智能手機模式。
對此,Sagar解釋道,“我們也曾考慮可穿戴設備,但這種設備造價相對較高,普及率也遠不及手機。因此,我們最終還是選擇了手機為主要平臺,旨在幫助更多聽覺有障礙的人群。”
免責聲明:本網(wǎng)轉載自其它媒體的文章,目的在于弘揚科技創(chuàng)新精神,傳遞更多科技創(chuàng)新信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責,在此我們謹向原作者和原媒體致以崇高敬意。如果您認為本站文章侵犯了您的版權,請與我們聯(lián)系,我們將第一時間刪除。