熱門:

2023年4月12日

StartupBeat 創科鬥室

聲納眼鏡識別嘴型收無聲指令

身處安靜的圖書館,不方便與人高聲交談或使用手機語音指令。美國康奈爾大學團隊近日研發一款聲納眼鏡EchoSpeech,透過聲波傳感及人工智能(AI)技術,能夠識別用戶的嘴型,藉此對應31條靜音指令,包括解鎖手機、播放音樂,以至操控CAD設計軟件等,聲稱準確率高達95%。

從示範影片可見,EchoSpeech外觀與一般平光眼鏡相似,但在左右鏡框底部,分別安裝了喇叭及收音咪。喇叭會發出人耳聽不到的聲波,聲波經用戶的嘴部動作反射,並由收音咪接收;經藍牙實時傳送至智能手機後,再由團隊開發的深度學習演算法分析。

聲稱95%準確 續航10小時

聲納眼鏡用法簡單,用戶只須數分鐘,便能掌握。演算法會把特定聲波,與指令的嘴型互相關聯,例如暫停/播放音樂、上/下一首歌曲、降低/提高音量,以至解鎖手機、數字組合等。聲納眼鏡現時能辨識31個相關指令,聲稱準確度約95%。此外,聲納眼鏡亦可與觸控筆連接,配合CAD等設計軟件一併使用,幾乎毋須用到鍵盤或滑鼠。

研發團隊稱,聲納眼鏡不設鏡頭,且所有數據均在手機處理,不會上傳至雲端,減低私隱外洩風險;加上採用聲波傳感技術,電池續航力達10小時。此外,語言障礙人士可透過聲納眼鏡,無聲地把指令輸入語音合成器,再由合成器大聲說話。團隊正研究商業化相關技術,並探索更多眼鏡相關應用,例如追蹤臉部、眼睛及上半身的動作等。

訂戶登入

回上

信報簡介 | 服務條款 | 私隱條款 | 免責聲明 | 廣告查詢 | 加入信報 | 聯絡信報

股票及指數資料由財經智珠網有限公司提供。期貨指數資料由天滙財經有限公司提供。外滙及黃金報價由路透社提供。

本網站的內容概不構成任何投資意見,本網站內容亦並非就任何個別投資者的特定投資目標、財務狀況及個別需要而編製。投資者不應只按本網站內容進行投資。在作出任何投資決定前,投資者應考慮產品的特點、其本身的投資目標、可承受的風險程度及其他因素,並適當地尋求獨立的財務及專業意見。本網站及其資訊供應商竭力提供準確而可靠的資料,但並不保證資料絕對無誤,資料如有錯漏而令閣下蒙受損失,本公司概不負責。

You are currently at: www.hkej.com
Skip This Ads