摘要:①蘋果公司的一項新專利申請正試圖讓Siri增加一項新功能,通過動作檢測來讀取唇語; ②通過檢測嘴部和頭部的運動,Siri將提高它解讀唇語的準確性; ③此舉還將使Siri音頻傳感器的能耗減少。
財聯社8月4日訊(編輯 周子意)據專業媒體報道,未來的蘋果設備可能會使用動作檢測來讀取唇語,這樣就可以在不需要麥克風的情況下觸發Siri的指令。
蘋果想給Siri增添一個功能,例如檢測用戶嘴部和頭部的運動,并可能會提高它的準確性。蘋果公司的一項名為“使用運動感應進行關鍵字檢測”的新專利申請,正試圖做到這一點。
該專利申請稱,“(數據)將從運動傳感器接收”,例如,當用戶發出語音輸入時,記錄用戶的唇部和頭部運動,并確定運動數據的一部分是否與一個或多個單詞的參考數據相匹配。
蘋果公司的這一想法也是出于對Siri現有缺陷的考量:如果音頻傳感器收到環境噪音或其他用戶的語音,語音控制系統可能會導致誤報。
動作檢測
但這并不意味著蘋果計劃推出一些沒有麥克風的設備,相反,蘋果公司提出,這種運動檢測可能意味著Siri能夠分時段地關閉麥克風地音頻傳感器設備。該傳感器目前始終處于開啟狀態,用于不斷收聽“Siri”或“Hi, Siri”等語音。
蘋果公司指出,“即使用戶沒有主動使用語音控制,持續地音頻檢測和處理音頻數據也會消耗電力和處理能力。”
“當用戶說話時,用戶的嘴、臉、頭和脖子會移動和振動…加速度計和陀螺儀等運動傳感器可以檢測到這些運動,而這些與麥克風等音頻傳感器相比,它們消耗的能量相對較少。”
不過,這種唇部動作檢測的方式事實上存在一定的缺陷。它對于一些常規命令能夠起作用,例如“播放音樂”或“查看天氣”等;但當口頭命令不太常見時,那么動作檢測可能會因為缺乏參考數據而失效。
為了規避這一點,蘋果公司設想,只要動作檢測足夠快,當發現用戶說“Siri”這個詞的時候,設備就能夠及時打開麥克風,捕捉到其他聲音。