來聊聊這台吧!


這台的小小缺憾在於該團隊對於 voice pattern recognition 的研究經驗太少,也缺乏解決問題的創意,但畢竟生出作品來了,而且我是很喜歡它。

在語音的辨識上,礙於不同人之間的口音和語調差異,無法縮短成「咖啡」或「嘎逼」,必須要導入第三個字「機」 ,以加強pattern recognition 的正確性。但其實這對外國人來說還是不好用。如果讓一個外國人用中文講「咖啡機」,那外國腔調大概會講成「開飛機」,但是如果要用 English mode,那啾~竟要講 "coffee machine" or "cafe machine" 呢?這兩個辭彙在語音辨識的pattern上可是截然不同的呀!

即便是考量了各種音調、各種說法去增加 sensitivity,那也同時會增加機器本身的誤判率。例如以下狀況:

寶傑:「友驊,你昨天到~底去哪裡?」(跺腳)
友驊:「是的寶傑!這件事情只有三個人知道,一個是你、一個是我、另一個我不能說,其實我昨天去開飛機。」
然後咖啡機就開始流湯了...

解決的策略是很容易的,其實只要和小便斗一樣 (咦?),裝置一個紅外線偵測器,人走進的時候自動詢問:「笑連誒,要不要齁咖灰?」
然後自動偵測國際通用的回答「YES」or「NO」(這兩個單字的voice pattern是相對容易辨識的),這種自動機的處理,即可輕易解決問題。但相對也會失去趣味性。

另一種方式是採用類似Siri的遠端控制功能,將咖啡機裝置網路或電信通訊模組,使用者可以在抵達咖啡機之前,用Siri-like softwares 向咖啡機提出 將要進行一個喝咖啡的動作 (咦?),這樣也是可行的。

arrow
arrow
    全站熱搜

    kururu 發表在 痞客邦 留言(0) 人氣()