第1475回-語音辨識趣談--有柄水壺裡面有一隻蟲子
今天下午在臉書上看到噗友 Viloet Lin 的貼文,她測試一個學習吧的語音辨識作業,結果正確率只有 50%,她打趣的說:我的英文有這麼不標準嗎?
我看了覺得蠻感興趣的,Google 的語音辨識出了什麼問題嗎?於是我打開 Google 翻譯,把俞君貼文附圖中的五個英文句子唸一唸,結果,呃... 我也是錯了一半左右。
這讓我更好奇了,到底是我的英文發音不好,還是 Google 語音辨識功能不佳?於是我做了以下幾個實驗:
Tzulung Fang 在 Violet lin 的貼文底下留言,相當風趣:
我看了覺得蠻感興趣的,Google 的語音辨識出了什麼問題嗎?於是我打開 Google 翻譯,把俞君貼文附圖中的五個英文句子唸一唸,結果,呃... 我也是錯了一半左右。
這讓我更好奇了,到底是我的英文發音不好,還是 Google 語音辨識功能不佳?於是我做了以下幾個實驗:
1. 英文講慢一點?
當我英文講慢一點的時候,辨識率會提高到 70%。但我從 Youglish 找一些影片來播放給 Google 翻譯辨識,即使講話速度很快,但正確率仍然有 90% 以上,所以應該還是我自己的英語發音問題。2. 特定單字的發音問題?
在俞君貼文附圖中的五個英文句子中,我發現 bug 和 jug 這兩個單字,我唸了好幾十次,不是念整句,而是只念單字,都無法被Google 翻譯 正確辨識。我猜想應該是 [ʌ] 這個音標我無法正確發音?但是我念 but 時,卻每次都被正確辨識?
當我只念 bug 時, Google 翻譯 會辨識成 book,我嘗試調整自己的發音,卻被辨識成 F**K,害我笑到不行!實在沒轍了,我改找老婆來念,結果老婆念的 bug 能被正確辨識。
3. 整個句子念?
單一一個字可能因為沒有上下文,不容易被辨認,中文語詞也是如此。我嘗試著念一句話: There is a bug in your program. 果然!一次就被正確辨識,我猜想 Google 的語音辨識可能有 AI 和大數據在背後撐腰,所以即使我 bug 無法講得很標準,但因為是一整句話,所以 Google 就能分析出最可能的字。
4. 錄音環境的問題?
我用手機的對話翻譯 APP 錄下 The buzz is from a jug. 然後播放給我筆電上的 Google 翻譯 聽,結果也是翻譯得 2266 的。但是,我改用筆電開兩個瀏覽器分頁,一個分頁的谷歌娘念 There is a bug in the jug 給另一個 分頁的 google 翻譯聽,結果一次就辨識正確。
因此可以推論,跟句子的內容有館,也跟錄音環境有關。
圖片搜尋
題外話,今天講了很多次 jug,但我並不確定 jug 和 jar 有什麼差別,與其查字典,還不如做圖片搜尋,一目了然喔!用語音辨識來改善自己的發音
Tzulung Fang 在 Violet lin 的貼文底下留言,相當風趣:
- 以下是當初谷歌給我們的解釋:
『想像一下外國人講台語我們是不是聽得很痛苦,這就是谷歌小姐在翻譯時的心情寫照』
留言