第1475回-語音辨識趣談--有柄水壺裡面有一隻蟲子

今天下午在臉書上看到噗友 Viloet Lin 的貼文,她測試一個學習吧的語音辨識作業,結果正確率只有 50%,她打趣的說:我的英文有這麼不標準嗎?


我看了覺得蠻感興趣的,Google 的語音辨識出了什麼問題嗎?於是我打開 Google 翻譯,把俞君貼文附圖中的五個英文句子唸一唸,結果,呃... 我也是錯了一半左右。

這讓我更好奇了,到底是我的英文發音不好,還是 Google 語音辨識功能不佳?於是我做了以下幾個實驗:

1. 英文講慢一點?

當我英文講慢一點的時候,辨識率會提高到 70%。但我從 Youglish 找一些影片來播放給 Google 翻譯辨識,即使講話速度很快,但正確率仍然有 90% 以上,所以應該還是我自己的英語發音問題。

2. 特定單字的發音問題?

在俞君貼文附圖中的五個英文句子中,我發現 bug 和 jug 這兩個單字,我唸了好幾十次,不是念整句,而是只念單字,都無法被Google 翻譯 正確辨識。我猜想應該是 [ʌ] 這個音標我無法正確發音?但是我念 but 時,卻每次都被正確辨識?

當我只念 bug 時, Google 翻譯 會辨識成 book,我嘗試調整自己的發音,卻被辨識成 F**K,害我笑到不行!實在沒轍了,我改找老婆來念,結果老婆念的 bug 能被正確辨識。

3. 整個句子念?

單一一個字可能因為沒有上下文,不容易被辨認,中文語詞也是如此。我嘗試著念一句話: There is a bug in your program. 果然!一次就被正確辨識,我猜想 Google 的語音辨識可能有 AI 和大數據在背後撐腰,所以即使我 bug 無法講得很標準,但因為是一整句話,所以 Google 就能分析出最可能的字。

4. 錄音環境的問題?

我用手機的對話翻譯 APP 錄下 The buzz is from a jug. 然後播放給我筆電上的 Google 翻譯 聽,結果也是翻譯得 2266 的。但是,我改用筆電開兩個瀏覽器分頁,一個分頁的谷歌娘念 There is a bug in the jug 給另一個 分頁的 google 翻譯聽,結果一次就辨識正確。


又測一次,我用手機的對話翻譯 APP 錄下 There is a bug in the jug. 然後播放給我筆電上的 Google 翻譯聽,卻是完全正確!

因此可以推論,跟句子的內容有館,也跟錄音環境有關。

圖片搜尋

題外話,今天講了很多次 jug,但我並不確定 jug 和 jar 有什麼差別,與其查字典,還不如做圖片搜尋,一目了然喔!
 

用語音辨識來改善自己的發音

由於  Google 翻譯  不能保存每一次的文字紀錄,因此我改用 Speechnotes 語音輸入筆記 來練習,把一個句子好好的練習很多遍,才知道那麼一點點細微的差異就是關鍵,推薦您也練習看看喔!



Tzulung Fang 在 Violet lin 的貼文底下留言,相當風趣:
  • 以下是當初谷歌給我們的解釋:
    『想像一下外國人講台語我們是不是聽得很痛苦,這就是谷歌小姐在翻譯時的心情寫照』

留言

這個網誌中的熱門文章

第1918回-師師有法寶-4-雄-筆順練習-南一-康軒-翰林-國小國語- QR Code 大合集

第1670回-自主學習-如何印出中英對照的 TED 演講逐字稿

第1804回- Google 文件如何一次看兩頁?