第1612回-自由的風-82- YouTube 影片既快速又準確的加上字幕?

寒假第二天早上五點半起床,送女兒去公車站坐車,她要去學校音樂團練。先去買飯糰當早餐,女兒在車上一面吃一面等公車,我則一面喝豆漿一面滑手機看臉書,6:19 我看到早上四點就起床的張原禎分享了 1 條連結,是電腦玩物站長 Esor 寫的 pyTranscriber 影片自動上字幕免費軟體!10分鐘搞定1小時影片,我看了超級開心的!看起來很方便又省時!趕緊來試用一下吧!

這算是早起的鳥兒,被「更早起」的鳥兒餵蟲吃吧!哈哈!

自由軟體

根據pyTranscriber/LICENSE, pyTranscriber 使用 GNU GPL 3.0 授權條款,符合 自由軟體定義 - 維基百科,所以我本回網誌名稱中加上「自由的風」註記,關於自由軟體,我已經寫了82篇了,目標100篇。

我的期待

如何快速的為上傳到 YouTube 的影片上字幕,是我關注許久的課題。我希望,以10分鐘的影片為例,如果能在20分鐘內上好字幕,就符合我對「既快速又準確的上字幕」的要求了,不知道 pyTranscriber 能做得到嗎?

我先說結論,pyTranscriber 的確符合我對「快速」上字幕的要求,但要做到「準確」,還有許多障礙要克服:錄音品質、講者口齒清晰度、語音辨識AI的效能

我的試用記錄

7:10 我先嘗試在 ezgo13 下安裝 Linux 版的 pyTranscriber ,能執行程式並開啟GUI介面,但要 select file 和改變 output location 時,就整個視窗消失無法使用,原因不明。


7:20 改在兒子的 Windows 10 電競筆電上執行 pyTranscriber,可以選擇要輸出字幕的影片檔,但按下產生字幕按鈕後,也是整個視窗消失無法使用,奇怪?


看了上圖中的錯誤訊息,我猜想會不會是 output location 預設輸出路徑是桌面的問題?我嘗試改到 d:\ 底下試試看


哇!成功了,大概一分鐘左右的工作時間,就把14分鐘的影片的字幕輸出了!真是超快!根據 電腦玩物站長 Esor 寫的 pyTranscriber 影片自動上字幕免費軟體!10分鐘搞定1小時影片 文章內的說明,是因為 pyTranscriber 不需播放影片,就可以自動轉字幕檔。

影片字幕快速產生了,然後呢?

pyTranscriber 使用 Cloud Speech-to-Text - 語音辨識服務  |  Cloud 語音轉文字  |  Google Cloud,所以使用時還是要保持網路連線。極速產生影片srt字幕的快感雖然很爽,但接下來的可是令人厭世的考驗啊 => 校對字幕!

校對字幕紀錄

我選來測試 pyTranscriber 效能的影片,是我在第1358回-數位學習的日常-3-用 LoiloNote 實現小壁虎的想像刊載過的,我自己錄的教學影片。我的錄音品質、口齒清晰度都不是很好,所以對語音辨識的正確率應該有非常大的影響,在校對的時候才知道是有多辛苦!


7:28 開始字幕校對時,我是直接用記事本打開字幕 srt 檔來邊看影片邊修改,但覺得操作上不是很方便順手,做了30秒的影片字幕就累了。


8:00 我改用 youtube 後台的字幕編輯,比較方便工作。影片長度14分鐘,校對字幕要花多少時間呢?有沒有可能符合我我對「既快速又準確的上字幕」的要求,在28分鐘內完成呢?

答案是:目前我做不到!

我把需要修改的文字,一邊在 YouTube 後台做修改,一邊在網誌裡面做紀錄,我想這樣對我下次錄影時的口齒發音自我矯正會有幫助:
  • 只要專注聽我自己在影片中說話的聲音和辨識出來的文字有沒有一致即可
  • 事業 => 四頁
  • 是先 => 事先
  • 他 => 它
  • 換幣 => 換筆
  • 廚餘的 => 塗一個
  • 在=>再
  • 奇幻小顏色=>切換一下顏色
  • 參加完成的=>就是像這樣完成的
  • 那剛剛是為了要吃飯給各位看啊=>那剛剛是為了要示範給各位看啊
  • 其實我已經有事情=>其實我已經有事先
  • 塞頭=>直接丟到垃圾桶
  • 那個就是我已經做好的=>那現在各位看到的就是我已經做好的
  • 圖是在這裏=>圖示在這裏
  • 這裡面=>文字裡面
  • 然後是成就一樣就出上橘色=>然後是成就的地方我就塗上橘色
  • 好那我現在拿去換成螢光筆=>好那我現在來切換成螢光筆
  • 清楚一點的選藍色=>選粗一點的,選藍色
  • 第一代裡面提到馬偕的背景=>第一段裡面提到馬偕的背景
  • 這一期1871年=>他在1871年
  • 血液=>學業
  • 然後呢他志願大海外產假=>然後呢他自願到海外傳教
  • 1分就是=>他的成就部分就是
  • 間傳教士和教育家=>兼傳教士和教育家
  • 好那我喝完之後就按結束=>好那我話完之後我就按結束
  • 我家把這一份卡片=>我就要把這一份卡片
  • 然後面的3克=>那後面的三課
記錄到影片5分7秒處,我就懶得記錄我修改哪些地方了,真是累呀!改成記錄一下感想:
  • 在字幕編輯框內按enter,可以將比較常的字幕切成兩段,也可以按倒退鍵再合併兩段字幕,挺方便的
  • 我講話時若講的是台語,是沒有被語音辨識出來的 5:45
  • 6:13 女兒扮演學生的聲音出現
  • 做到 7:20 我就好累了,已經做了50分鐘,先存檔休息一下吧,按一下「發布編輯內容」
好吧!暫時收工,請大家看看我花了一個小時左右只做了七分鐘影片字幕的成果:

關於 YouTube 我曾經寫過

留言

這個網誌中的熱門文章

第1918回-師師有法寶-4-雄-筆順練習-南一-康軒-翰林-國小國語- QR Code 大合集

第1804回- Google 文件如何一次看兩頁?

第1670回-自主學習-如何印出中英對照的 TED 演講逐字稿