自動上字幕軟體 MacWhisper 教學|Whisper AI 錄音檔轉文字

這篇筆記會介紹 MacWhisper 這個 Mac 專用的 Whisper AI 語音轉錄軟體,跟你分享如何利用它幫影片自動上字幕、將語音轉成逐字稿。
之前,我介紹過一款 Windows 系統的 AI 自動上字幕軟體工具:WhisperDesktop。
👉 點我觀看免費筆記:YouTube AI 上字幕教學
很多人在留言中提到,希望我也介紹 Mac 的版本。
所以這次我要推薦一款 Mac 專用的語音辨識工具 MacWhisper。
我會跟你講解如何安裝和使用它,也會進一步跟你分享付費版 MacWhisper PRO 多了哪些更強大的功能,值不值得升級呢?
如果你偏好用影片學習,歡迎觀看下面的 YouTube 影片。
如果你喜歡透過圖文學習,請繼續往下閱讀吧!
圖文版會比較詳細、方便快速瀏覽,還會持續更新與補充內容。
MacWhisper 介紹
Whisper AI 是什麼?
Whisper 是由 OpenAI 開發的人工智慧技術,專門用來「聽懂」語音,再「轉寫」成文字。簡單來說,就是把語音轉錄成文字。

無論你是用英文、中文、或其他語言,Whisper AI 都能夠辨識,就算有各種口音或是背景噪音的影響也難不倒它。

因為 Whisper AI 是一項開源技術,只要下載到電腦後,就可以不受開發商的限制,也不用擔心這個技術會因為公司倒閉,或是伺服器當機而無法使用。
可以免費、自由地在自己的電腦利用 Whisper 來執行語音辨識、翻譯。

目前我們團隊的字幕都是使用 Whisper AI 來做字幕辨識,真的非常方便!

MacWhisper 是什麼?
它是由 Jordi Bruin 利用 Whisper AI 獨立研發的語音辨識應用程式,能夠辨識 100 多種語言,支援多種常見的音訊與影片檔案格式。
除了將影片轉錄成文字、進行字幕辨識外,MacWhisper 也可以生成即時逐字稿,像是企業員工做會議記錄、記者採訪或是學生做的筆記,幫大家節省手動輸入、整理資訊的時間。
MacWhisper 的轉錄工作都是在使用者的電腦上進行的,所以不需要把任何資料上傳到網路。
即使要轉錄比較機密或比較隱私的資料,也不必擔心安全性問題。

備註:
這邊的 MacWhisper 轉錄指的是使用本地模型。
目前 MacWhisper 支援 Sonoma 和 Sequoia 14.0 以上的系統。
官方也建議使用 Apple M 系列晶片,RAM 至少 8GB 以上,這樣轉錄效率會比較好。
✏️ OS 舊版本支援
官方另外有提供 2 個舊版本的 MacWhisper 可以下載。
- version 2.22:至少要升級到 macOS 12.0 Monterey 系統
- version 10.9.2:至少要升級到 macOS 13.0 Ventura 系統
目前 MacWhisper 是免費的!
但如果想要使用更精準、數據庫更大的語言模型,也可以再付費升級成 MacWhisper PRO,解鎖更完整的功能。

下載免費 MacWhisper
第 1 步
點擊下方連結前往下載頁面。
第 2 步
在右側選擇「MacWhisper Free」 (免費 MacWhisper),點擊「I want this!」 (我想要這個!)。

第 3 步
填寫 Email,「Add a tip」(新增小費) 只是鼓勵性的項目,可以填入 0 (元) 就好。
再點擊「Get」(取得)。

第 4 步
彈出的視窗是希望你購買 PRO 版本,我們先用免費版就好,點擊「Don’t upgrade」(不要升級) 略過它。

第 5 步
點黑色按鈕「Download MacWhisper」(下載 MacWhisper)。

至於上面的「License key」(授權金鑰),我們團隊研究過程都沒有使用到,但還是建議先截圖保管好。
安裝 & 設定 MacWhisper
第 1 步
回到電腦的 Finder,點 2 下 zip 檔,就會得到 MacWhisper 的應用程式。

第 2 步
開啟應用程式,在彈出的安全警告視窗選擇「打開」。

第 3 步
選擇「Move to Applications Folder」(移動到應用程式資料夾),將 App 安裝到電腦上。

第 4 步
MacWhisper 會問你要不要開啟更新提醒。
我是選擇「Check Automatically」(自動檢查),這樣 App 有更新的話就會通知我,至於要不要更新,到時候再決定。

第 5 步
點擊「Continue」(繼續) 略過啟動說明。

第 6 步
調查問卷不想填寫的話,就點擊「Skip」(略過)。

第 7 步
因為我們目前沒有要購買 PRO 版本,所以點右上角「X」關閉視窗就好。

第 8 步
接下來,要下載 Whisper 語言模型。
基本上,模型越大,轉錄的準確度相對也會越高。
雖然轉錄速度會慢一點,但越高的準確度,可以為我們省下更多修改的時間。
所以,在電腦容量足夠的情況下,我會建議下載免費的「Small」模型。
點擊「Download」(下載)。

等到模型下載完成,按鈕變成「Active」(啟用中),就可以按左上角「Close」(關閉)。

第 9 步
進到主畫面,點開右上角的「齒輪」圖示,調整「General」(一般) 設定。

第 10 步
我會開啟「Play sound when finished」(完成時播放聲音),也就是在轉錄完成時系統會響起提示音通知。
這樣我就可以在等待轉錄的時候先去做其他事,聽到提示音再回來查看轉錄成果。

其他像是選擇存檔位置、要不要顯示時間碼等等,大家就依照個人需求去設定。
設定好了,就點擊左上角紅色「X」關閉設定視窗。

實際操作 MacWhisper
對創作者來說,最常使用的功能就是把影片或音檔轉錄成文字,MacWhisper 支援 MP3、WAV、M4A、MP4、AAC、MOV 等常見的影音格式。

只要把檔案拖到 MacWhisper 視窗中,就會開始轉錄。

AI 轉錄需要多久?
轉錄需要花多少時間,會根據我們要轉錄的影片長度和電腦性能而有差異。
MacWhisper 轉錄是主要是靠 GPU 的效能,意思是,電腦的規格越高,轉錄所花費的時間就越少。
這次測試的是「DNS 是什麼」這部影片,格式是 MP4,片長 10 分 21 秒。
我使用的電腦裝置是 2021 年的 MacBook Pro,搭配 M1 Pro 晶片和 16 GB 記憶體。

這部長度約 10 分鐘的影片,只花了 34 秒就完成字幕了!

AI 轉錄後的成品
一起來看看轉錄好的字幕長怎樣吧!
我自己的習慣,會切換到「Transcript」(文字紀錄),把「DISPLAY MODE」(顯示模式) 改成「Segments」(分段),一句一句分行顯示,看起來比較像字幕的形式。
我自己的習慣,會切換成一句句分行顯示,看起來比較像字幕的形式:
- 右側邊欄切換到 Transcript (文字紀錄)
- DISPLAY MODE (顯示模式) 切換到「Segments」(分段)

可以看到轉錄結果算是滿準確的,內容大致上沒有問題,中英混雜也不會錯亂。
而且 Whisper AI 還會辨識出語氣,替我們適時補上標點符號。

我繼續檢查,會看到多少有些字,可能是因為語音的清晰度或發音而辨識錯誤。
如果需要聽音檔確認內容,滑鼠右鍵點擊句子空白處,選擇「Play」(播放)。

要暫停則是按「Enter」停止播放。
快捷鍵
播放 / 暫停:Enter

把滑鼠移到文字上,點一下就能修改內容。

「CNAME 紀錄」這個詞辨識錯誤的情況因為出現了好幾次,要一個個修改勢必會浪費很多時間,就可以用「尋找並替換」功能統一修改。
從畫面上方的選單列點擊「Edit」(編輯)、「Find and Replace」(尋找並替換)。

「Find Text」填上「辨識錯誤的字詞」,「Replace Text」填上「要替換的字詞」。

點擊「Replace All」(全部替換),一鍵修改完成。

輸出字幕
確定內容都沒有問題後,點擊「Export」(匯出)。

MacWhisper 支援多種常見的文字格式,你可以根據自己的需求選擇。
像我要製作 YouTube 的 CC 字幕,常用的設定如下:
- style (樣式):Subtitles (字幕)
- Format (格式):srt

按「Export File」(匯出檔案)。

選擇檔案儲存的資料夾,點擊「Save」(儲存),就可以匯出字幕檔。

如果你想進一步知道諾特斯頻道是怎麼製作影片內嵌字幕的,可以點擊下方連結,閱讀我先前製作的 AI 上字幕 筆記,有更完整的說明!
升級 MacWhisper PRO
購買 MacWhisper PRO
第 1 步
點擊「Upgrade to Pro」(升級為專業版)。

第 2 步
選擇「Buy Pro License」(購買專業版授權),前往官方網站。

MacWhisper PRO 省錢小秘訣
MacWhisper PRO 授權是買斷制,也就是一次付費永久使用,原價是 1 組授權 49 歐元。

不過,諾特斯團隊發現了幾種可以更便宜購入授權的方法,這邊通通分享給大家!
方法 1,使用折扣碼。
MacWhisper 不定期會推出折扣碼,諾特斯團隊目前有找到一組 5 折折扣碼:
MacWhisper 折扣碼 (效期未知):greatwork
這個折扣碼在發佈筆記當下測試還是有效的,不過無法保證期限到什麼時候,如果你發現已經失效了,可以留言告訴我。
如果之後還有新的折扣碼,我也會更新在這篇筆記裡!
方法 2,限定身分者可申請優惠。
官網上有寫到,如果你是記者、學生或非營利組織,寄 Email 給官方說明自己的身份,可以得到 5 折優惠。
MacWhisper 官方 Email:support@macwhisper.com
方法 3,揪朋友團購。
所以,也可以揪朋友一起團購,價格會更划算。
官網上提供多種購買選項,1 次購買愈多組授權,平均單組授權價格就愈便宜,最低可用近 4 折的價格購入。

第 3 步
我這次選擇「1 MacWhisper Pro License (Personal Use)」(1 組 MacWhisper 專業版授權 (個人使用))。
點擊「Purchase again」(再次購買)。
✏️ 為什麼顯示「再次購買」?
因為我們之前下載過「MacWhisper Free」也被視為「購買」行為 (實際費用 0 元),所以官網的按鍵會顯示為「Purchase again」(再次購買)。

第 4 步
在「Discount code」(折扣碼) 輸入「greatwork」後,再按「Apply」(套用),就可以獲得 5 折優惠。
MacWhisper 折扣碼 (效期未知):greatwork

✏️ 結帳金額有變?
在「Checkout」(結帳) 頁面看到價格數字跟首頁有變先不用緊張!這裡的價格是顯示美金。
第 5 步
依序填寫信用卡付款資訊,「Add a tip」(新增小費) 把預設的「20%」改「0%」。
✏️ 新增小費
如果你覺得免費版好用,想要額外贊助開發者,可以在購買付費版時多給小費,支持開發者!
檢查金額沒有問題,就按「Pay」(付款)。

完成購買後就會看到一串亂碼,這就是「License key」(授權金鑰),請務必複製起來保存好!
快捷鍵
複製:Cmd + C

輸入授權金鑰升級
回到 MacWhisper,選擇「Already have a license?」(已經有授權了?)。

貼上剛剛複製的授權金鑰,系統就會自動通過驗證。
快捷鍵
貼上:Cmd + V

點擊「Continue」(繼續) 關閉視窗。

使用 MacWhisper PRO
使用更大的語言模型 (本地模型)
原先我們在 MacWhisper 免費版使用的本地模型,最大只開放到「Small」,MacWhisper PRO 則開放所有模型都能下載使用。
官方推薦使用「Turbo」,在諾特斯團隊實際測試後,也認證它的確如同官方所宣稱的,是準確率高又兼具速度的模型。

第 1 步
點擊「Manage Models」(管理模型)。

第 2 步
點擊「Show All Models」(顯示所有模型)。

第 3 步
點擊「Download」(下載) Turbo 模型。

第 4 步
下載完畢,點擊「Activate」(啟用) 切換模型,再按「Close」關閉視窗。

我一樣用「DNS 是什麼」這部影片來做測試,長度約 10 分鐘的影片,花了 1 分鐘完成轉錄。
檢查轉錄成果,像是專有名詞「CNAME 紀錄」、成語「眼花撩亂」,Turbo 全都正確辨識出來了。
看來使用 Turbo 模型的確會比使用 Small 模型的轉錄結果準確很多!


使用雲端語言模型 (雲端轉錄)
升級 MacWhisper PRO 之後,可以另外串接雲端語言模型進行轉錄。
雲端語言模型有版本更新速度快、高效能的優勢,轉錄速度通常比本地模型還要快。
但因為檔案需要上傳到網路,如果你特別注重資料安全,可能就不太適合使用。
另外,雲端轉錄有限制上傳檔案大小不能超過 25 MB,如果原始檔案是影片,可以先轉成音檔再上傳。

備註:
雲端語言模型指的是運行在「雲端伺服器」上的語言模型。
目前,MacWhisper PRO 有支援 OpenAI 跟 Groq 的雲端轉錄。
我會推薦大家 申請 Groq API Key,因為 Groq 的轉錄速度非常快,而且目前 API 是免費的!

串接 Groq API
點擊下方連結申請 Groq API Key。
👉 點我申請:Groq API Key
第 1 步
輸入 Email,點擊「Login with Email」(使用電子郵件登入)。

第 2 步
到Email 信箱,點擊信件裡的「Continue」(繼續) 按鈕,就會直接登入 Groq。


第 3 步
點擊「API Keys」(API 金鑰)。

第 4 步
按「Create API Key」(建立 API 金鑰)。

第 5 步
幫金鑰填個名稱 (隨意取即可),再按「Submit」(提交)。

第 6 步
得到一串亂碼,也就是 API 金鑰。
按「Copy」(複製)。

第 7 步
回到 MacWhisper,點擊右上角「齒輪」圖示,選擇「Cloud Transcription」(雲端轉錄)。


第 8 步
在 Groq 的欄位貼上 API 金鑰後,就可以關閉設定視窗。
快捷鍵
貼上:Cmd + V

實際操作雲端轉錄
點擊右上角「Turbo」,選擇轉錄速度最快的「Groq」、「Whisper Large V3 Turbo」模型。

切換模型之後,所有轉錄都會用 Groq 來運算。
實測上傳長度 10 分鐘的音檔,只花了 5 秒就完成轉錄,真的是目前最快的,而且是比其他模型有感地快了很多!

輸出結果是簡體怎麼辦?
MacWhisper 裡雖然可以指定轉錄的語言,但無法指定是繁體中文還是簡體中文。
目前使用 Groq 雲端轉錄時,有比較高的機率會轉錄出簡體中文。

如果遇到這種情況,可以先把轉錄結果輸出文字檔案。
「全選」文字後,用 Mac 內建的快捷鍵把簡體字一鍵轉成繁體字。
快捷鍵
簡體轉繁體:Control + Shift + Command + C

批次轉錄
如果你有大量的檔案需要轉錄,或是同一個影音檔同時需要製作逐字稿跟字幕,就很適合使用「Batch Transcribe」(批次轉錄) 這個功能。

第 1 步
一次拖曳多個檔案上傳。

第 2 步
調整「Style」(樣式) 跟 「Format」(格式),來選擇輸出檔案的類型。

第 3 步
點擊「+ Add Format」(新增格式),可以再加入其他輸出檔案格式。


第 4 步
點擊「Start Batch Transcription」(開始批次轉錄)。

第 5 步
批次轉錄完成,按「Close」關閉視窗。

轉錄好的檔案,會自動儲存到跟影音檔相同的資料夾裡。

錄製應用程式音訊
Record App Audio (錄製應用程式音訊) 可以錄製電腦裡應用程式的聲音,再轉錄成文字。

第 1 步
在左側選擇要錄音的應用程式,我這次要錄製網頁裡的聲音,所以選擇「Google Chrome」。

第 2 步
選擇是否加錄麥克風裝置的聲音,我選「Don’t record microphone」(不要錄製麥克風)。

第 3 步
點擊「Record Google Chrome」(錄製 Google Chrome) 開始錄音。

第 4 步
要結束就按「Stop Recording」(停止錄製)。

第 5 步
點擊「Merge and Transcribe」(合併並轉錄),就可以將音檔轉錄成文字了。


如果你需要為直播、線上課程或 Podcast 做筆記、整理重點,這個功能應該能派上用場。
聽寫 (即時語音轉錄)
我要大力推薦大家試試看的是「Dictation」(聽寫),也就是即時語音轉錄的功能。
聽寫講求快速、即時,還要辨識準確,AI 辨識的準確度多少會受到麥克風收音效果的好壞影響。
如果你正在找一支好用的麥克風,可以點擊下方連結,這裡面列出了我親自使用過、推薦入手的麥克風,你可以參考看看!
👉 點我前往: 諾特斯推薦的麥克風
開啟聽寫 (即時語音轉錄) 功能
第 1 步
點擊「Dictation」(聽寫)。

第 2 步
跟著說明,點擊「Next」(下一步)。

第 3步
快捷鍵設定選項有「Function」鍵、右手的「Command」鍵或「Option」鍵。
我選擇使用右手的「Option」鍵,繼續按「Next」。

第 4 步
跟著系統指示練習,長按右手的「Option」鍵,然後開始說話。

第 5 步
練習 3 次後,就可以點擊「Finish」(完成) 關閉視窗。

使用聽寫 (即時轉錄) 功能
這次我以 Google 文件來示範如何實際應用聽寫功能。
按住快捷鍵「Option」開始聽寫,放開「Option」鍵就結束聽寫。
快捷鍵 (自訂)
聽寫:Option (右手)

Groq 的 Whisper Large V3 Turbo 轉錄速度真的很快,幾乎在說完的同時就轉錄出文字了。

後續,只要再用快捷鍵把簡體轉繁體字,再手動斷句,就能快速寫好一段文章。
快捷鍵
簡體轉繁體:Control + Shift + Command + C
Dictation (聽寫) 功能幫助我在創作時可以很流暢地輸出想法,不會受到打字速度和選字的干擾,節省不少時間。
我相信對創作者們會是非常實用的功能,真心推薦親自使用看看!
總結:推薦自動上字幕軟體 MacWhisper
我來總結一下推薦 MacWhisper 的原因,它具備以下優點:
第 1 點:轉錄結果準確、快速。
以免費的本地模型「small」為例,它支援 100 多種語言的轉錄,而且中文轉錄的正確率在 80% 以上。
一部 10 多分鐘的影片,Whisper AI 只要花不到 10 分之 1 的時間,就能自動完成字幕,絕對能幫大家省下大量的精力和時間。
第 2 點,支援多種格式。
MacWhisper 支援讀取多種影片格式的檔案,或是用即時錄音的方式進行轉錄。
轉錄結果也可以輸出成各種常見的文字格式,不管是要做逐字稿、或是要上影片字幕,都很方便。
第 3 點,安全性高。
使用本地模型進行轉錄的話,就不需要上傳任何資料到網路上,資料的隱密性和安全性比較有保障。

最後,我整理了各語言模型的實測心得比較表,給大家參考。
語言模型 | 免費版 / PRO 版 | 諾特斯實測心得 |
---|---|---|
Small (本地模型) | 免費 | 1. 速度不會太慢 2. 轉錄有一定準確度 |
Turbo (本地模型) | PRO | 1. 更大的語言模型 2. 轉錄準確度較 Small 佳 |
Turbo (Groq 雲端轉錄) | PRO | 1. 轉錄速度最快 2. 檔案上傳有大小限制 3. 需要網路才能雲端轉錄 4. 很在意資料安全性的人不建議使用 |
總體來說,不論是要做影片字幕、訪談逐字稿還是會議紀錄,我覺得 MacWhisper 都是一款非常實用的 AI 語音辨識工具,而且免費版本就已經能滿足絕大多數人的需求。
當然,如果你也覺得 Mac Whisper 好用,不妨考慮 購買 MacWhisper PRO,花不到一張小朋友的錢,就能終身使用 MacWhisper 裡的所有好用功能。
同時,也是給優秀的程式開發者一點小小支持。
希望分享這樣好用的 AI 自動上字幕軟體,可以幫助到你!
參考資料
- Free, Accurate, Offline Transcripts/Subtitles with Whisper AI from OpenAI (Mac)
- Make near-perfect subtitles for free on your Mac with MacWhisper
- MacWhisper – The best macOS app using OpenAI Whisper
- Automated Transcription with MacWhisper
- Macwhisper Review & Alternative | How to Use Macwhisper [2024]
製作團隊
總編輯、發佈:諾特斯
文字撰寫、文字編輯、圖片製作、圖片編輯:鹹魚
圖片製作:蚊子