自動上字幕軟體 MacWhisper 教學|Whisper AI 錄音檔轉文字

MacWhisper 的精選圖片

這篇筆記會介紹 MacWhisper 這個 Mac 專用的 Whisper AI 語音轉錄軟體,跟你分享如何利用它幫影片自動上字幕、將語音轉成逐字稿。

之前,我介紹過一款 Windows 系統的 AI 自動上字幕軟體工具:WhisperDesktop

👉 點我觀看免費筆記:YouTube AI 上字幕教學

很多人在留言中提到,希望我也介紹 Mac 的版本。

所以這次我要推薦一款 Mac 專用的語音辨識工具 MacWhisper

我會跟你講解如何安裝和使用它,也會進一步跟你分享付費版 MacWhisper PRO 多了哪些更強大的功能,值不值得升級呢?


如果你偏好用影片學習,歡迎觀看下面的 YouTube 影片。

MacWhisper|Mac 專用 Whisper AI 自動上字幕軟體|語音轉逐字稿神器!

如果你喜歡透過圖文學習,請繼續往下閱讀吧!

圖文版會比較詳細、方便快速瀏覽,還會持續更新與補充內容。



MacWhisper 介紹

Whisper AI 是什麼?

Whisper 是由 OpenAI 開發的人工智慧技術,專門用來「聽懂」語音,再「轉寫」成文字。簡單來說,就是把語音轉錄成文字。

Whisper 是 OpenAI 發布的一項開源的自動語音辨識 ASR 系統

無論你是用英文、中文、或其他語言,Whisper AI 都能夠辨識,就算有各種口音或是背景噪音的影響也難不倒它。

Whisper AI 口音噪音也可以辨識

因為 Whisper AI 是一項開源技術,只要下載到電腦後,就可以不受開發商的限制,也不用擔心這個技術會因為公司倒閉,或是伺服器當機而無法使用。

可以免費、自由地在自己的電腦利用 Whisper 來執行語音辨識、翻譯。

Whisper AI 是免費自由的開源技術

目前我們團隊的字幕都是使用 Whisper AI 來做字幕辨識,真的非常方便!

諾特斯團隊用 Whisper AI 做字幕

MacWhisper 是什麼?

它是由 Jordi Bruin 利用 Whisper AI 獨立研發的語音辨識應用程式,能夠辨識 100 多種語言,支援多種常見的音訊與影片檔案格式。

除了將影片轉錄成文字、進行字幕辨識外,MacWhisper 也可以生成即時逐字稿,像是企業員工做會議記錄、記者採訪或是學生做的筆記,幫大家節省手動輸入、整理資訊的時間。

MacWhisper 的轉錄工作都是在使用者的電腦上進行的,所以不需要把任何資料上傳到網路。

即使要轉錄比較機密或比較隱私的資料,也不必擔心安全性問題。

MacWhisper 是什麼

備註:

這邊的 MacWhisper 轉錄指的是使用本地模型。

目前 MacWhisper 支援 Sonoma 和 Sequoia 14.0 以上的系統。

官方也建議使用 Apple M 系列晶片,RAM 至少 8GB 以上,這樣轉錄效率會比較好。

✏️ OS 舊版本支援

官方另外有提供 2 個舊版本的 MacWhisper 可以下載。

  • version 2.22:至少要升級到 macOS 12.0 Monterey 系統
  • version 10.9.2:至少要升級到 macOS 13.0 Ventura 系統

目前 MacWhisper 是免費的!

但如果想要使用更精準、數據庫更大的語言模型,也可以再付費升級成 MacWhisper PRO,解鎖更完整的功能。

MacWhisper PRO 是什麼

下載免費 MacWhisper

第 1 步

點擊下方連結前往下載頁面。

第 2 步

在右側選擇「MacWhisper Free」 (免費 MacWhisper),點擊「I want this!」 (我想要這個!)。

點擊免費 MacWhisper 我想要這個

第 3 步

填寫 Email,「Add a tip」(新增小費) 只是鼓勵性的項目,可以填入 0 (元) 就好。

再點擊「Get」(取得)。

填 Email 小費 0 並取得 MacWhisper

第 4 步

彈出的視窗是希望你購買 PRO 版本,我們先用免費版就好,點擊「Don’t upgrade」(不要升級) 略過它。

MacWhisper 先用免費版不要升級

第 5 步

點黑色按鈕「Download MacWhisper」(下載 MacWhisper)。

下載 MacWhisper

至於上面的「License key」(授權金鑰),我們團隊研究過程都沒有使用到,但還是建議先截圖保管好。

安裝 & 設定 MacWhisper

第 1 步

回到電腦的 Finder,點 2 下 zip 檔,就會得到 MacWhisper 的應用程式。

解壓縮 zip 檔獲得 MacWhisper 應用程式

第 2 步

開啟應用程式,在彈出的安全警告視窗選擇「打開」。

警告視窗打開 MacWhisper

第 3 步

選擇「Move to Applications Folder」(移動到應用程式資料夾),將 App 安裝到電腦上。

MacWhisper 移動到應用程式資料夾

第 4 步

MacWhisper 會問你要不要開啟更新提醒。

我是選擇「Check Automatically」(自動檢查),這樣 App 有更新的話就會通知我,至於要不要更新,到時候再決定。

MacWhisper 開啟自動檢查

第 5 步

點擊「Continue」(繼續) 略過啟動說明。

繼續 MacWhisper 略過說明

第 6 步

調查問卷不想填寫的話,就點擊「Skip」(略過)。

MacWhisper 略過調查問卷

第 7 步

因為我們目前沒有要購買 PRO 版本,所以點右上角「X」關閉視窗就好。

MacWhisper 關閉初始視窗

第 8 步

接下來,要下載 Whisper 語言模型。

基本上,模型越大,轉錄的準確度相對也會越高。

雖然轉錄速度會慢一點,但越高的準確度,可以為我們省下更多修改的時間。

所以,在電腦容量足夠的情況下,我會建議下載免費的「Small」模型。

點擊「Download」(下載)。

下載 MacWhisper 語音模型

等到模型下載完成,按鈕變成「Active」(啟用中),就可以按左上角「Close」(關閉)。

啟用 MacWhisper 語音模型

第 9 步

進到主畫面,點開右上角的「齒輪」圖示,調整「General」(一般) 設定。

MacWhisper 齒輪調整設定

第 10 步

我會開啟「Play sound when finished」(完成時播放聲音),也就是在轉錄完成時系統會響起提示音通知。

這樣我就可以在等待轉錄的時候先去做其他事,聽到提示音再回來查看轉錄成果。

MacWhisper 開啟完成時播放聲音

其他像是選擇存檔位置、要不要顯示時間碼等等,大家就依照個人需求去設定。

設定好了,就點擊左上角紅色「X」關閉設定視窗。

MacWhisper 其他依照需求設定

實際操作 MacWhisper

對創作者來說,最常使用的功能就是把影片或音檔轉錄成文字,MacWhisper 支援 MP3、WAV、M4A、MP4、AAC、MOV 等常見的影音格式。

MacWhisper 最常用功能影音轉文字

只要把檔案拖到 MacWhisper 視窗中,就會開始轉錄。

檔案拖到 MacWhisper 開始轉錄

AI 轉錄需要多久?

轉錄需要花多少時間,會根據我們要轉錄的影片長度和電腦性能而有差異。

MacWhisper 轉錄是主要是靠 GPU 的效能,意思是,電腦的規格越高,轉錄所花費的時間就越少。

這次測試的是「DNS 是什麼」這部影片,格式是 MP4,片長 10 分 21 秒。

我使用的電腦裝置是 2021 年的 MacBook Pro,搭配 M1 Pro 晶片和 16 GB 記憶體。

MacWhisper 轉錄效能

這部長度約 10 分鐘的影片,只花了 34 秒就完成字幕了!

MacWhisper small 轉錄成果規格

AI 轉錄後的成品

一起來看看轉錄好的字幕長怎樣吧!

我自己的習慣,會切換到「Transcript」(文字紀錄),把「DISPLAY MODE」(顯示模式) 改成「Segments」(分段),一句一句分行顯示,看起來比較像字幕的形式。

我自己的習慣,會切換成一句句分行顯示,看起來比較像字幕的形式:

  • 右側邊欄切換到 Transcript (文字紀錄)
  • DISPLAY MODE (顯示模式) 切換到「Segments」(分段)
MacWhisper small 分段顯示

可以看到轉錄結果算是滿準確的,內容大致上沒有問題,中英混雜也不會錯亂。

而且 Whisper AI 還會辨識出語氣,替我們適時補上標點符號。

MacWhisper 轉錄辨識中英語氣

我繼續檢查,會看到多少有些字,可能是因為語音的清晰度或發音而辨識錯誤。

如果需要聽音檔確認內容,滑鼠右鍵點擊句子空白處,選擇「Play」(播放)。

右鍵播放

要暫停則是按「Enter」停止播放。

快捷鍵
播放 / 暫停:Enter

空白鍵暫停

把滑鼠移到文字上,點一下就能修改內容。

點擊文字修改內容

「CNAME 紀錄」這個詞辨識錯誤的情況因為出現了好幾次,要一個個修改勢必會浪費很多時間,就可以用「尋找並替換」功能統一修改。

從畫面上方的選單列點擊「Edit」(編輯)、「Find and Replace」(尋找並替換)。

MacWhisper 尋找並替換功能

「Find Text」填上「辨識錯誤的字詞」,「Replace Text」填上「要替換的字詞」。

MacWhisper 填上尋找替換文字左

點擊「Replace All」(全部替換),一鍵修改完成。

MacWhisper 文字全部替換

輸出字幕

確定內容都沒有問題後,點擊「Export」(匯出)。

MacWhisper small 輸出字幕

MacWhisper 支援多種常見的文字格式,你可以根據自己的需求選擇。

像我要製作 YouTube 的 CC 字幕,常用的設定如下:

  • style (樣式):Subtitles (字幕)
  • Format (格式):srt
輸出 YouTube CC 字幕格式 下

按「Export File」(匯出檔案)。

匯出 YouTube CC 字幕檔案

選擇檔案儲存的資料夾,點擊「Save」(儲存),就可以匯出字幕檔。

儲存 YouTube CC 字幕檔案

如果你想進一步知道諾特斯頻道是怎麼製作影片內嵌字幕的,可以點擊下方連結,閱讀我先前製作的 AI 上字幕 筆記,有更完整的說明!

AI 上字幕 v2

YouTube AI 上字幕教學
如何使用免費自動字幕 (逐字稿) 生成軟體 WhisperDesktop
OpenAI Whisper 教學

升級 MacWhisper PRO

購買 MacWhisper PRO

第 1 步

點擊「Upgrade to Pro」(升級為專業版)。

MacWhisper 點擊升級為專業版

第 2 步

選擇「Buy Pro License」(購買專業版授權),前往官方網站。

MacWhisper 購買專業版授權

MacWhisper PRO 省錢小秘訣

MacWhisper PRO 授權是買斷制,也就是一次付費永久使用,原價是 1 組授權 49 歐元。

MacWhisper PRO 原價 49 歐元

不過,諾特斯團隊發現了幾種可以更便宜購入授權的方法,這邊通通分享給大家!

方法 1,使用折扣碼。

MacWhisper 不定期會推出折扣碼,諾特斯團隊目前有找到一組 5 折折扣碼

MacWhisper 折扣碼 (效期未知):greatwork

這個折扣碼在發佈筆記當下測試還是有效的,不過無法保證期限到什麼時候,如果你發現已經失效了,可以留言告訴我。

如果之後還有新的折扣碼,我也會更新在這篇筆記裡!

方法 2,限定身分者可申請優惠。

官網上有寫到,如果你是記者、學生或非營利組織,寄 Email 給官方說明自己的身份,可以得到 5 折優惠。

MacWhisper 官方 Email:support@macwhisper.com

方法 3,揪朋友團購。

所以,也可以揪朋友一起團購,價格會更划算。

官網上提供多種購買選項,1 次購買愈多組授權,平均單組授權價格就愈便宜,最低可用近 4 折的價格購入。

MacWhisper PRO 省錢小秘訣

第 3 步

我這次選擇「1 MacWhisper Pro License (Personal Use)」(1 組 MacWhisper 專業版授權 (個人使用))。

點擊「Purchase again」(再次購買)。

✏️ 為什麼顯示「再次購買」?

因為我們之前下載過「MacWhisper Free」也被視為「購買」行為 (實際費用 0 元),所以官網的按鍵會顯示為「Purchase again」(再次購買)。

點擊再次購買 MacWhisper PRO

第 4 步

在「Discount code」(折扣碼) 輸入「greatwork」後,再按「Apply」(套用),就可以獲得 5 折優惠。

MacWhisper 折扣碼 (效期未知):greatwork

輸入折扣碼 greatwork 套用

✏️ 結帳金額有變?

在「Checkout」(結帳) 頁面看到價格數字跟首頁有變先不用緊張!這裡的價格是顯示美金。

第 5 步

依序填寫信用卡付款資訊,「Add a tip」(新增小費) 把預設的「20%」改「0%」。

✏️ 新增小費

如果你覺得免費版好用,想要額外贊助開發者,可以在購買付費版時多給小費,支持開發者!

檢查金額沒有問題,就按「Pay」(付款)。

小費設定 0 並付款

完成購買後就會看到一串亂碼,這就是「License key」(授權金鑰),請務必複製起來保存好!

快捷鍵
複製:Cmd + C

完成 PRO 購買授權金鑰複製保存

輸入授權金鑰升級

回到 MacWhisper,選擇「Already have a license?」(已經有授權了?)。

點擊已經有授權了

貼上剛剛複製的授權金鑰,系統就會自動通過驗證。

快捷鍵
貼上:Cmd + V

授權金鑰自動驗證

點擊「Continue」(繼續) 關閉視窗。

關閉授權金鑰視窗

使用 MacWhisper PRO

使用更大的語言模型 (本地模型)

原先我們在 MacWhisper 免費版使用的本地模型,最大只開放到「Small」,MacWhisper PRO 則開放所有模型都能下載使用。

官方推薦使用「Turbo」,在諾特斯團隊實際測試後,也認證它的確如同官方所宣稱的,是準確率高又兼具速度的模型。

大型本地模型列表

第 1 步

點擊「Manage Models」(管理模型)。

點擊管理 PRO 模型

第 2 步

點擊「Show All Models」(顯示所有模型)。

顯示 PRO 所有模型

第 3 步

點擊「Download」(下載) Turbo 模型。

下載 Turbo 模型

第 4 步

下載完畢,點擊「Activate」(啟用) 切換模型,再按「Close」關閉視窗。

啟用切換模型並關閉視窗

我一樣用「DNS 是什麼」這部影片來做測試,長度約 10 分鐘的影片,花了 1 分鐘完成轉錄。

檢查轉錄成果,像是專有名詞「CNAME 紀錄」、成語「眼花撩亂」,Turbo 全都正確辨識出來了。

看來使用 Turbo 模型的確會比使用 Small 模型的轉錄結果準確很多!

Turbo 轉錄結果更準確 圖片 2
Turbo 轉錄結果更準確 圖片 1

使用雲端語言模型 (雲端轉錄)

升級 MacWhisper PRO 之後,可以另外串接雲端語言模型進行轉錄。

雲端語言模型有版本更新速度快、高效能的優勢,轉錄速度通常比本地模型還要快。

但因為檔案需要上傳到網路,如果你特別注重資料安全,可能就不太適合使用。

另外,雲端轉錄有限制上傳檔案大小不能超過 25 MB,如果原始檔案是影片,可以先轉成音檔再上傳。

雲端語言模型優缺點

備註:

雲端語言模型指的是運行在「雲端伺服器」上的語言模型。

目前,MacWhisper PRO 有支援 OpenAI 跟 Groq 的雲端轉錄。

我會推薦大家 申請 Groq API Key,因為 Groq 的轉錄速度非常快,而且目前 API 是免費的!

雲端轉錄 Open AI Groq

串接 Groq API

點擊下方連結申請 Groq API Key。

👉 點我申請:Groq API Key

第 1 步

輸入 Email,點擊「Login with Email」(使用電子郵件登入)。

使用電子郵件登入 Groq

第 2 步

到Email 信箱,點擊信件裡的「Continue」(繼續) 按鈕,就會直接登入 Groq。

點擊信件繼續登入 Groq 圖片 1
點擊信件繼續登入 Groq 圖片 2

第 3 步

點擊「API Keys」(API 金鑰)。

Groq 點擊 API 金鑰

第 4 步

按「Create API Key」(建立 API 金鑰)。

Groq 建立 API 金鑰

第 5 步

幫金鑰填個名稱 (隨意取即可),再按「Submit」(提交)。

Groq 金鑰命名提交

第 6 步

得到一串亂碼,也就是 API 金鑰。

按「Copy」(複製)。

Groq API 金鑰複製

第 7 步

回到 MacWhisper,點擊右上角「齒輪」圖示,選擇「Cloud Transcription」(雲端轉錄)。

設定雲端轉錄 API 圖片 1
設定雲端轉錄 API 圖片 2

第 8 步

在 Groq 的欄位貼上 API 金鑰後,就可以關閉設定視窗。

快捷鍵
貼上:Cmd + V

貼上 Groq API 金鑰

實際操作雲端轉錄

點擊右上角「Turbo」,選擇轉錄速度最快的「Groq」、「Whisper Large V3 Turbo」模型。

切換 Groq Whisper Large V3 Turbo

切換模型之後,所有轉錄都會用 Groq 來運算。

實測上傳長度 10 分鐘的音檔,只花了 5 秒就完成轉錄,真的是目前最快的,而且是比其他模型有感地快了很多!

Groq 轉錄成果規格

輸出結果是簡體怎麼辦?

MacWhisper 裡雖然可以指定轉錄的語言,但無法指定是繁體中文還是簡體中文。

目前使用 Groq 雲端轉錄時,有比較高的機率會轉錄出簡體中文。

Groq 轉錄容易出現簡體

如果遇到這種情況,可以先把轉錄結果輸出文字檔案。

「全選」文字後,用 Mac 內建的快捷鍵把簡體字一鍵轉成繁體字。

快捷鍵
簡體轉繁體:Control + Shift + Command + C

文檔用快捷鍵簡體轉繁體

批次轉錄

如果你有大量的檔案需要轉錄,或是同一個影音檔同時需要製作逐字稿跟字幕,就很適合使用「Batch Transcribe」(批次轉錄) 這個功能。

Mac Whisper PRO 批次轉錄

第 1 步

一次拖曳多個檔案上傳。

批次轉錄拖曳多個檔案上傳

第 2 步

調整「Style」(樣式) 跟 「Format」(格式),來選擇輸出檔案的類型。

批次轉錄調整樣式格式

第 3 步

點擊「+ Add Format」(新增格式),可以再加入其他輸出檔案格式。

批次轉錄新增格式
批次轉錄其他輸出檔案格式

第 4 步

點擊「Start Batch Transcription」(開始批次轉錄)。

開始批次轉錄

第 5 步

批次轉錄完成,按「Close」關閉視窗。

完成批次轉錄

轉錄好的檔案,會自動儲存到跟影音檔相同的資料夾裡。

批次轉錄儲存資料夾

錄製應用程式音訊

Record App Audio (錄製應用程式音訊) 可以錄製電腦裡應用程式的聲音,再轉錄成文字。

錄製應用程式音訊

第 1 步

在左側選擇要錄音的應用程式,我這次要錄製網頁裡的聲音,所以選擇「Google Chrome」。

選擇錄音的應用程式

第 2 步

選擇是否加錄麥克風裝置的聲音,我選「Don’t record microphone」(不要錄製麥克風)。

選擇不要錄製麥克風

第 3 步

點擊「Record Google Chrome」(錄製 Google Chrome) 開始錄音。

點擊錄製應用程式開始

第 4 步

要結束就按「Stop Recording」(停止錄製)。

點擊停止錄製結束

第 5 步

點擊「Merge and Transcribe」(合併並轉錄),就可以將音檔轉錄成文字了。

合併並轉錄應用程式
錄製應用程式音訊結果

如果你需要為直播、線上課程或 Podcast 做筆記、整理重點,這個功能應該能派上用場。

聽寫 (即時語音轉錄)

我要大力推薦大家試試看的是「Dictation」(聽寫),也就是即時語音轉錄的功能。

聽寫講求快速、即時,還要辨識準確,AI 辨識的準確度多少會受到麥克風收音效果的好壞影響。

如果你正在找一支好用的麥克風,可以點擊下方連結,這裡面列出了我親自使用過、推薦入手的麥克風,你可以參考看看!

👉 點我前往: 諾特斯推薦的麥克風

開啟聽寫 (即時語音轉錄) 功能

第 1 步

點擊「Dictation」(聽寫)。

Mac Whisper PRO 聽寫

第 2 步

跟著說明,點擊「Next」(下一步)。

點擊聽寫下一步

第 3步

快捷鍵設定選項有「Function」鍵、右手的「Command」鍵或「Option」鍵。

我選擇使用右手的「Option」鍵,繼續按「Next」。

選擇聽寫快捷鍵

第 4 步

跟著系統指示練習,長按右手的「Option」鍵,然後開始說話。

練習三次聽寫

第 5 步

練習 3 次後,就可以點擊「Finish」(完成) 關閉視窗。

關閉聽寫練習

使用聽寫 (即時轉錄) 功能

這次我以 Google 文件來示範如何實際應用聽寫功能。

按住快捷鍵「Option」開始聽寫,放開「Option」鍵就結束聽寫。

快捷鍵 (自訂)
聽寫:Option (右手)

Google 文件聽寫

Groq 的 Whisper Large V3 Turbo 轉錄速度真的很快,幾乎在說完的同時就轉錄出文字了。

聽寫後編輯 圖片 1

後續,只要再用快捷鍵把簡體轉繁體字,再手動斷句,就能快速寫好一段文章。

快捷鍵
簡體轉繁體:Control + Shift + Command + C

聽寫後編輯 圖片 2
聽寫後編輯 圖片 3

Dictation (聽寫) 功能幫助我在創作時可以很流暢地輸出想法,不會受到打字速度和選字的干擾,節省不少時間。

我相信對創作者們會是非常實用的功能,真心推薦親自使用看看!

總結:推薦自動上字幕軟體 MacWhisper

我來總結一下推薦 MacWhisper 的原因,它具備以下優點:

第 1 點:轉錄結果準確、快速。

以免費的本地模型「small」為例,它支援 100 多種語言的轉錄,而且中文轉錄的正確率在 80% 以上。

一部 10 多分鐘的影片,Whisper AI 只要花不到 10 分之 1 的時間,就能自動完成字幕,絕對能幫大家省下大量的精力和時間。

第 2 點,支援多種格式。

MacWhisper 支援讀取多種影片格式的檔案,或是用即時錄音的方式進行轉錄。

轉錄結果也可以輸出成各種常見的文字格式,不管是要做逐字稿、或是要上影片字幕,都很方便。

第 3 點,安全性高。

使用本地模型進行轉錄的話,就不需要上傳任何資料到網路上,資料的隱密性和安全性比較有保障。

MacWhisper 總結 3 優點

最後,我整理了各語言模型的實測心得比較表,給大家參考。

語言模型免費版 / PRO 版諾特斯實測心得
Small
(本地模型)
免費1. 速度不會太慢
2. 轉錄有一定準確度
Turbo
(本地模型)
PRO1. 更大的語言模型
2. 轉錄準確度較 Small 佳
Turbo
(Groq 雲端轉錄)
PRO1. 轉錄速度最快
2. 檔案上傳有大小限制
3. 需要網路才能雲端轉錄
4. 很在意資料安全性的人不建議使用
語言模型實測心得比較表

總體來說,不論是要做影片字幕、訪談逐字稿還是會議紀錄,我覺得 MacWhisper 都是一款非常實用的 AI 語音辨識工具,而且免費版本就已經能滿足絕大多數人的需求。

當然,如果你也覺得 Mac Whisper 好用,不妨考慮 購買 MacWhisper PRO,花不到一張小朋友的錢,就能終身使用 MacWhisper 裡的所有好用功能。

同時,也是給優秀的程式開發者一點小小支持。

希望分享這樣好用的 AI 自動上字幕軟體,可以幫助到你!


參考資料

製作團隊

總編輯、發佈:諾特斯

文字撰寫、文字編輯、圖片製作、圖片編輯:鹹魚

圖片製作:蚊子