Open Chinese Convert 開放中文轉換是一個中文簡繁轉換的開源項目,在異體字、詞彙和地區習慣用詞轉換(中國大陸、臺灣、香港)上區分非常精準,而且支援 Windows、Linux、Mac 等平台。本文記錄如何在 macOS 安裝 Open CC 繁簡轉換工具,在有大量文字或批次處理的需求時,可以透過 Open CC 快速轉換文字檔案。
快速安裝 Open CC
安裝透過終端機來執行,筆者使用 iTerm 這套軟體,使用 macOS 內建的終端機也可以。同時會使用 Homebrew 這套套件管理工具,可以參考 「Mac」Homebrew:Mac 必裝的套件管理工具 這篇文章。
使用 Homebrew 安裝 Open CC
brew install opencc
查看 Open CC 版本檢查是否安裝成功
opencc --version
使用 Open CC 轉換檔案
指令格式如下
opencc -i 原始檔案 -o 輸出檔案 -c 詞庫檔案
例如:將下載項目中的 zhcn.srt 簡體中文字幕檔,使用 s2twp.json 詞庫檔案,轉換成繁體中文用語並在下載項目中另存為 zhtw.srt
opencc -i /Users/victor/Downloads/zhcn.srt -o /Users/victor/Downloads/zhtw.srt -c s2twp.json
Open CC 支援的檔案類型很多,從 txt 純文字到 srt 字幕檔,甚至 macOS 軟體中 .lproj
語言包裡面的 .strings
檔都可以轉換
可使用的內建詞庫檔案
s2t.json
簡體到繁體t2s.json
繁體到簡體s2tw.json
簡體到臺灣正體tw2s.json
臺灣正體到簡體s2hk.json
簡體到香港繁體(香港小學學習字詞表標準)hk2s.json
香港繁體(香港小學學習字詞表標準)到簡體s2twp.json
簡體到繁體(臺灣正體標準)並轉換爲臺灣常用詞彙tw2sp.json
繁體(臺灣正體標準)到簡體並轉換爲中國大陸常用詞彙t2tw.json
繁體(OpenCC 標準)到臺灣正體t2hk.json
繁體(OpenCC 標準)到香港繁體(香港小學學習字詞表標準)
備用安裝方式
若上述使用 brew install opencc
安裝不成功,可以嘗試同步 git 專案的方式安裝。
首先用 Homebrew 安裝 git(安裝過可以跳過)
brew install git
安裝好以後將 Open CC 專案同步回來
git clone https://github.com/BYVoid/OpenCC
安裝 cmake 跨平台自動化建構系統
brew install cmake
安裝 Doxygen 程式文件產生器
brew install Doxygen
最後以下列順序輸入指令安裝 Open CC
cd OpenCC
make PREFIX=/usr/local
sudo make PREFIX=/usr/local install