Open Chinese Convert 開放中文轉換是一個中文簡繁轉換的開源項目,在異體字、詞彙和地區習慣用詞轉換(中國大陸、臺灣、香港)上區分非常精準,而且支援 Windows、Linux、Mac 等平台。本文記錄如何在 macOS 安裝 Open CC 繁簡轉換工具,在有大量文字或批次處理的需求時,可以透過 Open CC 快速轉換文字檔案。
快速安裝 Open CC
安裝透過終端機來執行,筆者使用 iTerm 這套軟體,使用 macOS 內建的終端機也可以。同時會使用 Homebrew 這套套件管理工具,可以參考 「Mac」Homebrew:Mac 必裝的套件管理工具 這篇文章。
使用 Homebrew 安裝 Open CC
brew install opencc
查看 Open CC 版本檢查是否安裝成功
opencc --version
使用 Open CC 轉換檔案
指令格式如下
opencc -i 原始檔案 -o 輸出檔案 -c 詞庫檔案
例如:將下載項目中的 zhcn.srt 簡體中文字幕檔,使用 s2twp.json 詞庫檔案,轉換成繁體中文用語並在下載項目中另存為 zhtw.srt
opencc -i /Users/victor/Downloads/zhcn.srt -o /Users/victor/Downloads/zhtw.srt -c s2twp.json
Open CC 支援的檔案類型很多,從 txt 純文字到 srt 字幕檔,甚至 macOS 軟體中 .lproj 語言包裡面的 .strings 檔都可以轉換
可使用的內建詞庫檔案
s2t.json簡體到繁體t2s.json繁體到簡體s2tw.json簡體到臺灣正體tw2s.json臺灣正體到簡體s2hk.json簡體到香港繁體(香港小學學習字詞表標準)hk2s.json香港繁體(香港小學學習字詞表標準)到簡體s2twp.json簡體到繁體(臺灣正體標準)並轉換爲臺灣常用詞彙tw2sp.json繁體(臺灣正體標準)到簡體並轉換爲中國大陸常用詞彙t2tw.json繁體(OpenCC 標準)到臺灣正體t2hk.json繁體(OpenCC 標準)到香港繁體(香港小學學習字詞表標準)
備用安裝方式
若上述使用 brew install opencc 安裝不成功,可以嘗試同步 git 專案的方式安裝。
首先用 Homebrew 安裝 git(安裝過可以跳過)
brew install git
安裝好以後將 Open CC 專案同步回來
git clone https://github.com/BYVoid/OpenCC
安裝 cmake 跨平台自動化建構系統
brew install cmake
安裝 Doxygen 程式文件產生器
brew install Doxygen
最後以下列順序輸入指令安裝 Open CC
cd OpenCC
make PREFIX=/usr/local
sudo make PREFIX=/usr/local install