Extreme Thinking
linux , windows 下 簡體字轉繁體字 (Unicode)

2018-03-15


簡體字轉繁體字 工具很多 , 其中 opencc 很棒 , 會將簡體常用語換成台灣繁體常用語

要先轉成 Unicode 呦 !! ( 用 iconv 或是 enca/enconv 轉換為 utf8 )

記錄一下 linux CentOS下安裝方式 (windows 自行下載安裝包, 用 cmd 抄作)

wget https://github.com/BYVoid/OpenCC/archive/master.zip -O opencc.zip
unzip opencc.zip
cd OpenCC-master
yum install -y cmake gcc gcc-c++ doxygen
make
make install
ln -s /usr/lib/libopencc.so.2 /usr/lib64/libopencc.so.2

檢查是否安裝成功

# opencc -h

Open Chinese Convert (OpenCC) Command Line Tool
Author: Carbo Kuo <byvoid@byvoid.com>
Bug Report: http://github.com/BYVoid/OpenCC/issues

Usage:

   opencc  [--noflush <bool>] [-i <file>] [-o <file>] [-c <file>] [--]
           [--version] [-h]

Options:

   --noflush <bool>
     Disable flush for every line

   -i <file>,  --input <file>
     Read original text from <file>.

   -o <file>,  --output <file>
     Write converted text to <file>.

   -c <file>,  --config <file>
     Configuration file

   --,  --ignore_rest
     Ignores the rest of the labeled arguments following this flag.

   --version
     Displays version information and exits.

   -h,  --help
     Displays usage information and exits.


   Open Chinese Convert (OpenCC) Command Line Tool

轉個匯出的 SQL …..

opencc -i o.sql -o o2.sql -c s2twp.json

使用方式

opencc -i 輸入檔案 -o 輸出檔案 -c 組態檔案

組態檔案 … 我最常用的是 s2twp.json , tw2sp.json

​​​​​​‧ s2t.json - 簡體到繁體
‧ t2s.json - 繁體到簡體
‧ s2tw.json - 簡體到臺灣正體
‧ tw2s.json - 臺灣正體到簡體
‧ s2hk.json - 簡體到香港繁體(香港小學學習字詞表標準)
‧ hk2s.json - 香港繁體(香港小學學習字詞表標準)到簡體
‧ s2twp.json - 簡體到繁體(臺灣正體標準)並轉換爲臺灣常用詞彙
‧ tw2sp.json - 繁體(臺灣正體標準)到簡體並轉換爲中國大陸常用詞彙