2007年10月20日 星期六

談談 BIG5 跟 UTF8 編碼 跟轉碼的問題

好久沒有接案子

因為最近為了要賺外快

跟朋友 合接了幾個案子

其中 不論是 資料庫轉移 將原有BIG5 或者是 網頁原本是用 BIG5 存檔 而將它改為UTF8

這個都花了我不少時間去 轉換

先談談 BIG5 這個大家之前慣用的編碼

直覺繁體中文 就是用BIG5 存 而且 這個編碼 存法 是屬於 dobule bytes 的編法

跟一般的 UTF8 的編碼 為 single byte 的編碼 不一樣

ps. 通常亞洲語言 KJBG 韓文 日文 繁中 檢中 都是屬於doble bytes

所以轉換後 資料庫的資料會比原本的大

置於轉換的方式 有很多種 用文字編輯器 轉換存檔 或者 利用 轉碼工具 (目前網路較通用的為 ConvertZ)

ConvertZ 的官方網站 http://alf-li.pcdiscuss.com/c_convertz.html

這個作者 寫了很多 好用的小工具


最後 查了一下網路 資料

發現 有個大師 她對mysql 資料轉換 有相當深的研究

大家若有興趣 可以到他的BLOG 看看囉

http://www.dchome.net/xspace/index.php/3/spacelist-blog-itemtypeid-8.html

沒有留言: