2007年10月16日

大五日文仮名擴充碼的心酸血淚史 (BigFiveExtendedCode)=?UTF-8?B?IOODrOODkyY=?=

本文章轉載自Colorless echo
請到BigFiveExtendedCode觀看原來的格式

大五日文仮名擴充碼的心酸血淚史


大五日文仮名擴充碼的心酸血淚史(有那麼嚴重嗎?←笑)

話說家中大多還擺著沒有硬碟,以5 1/2" floppy disk 開機的時代,當時台灣的中文系統幾乎由倚天包辦。而他們後來的擴張字型中包含有日文仮名,使之後使用到日文的玩家有了依據:仮名就用倚天字型,其他除了和製漢字外,都用繁體代替。直到後來萬惡及萬便利的大魔頭微軟介入,創造出 GUI 的怪物巴哈姆特…不是,是 Microsoft® Windows,將舊王者倚天一舉推翻。但獨霸的微軟一開始就沒提供算是大五擴充碼(Big Five extended code)的倚天字碼,常常利用日文的人們當然開始著急了,「我們過去一堆心血資料該如何處理?」於是有了中國海(ChinaSea)等字型的出現。繼承了倚天,中國海的字型更多變化,也成了我過去一度慣用的字碼。但這在微軟看來根本是一錯再錯的不歸路,終於造成後來越來越多的紛爭與歧異。
乘著網路無國界之翼,各國區域性的字碼漸漸有了統一的需求,因此有了統一碼/標準萬國碼(Unicode)的出現。因為 Unicode,使得微軟有機會參與一種新世代標準字碼的制定。其結果,Unicode 至今依舊沒在 Big Five 中加入 ETEN extensions。而又因為微軟改變 OS 架構,使得中國海等不再能夠於 XP 等系統上使用。(以至於許多過去使用中國海和製漢字的資料都得修改,要不就廢除。)但我們終究找到了一些出路,那是現在市面上如雨後春筍一般出現的 Unicode 補完計畫、日和字集與櫻花輸入法等;以及微軟自己出的 HKSCS(Hong Kong Supplementary Character Set)patch,香港增補字符集:很幸運的香港他們也有不少人一路走來,且起碼在仮名的部分用的也是倚天字碼。雖然和中國海有些出入,權宜之下倒不失為一個良好的替代品;因為微軟畢竟是一家商業公司,也得顧及� �港為數眾多的客戶,所以既然有需求,就不得不一直支援下去。所以,我們就能看到像是 HKSCS-2001 Support Package for Windows 2000 and Windows XP 這樣的東西。但是這樣真的就沒問題了嗎?以我的評估環境來說,我不願意使用 Unicode 補完計畫等等的方法。雖然這可能對以上的作者有些不敬,但我總覺得還適用微軟自己出的東西比較保險。原因:假如一作,就得一直支援下去;但是我們有這樣的毅力嗎?碰到每隔幾年就來一次的系統大變革,我們隨時都會守在一旁,並保證有時間解決這些問題嗎?經歷過這些年來,我已經不太有把握了,當然也不敢期望太多。而縱使是微軟自己出的香港增補字符集,經我的評估,在任意變換非 Unicode 的內定字碼,正常使用下也有可能導致字碼亂掉,甚至因為 code page 的損毀或漏失而無法開機的狀況。我現在的情形,就� �於字碼頁已被搞混,本來不是 Big5 的也被判作 Big5,但事實上並不能顯示;而反安裝也沒效用,未來恐怕得靠自己(的程式)來一個字一個字更改了。因此,我們如此任意的改變系統設定,雖然或許能拿來誇耀,但誰知道我們的程式在任何情況下確實都不會出現 bug 呢?尤其是在字碼的這部分,連微軟自己出的東西都會有問題,我們在更改微軟產品之餘,有什麼自信能保證做得比微軟本身好?
所以我寧願採取更保守而能掌握的方法:將所有的舊擴張碼轉成 Unicode。只是,這樣終究是比較麻煩的。假如要問我我的期望,大概是 Unicode 能在 Big Five 中直接加入擴充碼的 mapping 吧,HKSCS 啥的也就免了,皆大歡喜。反正現在微軟在中文系統方面也已經沒敵手了,大可不必再拘泥於限制擴張碼的制定。假如那些人也能大力支援的話,相信應該能很快的將新的標準制定出來。
無論如何,假如您仍不想放棄舊的「所見即所得」式的表現法,使用 XP 而尚未安裝過與過去的中國海或是 ETEN extensions 等等包含日文字型相容的工具,例如 Unicode 補完計畫等;也就是說您看不到某些舊 BBS 中的日文字時,願意承受風險的話可以考慮裝裝看上面說的微軟那套。推薦原因:既然是微軟自己出的東西,售後服務多少會好些吧。(根本是妄想…)
2003/9/20 3:54
更詳盡的可參考 Joel on Software
2007/10/6 23:42:37