——張軸材談漢字交換碼標(biāo)準(zhǔn)建立歷程本報(bào)記者 黃偉敏 肖春江
GB2312:漢字信息技術(shù)的秦始皇
GB13000:四海皆準(zhǔn)“書(shū)同文”由于存在各自的利益,日、韓和中國(guó)臺(tái)灣省等國(guó)家和地區(qū)的漢字交換碼標(biāo)準(zhǔn)各唱各的戲,多種聲音雖然顯示“民主”,但給漢字信息交換帶來(lái)了相當(dāng)?shù)幕靵y。80年代中期,西文已在信息高速公路上加速前行,漢字卻仍在信息高速公路上開(kāi)著拖拉機(jī)。 為了取得電腦時(shí)代的“書(shū)同文”,GB13000標(biāo)準(zhǔn),即《信息技術(shù)通用多八位編碼字符集》,滿(mǎn)懷統(tǒng)一大任的使命感,于1992年降臨人世。 GB13000是我國(guó)制定的與國(guó)際標(biāo)準(zhǔn)ISO/IEC 10646對(duì)應(yīng)的標(biāo)準(zhǔn),它標(biāo)志著ISO/IEC 10646標(biāo)準(zhǔn)的漢字編碼部分基本采納了我國(guó)方案。它的制訂,大體上經(jīng)歷了前期的斗爭(zhēng)和后期確立主導(dǎo)地位兩個(gè)階段。 斗爭(zhēng)期(1985年~1990年10月)。國(guó)際標(biāo)準(zhǔn)化組織ISO中主管信息技術(shù)標(biāo)準(zhǔn)制訂的技術(shù)委員會(huì)TC97(后更名為ISO-IEC/JTC1)于1984年底決定立項(xiàng)制訂“雙字節(jié)two-byte)編碼字符集”國(guó)際標(biāo)準(zhǔn),并在其字符集和編碼分委會(huì)SC2下設(shè)立工作組WG2專(zhuān)門(mén)負(fù)責(zé)該項(xiàng)目。 這段時(shí)期,國(guó)際上正因該標(biāo)準(zhǔn)究竟采用16位還是雙八位的編碼結(jié)構(gòu)吵架。我國(guó)贊成采用雙八位,提出漢字基本集和輔助集分別占用編碼空間右下角和左下角的方案。這個(gè)方案在1987年的ISO/TC97/SC2年會(huì)上得以通過(guò),我國(guó)開(kāi)始正式進(jìn)入國(guó)際標(biāo)準(zhǔn)起草階段。 1987年12月電子工業(yè)部決定把“漢字雙八位(多字節(jié))編碼體系(即多八位編碼字符集)研究”列入“七五”國(guó)家重點(diǎn)科技攻關(guān)項(xiàng)目,并立即成立了由電子部十五所、四所和國(guó)家語(yǔ)委等單位組成的攻關(guān)小組。 1988年攻關(guān)小組發(fā)現(xiàn)當(dāng)時(shí)新完成的標(biāo)準(zhǔn)DP 10646工作草案文本中存在兩個(gè)嚴(yán)重問(wèn)題: (1)將祖國(guó)大陸用的漢字和臺(tái)灣省少用的漢字作為兩種文字排列在編碼字符的不同位置,把我國(guó)臺(tái)灣省的標(biāo)準(zhǔn)作為主要參考標(biāo)準(zhǔn)之一,以“中華民國(guó)標(biāo)準(zhǔn)”的名義列入。 (2)將原已商定的我國(guó)漢字占用編碼空間下半平面兩塊的方案改為只占左下塊。 帶著上述問(wèn)題,我國(guó)參加SC2年會(huì)的代表團(tuán)在會(huì)上要求在“多八位編碼字符集”工作草案中去掉并修改有關(guān)我國(guó)臺(tái)灣省的不正確及不恰當(dāng)?shù)男形模暶魑覀儗⒙?lián)合我國(guó)臺(tái)灣省的同行一起討論解決海峽兩岸使用不同編碼標(biāo)準(zhǔn)的問(wèn)題,并研制出統(tǒng)一的中國(guó)漢字字符集納入國(guó)際標(biāo)準(zhǔn)。這一意見(jiàn)被SC2采納。 由于日、韓的堅(jiān)決反對(duì),1990年SC2年會(huì)否決了我國(guó)提出的HCC方案(中、日、韓三國(guó)漢字經(jīng)認(rèn)同后,相同和認(rèn)同的漢字只給一個(gè)代碼,然后按某種順序統(tǒng)一排列。使常用的和次常用的中、日、韓漢字排列在BMP中)。在當(dāng)時(shí)的形勢(shì)下,作為緩沖,國(guó)內(nèi)有關(guān)專(zhuān)家提出了將BMP中的I00、I10和I11區(qū)留空,而將中、日、韓的表意文字分別旋轉(zhuǎn)在各自平面的一種折衷方案。該方案于1990年5月作為國(guó)家提案提交到WG2,獲得通過(guò),并在第一個(gè)DIS文本中采納了該方案。WG2同時(shí)決定:BMP的I01、I10和I11區(qū)將來(lái)旋轉(zhuǎn)中、日、韓三國(guó)同意的C、J、K文字。 此后,我國(guó)暫停了在國(guó)際范圍內(nèi)進(jìn)行中、日、韓漢字統(tǒng)一編碼的理論上的爭(zhēng)論,在組織力量研究中國(guó)漢字字表的同時(shí),啟動(dòng)了緊張的建立“多字符集漢字?jǐn)?shù)據(jù)庫(kù)”的工作,進(jìn)而推進(jìn)從理論到實(shí)踐,從定性到定量,從手工到機(jī)助的轉(zhuǎn)化。 確立主導(dǎo)地位(1990年12月~1993年11月)。1990年11月我國(guó)正式成立了“通用字符集”國(guó)際工作組,由張軸材、王之任副組長(zhǎng),陳力為、傅永和任工作組高級(jí)顧問(wèn),成員共13名,包括了計(jì)算機(jī)系統(tǒng)、軟件、硬件、語(yǔ)言文字及標(biāo)準(zhǔn)化方面的專(zhuān)家及技術(shù)人員。 國(guó)際工作組成立之初便面臨著重大的抉擇。當(dāng)時(shí)ISO拒絕在DIS 10646中采用C、J、K漢字統(tǒng)一編碼,并采用回避C0、C1區(qū)的編碼結(jié)構(gòu)。與此同時(shí),我國(guó)還面臨著世界上將出現(xiàn)兩套標(biāo)準(zhǔn)(UCS和Unicode)的嚴(yán)峻形勢(shì)。國(guó)標(biāo)工作組經(jīng)慎重研究,在短時(shí)間內(nèi)達(dá)成共識(shí),確定了“立足基本中文平面,瞄準(zhǔn)基本多文種平面,注視/溝通Unicode”的方針。 1991年1月20日體現(xiàn)了CJK統(tǒng)一編碼原則的漢字字符集HCS1.0問(wèn)世,國(guó)家技術(shù)監(jiān)督局破例預(yù)先給國(guó)標(biāo)號(hào)GB 13000。 1991年2月至3月在有關(guān)方面努力下,形成了Unicode中的漢字部分UniHan與HCS相互對(duì)齊的協(xié)議,并先后得到中國(guó)國(guó)標(biāo)工作組和Unicode技術(shù)委員會(huì)的批準(zhǔn)。為了真正實(shí)現(xiàn)CJK漢字統(tǒng)一編碼,我國(guó)又參加了CJK-JRG(中日韓聯(lián)合研究組)。1991年7月CJK-JRG的第一次會(huì)議一致確認(rèn)了漢字統(tǒng)一編碼的要求。此后,又選舉我國(guó)的張軸材同志擔(dān)任CJK-JRG的主編兼召集人,從而確立了我國(guó)在CJK-JRG中的主導(dǎo)地位。 1991年8月,WG2在日內(nèi)瓦舉行了第20次會(huì)議,確認(rèn)了CJK漢字統(tǒng)一編碼進(jìn)入BMP。我國(guó)提交的GB 13000漢字字符集HCSA2.1版作為工作起點(diǎn),已在ISO文件記錄在案。以后,1991年12月初我國(guó)如期向ISO提交了CJK統(tǒng)一漢字字符集第一版(CJK V1.0)。1992年4月25日提交了CJKV2.0。至此,ISO/IEC 10646.1中的漢字編碼部分勝利完成。 由于ISO/IEC 10646.1是一個(gè)多文種的編碼標(biāo)準(zhǔn),因此除漢字外,ISO/IEC 10646.1中已將我國(guó)維、哈、柯文的字收入阿拉伯文;將我國(guó)朝鮮文字符與韓國(guó)文字符進(jìn)行了統(tǒng)一編碼;而蒙文、藏文和彝文等還有待今后擴(kuò)充收入ISO/IEC 10646(GB 13000)中。 1992年4月至7月,我國(guó)又應(yīng)ISO及AFII(國(guó)際字型交換協(xié)會(huì),負(fù)責(zé)ISO/IEC 10646.1中字表的印刷工作)的要求,提交可供印刷ISO/IEC 10646.1中G屬下漢字的48×48點(diǎn)陣字型。 至此,國(guó)際標(biāo)準(zhǔn)ISO/IEC 10646.1及對(duì)應(yīng)的國(guó)家標(biāo)準(zhǔn)GB 13000.1中的漢字編碼及字型開(kāi)發(fā)工作告一段落,而下一階段的編碼結(jié)構(gòu)擴(kuò)充方案及字匯擴(kuò)充方案的研制工作,也已馬不停蹄地展開(kāi)。 |
|
|
來(lái)自: Ralf_Jones > 《其它》