小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

GB2312的編碼規(guī)則

 秋風(fēng)00 2010-07-06
GB2312的編碼規(guī)則 收藏
        GB2312標(biāo)準(zhǔn)共收錄6763個漢字,其中一級漢字3755個,二級漢字3008個;同時,GB2312收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄羅斯語西里爾字母在內(nèi)的682個全形字符。           
        GB2312的出現(xiàn),基本滿足了漢字的計算機處理需要,它所收錄的漢字已經(jīng)覆蓋99.75%的使用頻率。GB2312中對所收漢字進行了“分區(qū)”處理,每區(qū)含有94個漢字/符號。這種表示方式也稱為區(qū)位碼。          
         01-09區(qū)為特殊符號。          
         16-55區(qū)為一級漢字,按拼音排序。           
         56-87區(qū)為二級漢字,按部首/筆畫排序。          
         10-15區(qū)及88-94區(qū)則未有編碼。        
        舉例來說,“啊”字是GB2312之中的第一個漢字,它的區(qū)位碼就是1601。字節(jié)結(jié)構(gòu)在使用GB2312的程序中,通常采用EUC儲存方法,以便兼容于ASCII。每個漢字及符號以兩個字節(jié)來表示。第一個字節(jié)稱為“高位字節(jié)”,第二個字節(jié)稱為“低位字節(jié)”。 “高位字節(jié)”使用了0xA1-0xF7(把01-87區(qū)的區(qū)號加上0xA0),“低位字節(jié)”使用了0xA1-0xFE(把01-94加上0xA0)。例如“啊”字在大多數(shù)程序中,會以0xB0A1儲存。(與區(qū)位碼對比:0xB0=0xA0+16,0xA1=0xA0+1)。       
           所以GB2312編碼中漢字區(qū)碼的十進制是從176到247,位碼是從161到255.之所以存儲了6763小于82*94=6768,是因為在區(qū)碼為215,位碼為250-254之間共五個編碼沒有漢字編碼,所以6768-5=6763個。
 
本文來自CSDN博客,轉(zhuǎn)載請標(biāo)明出處:http://blog.csdn.net/HEROWANG/archive/2008/06/10/2532339.aspx

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多