小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

DB2中創(chuàng)建漢字拼音首字母的SQL函數(shù)

 Icyhu 2008-03-20
DB2中創(chuàng)建漢字拼音首字母的SQL函數(shù)
作者:佚名    點擊數(shù):457    文章來源:天極論壇整理    更新時間:2007-9-28
 

  需求

  有些時候我們會有這樣的需求,要求使用字母從a至z對一組數(shù)據(jù)進行索引,如果數(shù)據(jù)的格式全部是半角的英文則很容易實現(xiàn),但若是對一組中文數(shù)據(jù)進行索引則會引起一點小的麻煩,數(shù)據(jù)在錄入db2數(shù)據(jù)庫的時候可能并沒有指定一個索引字母,這就要求應(yīng)用程序可以自動生成用于索引的信息。

  一般對于中文數(shù)據(jù)的索引,采用詞組的首漢字拼音的首字母,例如:

詞組 索引字母
            --- -----
            熊貓 x
            白暨豚 b
            藏野驢 z

  在DB2中并沒有提供相應(yīng)的函數(shù)可以取得漢字拼音的首字母,我們可以利用數(shù)據(jù)庫針對中文字符集的排序功能創(chuàng)建一個這樣的函數(shù)。

  工作原理

  我們知道在使用中文字符集的數(shù)據(jù)庫中,當(dāng)你對一列中文數(shù)據(jù)使用order by 排序時,排序的結(jié)果正是按照每行記錄第一個漢字的拼音首字母進行排列的,那么我們需要想辦法取得這個字母。

  但是數(shù)據(jù)庫內(nèi)部是如何做到這一點的呢?以中文字符集GBK為例,讓我們查看一下GBK字符集的內(nèi)碼表,我們僅摘出一段:

0 1 2 3 4 5 6 7 8 9 A B C D E F
            B040 癅 癆 癇 癈 癉 癊 癋 癎 癏 癐 癑 癒 癓 癕 癗 癘
            B050 癙 癚 癛 癝 癟 癠 癡 癢 癤 癥 癦 癧 癨 癩 癪 癬
            B060 癭 癮 癰 癱 癲 癳 癴 癵 癶 癷 癹 発 發(fā) 癿 皀 皁
            B070 皃 皅 皉 皊 皌 皍 皏 皐 皒 皔 皕 皗 皘 皚 皛
            B080 皜 皝 皞 皟 皠 皡 皢 皣 皥 皦 皧 皨 皩 皪 皫 皬
            B090 皭 皯 皰 皳 皵 皶 皷 皸 皹 皺 皻 皼 皽 皾 盀 盁
            B0A0 盃 啊 阿 埃 挨 哎 唉 哀 皚 癌 藹 矮 艾 礙 愛 隘
            B0B0 鞍 氨 安 俺 按 暗 岸 胺 案 骯 昂 盎 凹 敖 熬 翱
            B0C0 襖 傲 奧 懊 澳 芭 捌 扒 叭 吧 笆 八 疤 巴 拔 跋
            B0D0 靶 把 耙 壩 霸 罷 爸 白 柏 百 擺 佰 敗 拜 稗 斑
            B0E0 班 搬 扳 般 頒 板 版 扮 拌 伴 瓣 半 辦 絆 邦 幫
            B0F0 梆 榜 膀 綁 棒 磅 蚌 鎊 傍 謗 苞 胞 包 褒 剝

  可以看到從B0A0-1 開始,至B0C0-5,是拼音A開頭的漢字,恰好是按照拼音字母的先后順序排列,并且把音調(diào)的因素也考慮進去了,由此,可以推斷出,數(shù)據(jù)庫在GBk編碼的數(shù)據(jù)庫中對漢字進行排序,即是依照字符內(nèi)碼表的編碼進行的。

  我們把B0C0-5 位置的漢字記錄下來,即“澳”字,這是以“a”拼音開頭在內(nèi)碼表中排列在最后的漢字,用同樣的方法,我們找出所有以拼音從b至z開頭,在內(nèi)碼表中排列在最后的漢字,與26個字母的對應(yīng)關(guān)系如下:

‘澳‘ a
            ‘怖‘ b
            ‘錯‘ c
            ‘墮‘ d
            ‘貳‘ e
            ‘咐‘ f
            ‘過‘ g
            ‘禍‘ h
            i
            ‘駿‘ j
            ‘闊‘ k
            ‘絡(luò)‘ l
            ‘穆‘ m
            ‘諾‘ n
            ‘漚‘ o
            ‘瀑‘ p
            ‘群‘ q
            ‘弱‘ r
            ‘所‘ s
            ‘唾‘ t
            u
            v
            ‘誤‘ w
            ‘迅‘ x
            ‘孕‘ y
            ‘座 z

  注:沒有以‘i‘,‘u‘,‘v‘開頭的漢語拼音。

  現(xiàn)在假若我們拿出任何一個漢字,放在我們挑選出的這些漢字中間,利用數(shù)據(jù)庫進行一次使用GBK字符集的排序,我們便能夠根據(jù)這個漢字排列的相對位置得到其拼音首字母。

  利用sql語句生成一組上述漢字的結(jié)果集,我們將‘i‘,‘u‘,‘v‘ 三個空缺漢字的位置補上了上一個拼音的漢字,

select t1.strChn
            from ( select ‘澳‘ strChn from sysibm.sysdummy1
            union all
            select ‘怖‘ strChn from sysibm.sysdummy1
            union all
            select ‘錯‘ strChn from sysibm.sysdummy1
            union all
            select ‘墮‘ strChn from sysibm.sysdummy1
            union all
            select ‘貳‘ strChn from sysibm.sysdummy1
            union all
            select ‘咐‘ strChn from sysibm.sysdummy1
            union all
            select ‘過‘ strChn from sysibm.sysdummy1
            union all
            select ‘禍‘ strChn from sysibm.sysdummy1
            union all
            select ‘禍‘ strChn from sysibm.sysdummy1
            union all
            select ‘駿‘ strChn from sysibm.sysdummy1
            union all
            select ‘闊‘ strChn from sysibm.sysdummy1
            union all
            select ‘絡(luò)‘ strChn from sysibm.sysdummy1
            union all
            select ‘穆‘ strChn from sysibm.sysdummy1
            union all
            select ‘諾‘ strChn from sysibm.sysdummy1
            union all
            select ‘漚‘ strChn from sysibm.sysdummy1
            union all
            select ‘瀑‘ strChn from sysibm.sysdummy1
            union all
            select ‘群‘ strChn from sysibm.sysdummy1
            union all
            select ‘弱‘ strChn from sysibm.sysdummy1
            union all
            select ‘所‘ strChn from sysibm.sysdummy1
            union all
            select ‘唾‘ strChn from sysibm.sysdummy1
            union all
            select ‘唾‘ strChn from sysibm.sysdummy1
            union all
            select ‘唾‘ strChn from sysibm.sysdummy1
            union all
            select ‘誤‘ strChn from sysibm.sysdummy1
            union all
            select ‘迅‘ strChn from sysibm.sysdummy1
            union all
            select ‘孕‘ strChn from sysibm.sysdummy1
            union all
            select ‘座‘ strChn from sysibm.sysdummy1
            ) as 
t1

  實現(xiàn)

  接下來很方便的就可以寫出這個函數(shù)的具體實現(xiàn),在實現(xiàn)的代碼中,我們又加入了針對英文字母的處理,函數(shù)編譯后,可通過如下方式調(diào)用:

select getIndex( ‘索‘ ) index from dual;
            index
            ------
            f

  實際使用中,應(yīng)注意建立數(shù)據(jù)庫時字符集參數(shù)的設(shè)置,應(yīng)使用GBK字符集。

  應(yīng)用以下命令查看已建立數(shù)據(jù)庫的字符集:

DB2 connect to db_name user user_name using passWord
            db2 get db cfg | grep -i ‘code set‘

  此參數(shù)在數(shù)據(jù)庫建立之后不能修改。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多