| 轉(zhuǎn)貼自五筆愛(ài)好者論壇 原作者:wb_lover 說(shuō)到動(dòng)態(tài)碼長(zhǎng),其實(shí)和拼音整句輸入有一定聯(lián)系。 動(dòng)態(tài)碼長(zhǎng),將輸入法從固定碼長(zhǎng)和碼表這個(gè)原先受限于系統(tǒng)平臺(tái)和開(kāi)發(fā)程序的框框中解放出來(lái),它的實(shí)質(zhì),就是讓輸入變得自由、省心。 ①五筆使用者或字詞方式者,可認(rèn)為動(dòng)態(tài)碼長(zhǎng)是對(duì)固定編碼長(zhǎng)度這一規(guī)則的突破和拓展,大大擴(kuò)展了編碼空間和減少了重碼率; ②整句愛(ài)好者或短句輸入習(xí)慣者,則可認(rèn)為這是對(duì)整句輸入中的細(xì)部分析研究,可更好的促進(jìn)整句輸入的正確率,培養(yǎng)好的識(shí)字、斷句方式,使得輸入更自然流暢。 總體看來(lái),讓輸入越來(lái)越省心,讓使用的人從不必要的記憶中解放出來(lái),是輸入法不可逆轉(zhuǎn)的趨勢(shì)。長(zhǎng)期看來(lái),輸入法可以不同,輸入方式卻越來(lái)越會(huì)趨于一同。大概動(dòng)態(tài)碼長(zhǎng)會(huì)是其中熔合的重要過(guò)渡吧。 《雙拼研究》目錄 一、綜合研究 十二種雙拼編碼圖解 走馬觀花雙拼編碼 簡(jiǎn)拼與雙拼的兼容 零聲母設(shè)置小技巧 雙拼及拼音漫談 戲說(shuō)雙韻組合 使用雙拼時(shí)簡(jiǎn)拼與混拼的奧秘 簡(jiǎn)析新華拼音 對(duì)文字碼的一點(diǎn)小建議 二、徐氏雙拼 最順手的雙拼方案 雙拼編碼問(wèn)題研究(簡(jiǎn)版) 徐氏雙拼新版改進(jìn)說(shuō)明 《徐氏雙拼》新版改進(jìn)內(nèi)容說(shuō)明 《徐氏雙拼》新版鍵位設(shè)置說(shuō)明 呼喚全國(guó)統(tǒng)一的雙拼編碼方案 這里想利用以下資料對(duì)AhMan先生所提出的雙拼編碼問(wèn)題展開(kāi)來(lái)討論,以?huà)伌u引玉。 Flzt根據(jù)北京語(yǔ)言大學(xué)字詞頻資料進(jìn)行匯總,以下是統(tǒng)計(jì)數(shù)據(jù): 單字 9821 單字 16.1 8.9 雙字 32053 雙字 52.5 三字 7257 三字 11.9 四字 11500 四字 18.8 五字 232 五字 0.4 六字 110 六字 0.2 七字 107 七字 0.2 八字 10 八字 0 九字 2 九字 0 純?cè)~條 51271 去生字詞條 56271 (單字以5000計(jì)) 詞條 61092 詞條 61092 雙拼編碼的效率問(wèn)題 一、雙拼單字編碼 普通雙拼方案,單字編碼空間為26×26=676,拼音的音節(jié)數(shù)為424(為實(shí)際可用的空間)。 ①有676-424=252個(gè)編碼空間未利用,故單字重碼率遠(yuǎn)高于五筆等形碼(假設(shè)五筆也用兩碼為單字編碼)。 ②各音節(jié)所對(duì)應(yīng)漢字?jǐn)?shù)相差懸殊,極不均衡,部分音節(jié)漢字生僻,故每一空間首位的常用單字不足400個(gè)。 結(jié)論:盡管雙拼相對(duì)于全拼是高效的。正如阿門(mén)大師所說(shuō),單字仍是拼音的軟肋。 二、雙拼詞編碼 ①詞(含單字詞)分布結(jié)構(gòu):三字及以上詞的比例約占1/3,按紫光的編碼方式(每字兩碼,一聲一韻),重碼率很低,基本可以盲打。單字占16%,參與統(tǒng)計(jì)的單字?jǐn)?shù)近萬(wàn);實(shí)際上常用者約5千左右,按此統(tǒng)計(jì)的比例為8.9%。雙字詞約占52%,碼長(zhǎng)為4;數(shù)量多,碼長(zhǎng)短,重碼率很高(與三字以上詞相比),是編碼的難點(diǎn),也是我們討論的重點(diǎn)。 ②雙字詞的正常編碼空間利用率:按拼音加加和自然碼的編碼規(guī)則(主要是零聲母處理),雙拼編碼空間為26的平方,比五筆大(25的平方),且五筆單字編碼占據(jù)了部分空間;但拼音的不均衡造成編碼利用率偏低;兩相抵消,估計(jì)總體利用率差別不大。 ③雙字詞的附加編碼空間(本帖主要內(nèi)容):混拼,碼長(zhǎng)為3,編碼空間為26的3次方(17576),這一部分空間在形碼方案中有相當(dāng)大的部分被單字所占據(jù),在雙拼中全部被混拼所用;混拼很有規(guī)律,無(wú)需死記混拼簡(jiǎn)碼(相當(dāng)于詞的二級(jí)簡(jiǎn)碼),在使用中就能熟練掌握。單字編碼所空余的252個(gè)空間,通常用作詞的一級(jí)簡(jiǎn)碼(即簡(jiǎn)拼),可安排200余個(gè)最常用的雙字詞(按紫光的編碼規(guī)則,這部分內(nèi)容不易掌握)。 綜合上述內(nèi)容,在雙字詞的編碼空間方面,拼音比五筆等形碼要寬余;平均碼長(zhǎng)(介于3-4之間)及重碼率指標(biāo)均優(yōu)于五筆。 三、單字詞輸入分析 按詞輸入的方式使很多高頻的單字也融入詞中,只有那些組詞困難的單字需用單字方式輸入。如紫光的一級(jí)簡(jiǎn)碼y就對(duì)應(yīng)“以”而不是“一”。這使單字輸入的幾率大大減少。 故,按詞輸入是拼音輸入法的優(yōu)勢(shì)和特色。 四、其它 ①單字加形:自然碼、拼音加加、譚碼、夢(mèng)碼、自然二筆(學(xué)尚易)、我的雙雙碼等。譚碼是聲稱(chēng)可以盲打的。單字輸入幾率降低,但對(duì)輸入效率仍有很大影響,單字加形不失為一種解決辦法。為避免與簡(jiǎn)拼混拼沖突,拼音加加采用Tab鍵對(duì)單字形碼分流,效率仍不及五筆等。至于加什么“形”更合適,仍值得進(jìn)一步探索。 
②生字查詢(xún):?jiǎn)巫旨有蔚牧硪缓锰幨悄茌斎肷ё?,還可以“以形查音”。這種情況很少遇到,我是在使用拼音輸入法一年后才遇到了一個(gè)不認(rèn)識(shí)的生字詞:柘城,這是河南的一個(gè)縣名。但在特殊場(chǎng)合,如錄入古文,拼音輸入法是無(wú)法勝任的。 最后結(jié)論:一個(gè)精心設(shè)計(jì)的以雙拼為主的輸入法,在效率方面和五筆等形碼不會(huì)有太大的差距。 無(wú)論是傳統(tǒng)的雙拼,還是單字加形分流的雙拼,其雙字詞的編碼指標(biāo)都高于五筆等形碼,完全避免了和單字編碼的沖突。換言之,雙字詞的高效是以單字詞的低效為代價(jià)的,雙字詞在一定程度上彌補(bǔ)了單字的不足。只站在詞或字的立場(chǎng)上看問(wèn)題,是有失偏頗的。 
 | 
|  | 
來(lái)自: 幽夢(mèng)清影 > 《待分類(lèi)1》