|
1988年,國家語委和國家教委就發(fā)布了《現(xiàn)代漢語常用字表》,該字表包括常用字2500個,次常用字1000個,共計3500個。根據(jù)語料統(tǒng)計,對200萬字語料分析統(tǒng)計后發(fā)現(xiàn),2500個常用字覆蓋率竟然達(dá)到97.97%,而次常用字覆蓋率為1.51%。也就是說3500個漢字的使用覆蓋率達(dá)到了99.48%,其占比相當(dāng)驚人。因此,我們說掌握3500字就可以做個文化人了。 但是,我們卻發(fā)現(xiàn)字典收字卻達(dá)到了驚人的地步。清代的《康熙字典》收字達(dá)到47000多個。1915年歐陽博存編寫的《中華大字典》達(dá)到48000多字。1959年日本人諸橋轍次編寫的《大漢和辭典》,漢字多達(dá)49964個。1971年張其昀的《中文大辭典》也達(dá)到了49888字,直逼50000字大關(guān)。到上個世紀(jì)90年代徐中舒和冷玉龍分別編寫的《漢語大字典》和《中華字?!肥兆志统^了五萬,分別是54678字和85000字,看到數(shù)字就嚇出一身汗。 這些字典收字已經(jīng)達(dá)到了驚人的數(shù)量,恐怕找不到一個人能完全掌握這些字。這些字典收錄的字多數(shù)已經(jīng)不用了,不少字只是在歷史上出現(xiàn)過,后來再也沒有露面,最后就成了只是活在字典里的漢字,我們也稱為“死字”。 如今我們的常用漢字定為3500字,比較巧合的是,古代人常用的漢字也大致為這個數(shù)字。有人做過統(tǒng)計,統(tǒng)計的材料為十三經(jīng),統(tǒng)計結(jié)果認(rèn)為先秦用字總量大概為7000字,但是通用字約為3500字。其具體統(tǒng)計數(shù)據(jù)如下: 《詩經(jīng)》共計29646字,不重復(fù)單字為2939字。 《尚書》共計24538字,不重復(fù)單字為1938字。 《易經(jīng)》共計20991字,不重復(fù)單字為1595字。 《論語》共計15918字,不重復(fù)單字為1512字。 《孟子》共計35377字,不重復(fù)單字為1959字。 《禮記》共計99008字,不重復(fù)單字為2367字。 《春秋三傳》共計245838字,不重復(fù)單字為3912字。 通過統(tǒng)計,我們發(fā)現(xiàn)十三經(jīng)中的著作單字?jǐn)?shù)量多數(shù)在1500到3000之間。那我們現(xiàn)在掌握3500個漢字能閱讀大部分雜志和報刊,其實現(xiàn)代不少經(jīng)典著作的單字?jǐn)?shù)量也很少超過三千的。比如: 《毛澤東選集》(1-4卷)共計659928字,不重復(fù)漢字為2981個。 矛盾《子夜》不重復(fù)單字為3129個。 老舍《駱駝祥子》不重復(fù)單字為2413個。 曹禺《雷雨》、《日出》、《北京人》所用單字為2808個。 趙樹理《三里灣》不重復(fù)單字為2069個。 *參閱文獻(xiàn)《漢字五千年》。歡迎批評,如果感興趣,請點擊訂閱關(guān)注本頭條號,與您相識在字里行間! |
|
|