|
"津雲"客戶端 |
|||
貌不驚人『的』使用頻率最高
『氾仝甯』等怎麼進的8300
醞釀多年的《通用規范漢字表》終於對外公示。
為什麼要制定字表?字表中的漢字是如何篩選出來的?怎樣規范地使用漢字?圍繞這些問題,本報記者對主要設在北京師范大學的《通用規范漢字表》後期研制工作組進行了獨家專訪,揭開字表中8300個通用規范漢字背後的『秘密』。
八年甄選8300個漢字此次公示的《通用規范漢字表》,一共收錄了8300個漢字,共分為三級。
早在1988年,我國便出臺了《現代漢語通用字表》(收字7000個)和《現代漢語常用字表》(收字3500個);時隔21年之後,為何要重新制定《通用規范漢字表》?對此北京師范大學文學院王立軍教授表示,這主要是因為在信息化時代之下,人們的語言生活發生了巨大變化。
『任何規范都只適用於特定的時期,需要隨著時代的發展而進行改革。』王立軍教授解釋說,原有的規范在當時指導人們用字發揮了重要的作用,但是由於當時的技術局限性,規范中也有一些疏漏,比如個別進入常用字的字通行度不高。另外,不同部門先後發布的規范,內容上並不完全一致,需要重新進行整合和優化。
《通用規范漢字表》研制項目從2001年啟動,歷時8年纔得以完成。專家學者們已經充分研究了我國自1955年以來編制的多個原有字表的規范原則,並基本清理了歷史遺留的用字規范問題。值得一提的是,此次發布的字表作為規范標准,是在《中華人民共和國通用語言文字法》發布後所制定的,它具有法律效應。
字表發布後並非一勞永逸。王立軍教授表示,研制工作組已經考慮到了今後對字表進行修訂的計劃。按照目前的設想,有關部門今後將對字表『三年一小修,十年一大修』,根據字表的實際使用情況和社會需求的變化,適時地對字表進行微調。
每個規范字都有來歷能夠入選一、二級字表的漢字,是根據其使用頻率來確定的。專家們采用了9個信息龐大的『語料庫』的數據進行了統計。據北師大文學院講師卜師霞介紹,最為主要的兩個語料庫是『國家語委現代漢語平衡語料庫』和『北京語言大學現代新聞媒體動態流通語料庫』,收錄的漢字量分別為9100萬和3.5億。
『僅現代漢語平衡語料庫中,不重復的漢字就有8181個。』卜師霞老師介紹說,這個語料庫中涵蓋了從1919年至2002年的大量文字資料,除了報刊書籍、政府公文等印刷物和出版品外,就連並不起眼的產品說明書和廣告中的用字情況,也都一並囊括其中。
使用頻率最高的漢字究竟是哪個字?在對語料庫進行統計時,專家學者們也掌握到了這個並不為人所知的有趣細節。教育部語言文字應用所的王曉明老師經過統計後發現,貌不驚人的『的』字在漢字中使用頻率最高,在語料庫中出現的次數,竟然高達169萬多次。
『《通用規范漢字表》中收錄的每個字,都有明確的來歷。』北師大文學院講師凌麗君說,漢字中有大量的異體字存在,為了確保字表中收錄漢字的規范性,研制工作組的專家學者們對每個漢字的出處、正異對應關系都進行了檢索和考證,為此甚至查遍了包括《四庫全書》在內的典籍文獻。