創(chuàng)建筆畫(huà)數(shù)字模式,探索漢字新的字序
漢字是中國(guó)人發(fā)明的記錄漢語(yǔ)的文字書(shū)寫(xiě)系統(tǒng),也是世界上唯一被沿用至今的古老文字,在漫長(zhǎng)的歷史過(guò)程中,人們不斷的創(chuàng)造新的漢字以滿(mǎn)足生產(chǎn)和生活的需要,有的字義也會(huì)隨之變化。漢字的詞匯義項(xiàng)眾多,通用假借頻繁,初學(xué)者不易把握字義,因此提供音韻、注解、例句等等的工具書(shū)運(yùn)用而生。
《說(shuō)文解字》是由東漢文字學(xué)家許慎于公元121年編著而成的,它開(kāi)創(chuàng)了部首檢字的先河,經(jīng)唐宋明清等幾個(gè)朝代都對(duì)部首排檢法做過(guò)多次的改進(jìn)。此后的1900多年里,人們一直不斷地探究著更簡(jiǎn)易、更合理、更巧妙的漢字排序法……
當(dāng)前,字典和辭書(shū)常用的是音序排列法、部首筆畫(huà)排列法、號(hào)碼排列法。
1.音序排列法,同音字的排序有分歧,不知讀音的字是無(wú)法檢索的。
2.部首排列法,無(wú)論在立部還是歸部都未統(tǒng)一。查一個(gè)字要分別在部首目錄、檢字表、正文三個(gè)區(qū)域?qū)ふ也拍芡瓿伞?/span>
3.筆畫(huà)排列法,相同筆畫(huà)數(shù)的漢字存在二義性。
4.號(hào)碼排列法,筆形和代碼之間沒(méi)有理?yè)?jù),規(guī)則比較復(fù)雜,重碼字較多。
現(xiàn)行的排檢法都或多或少的有些缺點(diǎn),根據(jù)多年的實(shí)踐和研究,我們提出一種新的“筆畫(huà)形狀數(shù)字模式”。
一、筆畫(huà)形狀的數(shù)字模式
現(xiàn)行漢字的筆畫(huà)形狀分類(lèi)方法很多,最常見(jiàn)一種分類(lèi)是將筆形分為31個(gè),其中包括基本筆形6個(gè)和派生筆形25個(gè)。
目前,現(xiàn)行的漢字筆畫(huà)分類(lèi)、命名還不統(tǒng)一,有把二三十種筆形歸入“橫、豎、撇、捺、折”五種基本筆畫(huà)類(lèi)型的,還有個(gè)別筆形歸類(lèi)不當(dāng)?shù)膯?wèn)題(如把“豎鉤”歸入“豎”)。為了呈現(xiàn)內(nèi)聚、均勻的風(fēng)格,在有些字中有的筆畫(huà)要發(fā)生形變,規(guī)范字形中筆畫(huà)形變?nèi)我庑缘默F(xiàn)象時(shí)有發(fā)生,這表明我們?cè)诠P畫(huà)這個(gè)層次上整理工作做得不細(xì),規(guī)范水平還有待提高。
剛開(kāi)始研究漢字時(shí),因整理分類(lèi)筆畫(huà)、編寫(xiě)記憶口訣而陷入泥淖,掙扎在漫長(zhǎng)的瓶頸期內(nèi)……后來(lái),經(jīng)過(guò)認(rèn)真思考、熱烈討論、仔細(xì)研判,我們像考古隊(duì)員一樣,將斷裂、散亂且有殘缺的幾十個(gè)漢字筆畫(huà)修復(fù)、整理成(4大脈系)10串“(邏輯)鏈條”,并組建一個(gè)有理?yè)?jù)性的漢字筆畫(huà)形狀數(shù)字模式。
筆畫(huà)形狀分類(lèi)分級(jí)示意圖的詮釋及主要特點(diǎn):
1.左側(cè)的第0、1、2、3組筆畫(huà)形狀的尾梢是順時(shí)針旋轉(zhuǎn),右側(cè)的第4、5、6、7、8、9組的筆畫(huà)形狀的尾梢是逆時(shí)針旋轉(zhuǎn)。
2.(左側(cè)的)第0組與(右側(cè)的)第4組的筆畫(huà)形狀其左右大致對(duì)稱(chēng)的。第1組與(整體順時(shí)針旋轉(zhuǎn)90o的)第6組也是左右大致對(duì)稱(chēng)的;同理,對(duì)照第2組與第7組、第3組與第8組也是如此。
3.從筆畫(huà)形狀的外部輪廓上看,整齊一致,協(xié)調(diào)美觀。10個(gè)組的圖形都有著高度的相似性。
4.同一組的筆畫(huà)形狀有依次遞增的明顯特征。
5.依據(jù)分類(lèi)、分級(jí)關(guān)系,只要記住4個(gè)筆畫(huà)(即第0、1、4、6組的第1個(gè)筆畫(huà)),再借用聯(lián)想方法,便能記住每個(gè)筆畫(huà)的形狀所在位置及其排列順序。
看,這一排排、一摞摞筆畫(huà)就像超市貨架上擺放的“香蕉”,順溜、整齊又好看。假如你想,從中隨機(jī)選取兩個(gè)筆畫(huà)并互換一下位置,就會(huì)有亂套和不適的感覺(jué)。這說(shuō)明,筆畫(huà)形狀的確有自然天成之美。
二、筆畫(huà)的標(biāo)號(hào)、代號(hào)和名稱(chēng)
“據(jù)形系聯(lián)”(許慎語(yǔ)),這句話現(xiàn)用于區(qū)分筆畫(huà)上也很合適的。我們以“相同尾梢”作為標(biāo)準(zhǔn)來(lái),先劃分筆畫(huà)的類(lèi)別,同類(lèi)中再按照筆畫(huà)形狀的折點(diǎn)數(shù)量、單體長(zhǎng)度來(lái)排列次序,并編制了筆畫(huà)的標(biāo)號(hào)、代號(hào)、名稱(chēng)表。
筆畫(huà)的標(biāo)號(hào)、代號(hào)、名稱(chēng)表(表1)的說(shuō)明:
橫向疊層的有10個(gè)組,縱向并列的有5個(gè)級(jí)(組內(nèi)序號(hào)),全表共50(10×5)個(gè)筆畫(huà)。其中“(現(xiàn)行)筆畫(huà)”25個(gè),占位率50%;“準(zhǔn)筆畫(huà)”(筆畫(huà)家族的“新生兒”,當(dāng)前為預(yù)備梯隊(duì))22個(gè),占位率44%;“泛筆畫(huà)”(前兩項(xiàng)之和;文中多用此義)47個(gè),占位率94%;還有空位(L1、Y1、F1有名無(wú)實(shí)的)3個(gè),占位率為6%。
第0組5個(gè)筆畫(huà),對(duì)應(yīng)的標(biāo)號(hào)(左上角)是01、02、03、04、05;對(duì)應(yīng)的代號(hào)(右上角)是P1、P2、P3、P4、P5;對(duì)應(yīng)的名稱(chēng)(左下角)是撇一、撇二、撇三、撇四、撇五。其余的9個(gè)組也以此類(lèi)推。
每一個(gè)筆畫(huà)都是兩位數(shù)字的標(biāo)號(hào),它由組號(hào)、級(jí)號(hào)組成,組號(hào)在十位上、級(jí)號(hào)在個(gè)位上(這里的標(biāo)號(hào)也具有序號(hào)功效);代號(hào)由該筆畫(huà)的拼音首字母、組內(nèi)序號(hào)兩項(xiàng)組成;名稱(chēng)由該組名、組內(nèi)序號(hào)兩項(xiàng)組成。
標(biāo)注*的筆畫(huà)有P1、P2、P5、S1、S2、S3、X2、X4、L2、L4、D1、D2、D3、H1、H2、Y3、F3、T2、T4共19個(gè),可作有些漢字的第一筆;未標(biāo)注的筆畫(huà)則不能用作漢字的第一筆。
筆畫(huà)全集、例字表(表2)中筆畫(huà)折點(diǎn)樣式的解讀:(表2 圖片來(lái)源:作者自繪)
1.折點(diǎn)之處有停頓,通常是墨跡加重、加寬(最常見(jiàn)的一種)。如:“又”的第1筆的折點(diǎn)、“臺(tái)”的第1、4筆的兩個(gè)折點(diǎn)。
2.折點(diǎn)之處無(wú)明顯的折角(也稱(chēng)作“彎”),書(shū)寫(xiě)時(shí)不做停頓、平滑而過(guò)。如:“兒”的第2筆的第1個(gè)折點(diǎn)、“朵”的第2筆的第2個(gè)折點(diǎn)。
3.折點(diǎn)之前由粗變細(xì)、之后由細(xì)變粗,折點(diǎn)在最細(xì)的部位。如:“隊(duì)”(左耳刀旁)的第1筆的第2折點(diǎn),尤其是“巡”的第1、2、3筆的折點(diǎn)(在印刷宋體里似連非連,有的手寫(xiě)楷體則是完全分開(kāi)的)。
4.折點(diǎn)的重疊區(qū)域有意延長(zhǎng)、墨跡似有“漂移”的現(xiàn)象,如:“鄉(xiāng)”(1畫(huà)字)的第2、4折點(diǎn)、“之”(2畫(huà)字)的第2筆的第2折點(diǎn)、“專(zhuān)”(3畫(huà)字)的第3筆的第3折點(diǎn)、“水”(3畫(huà)字)的第3筆的折點(diǎn)。本條放寬了“折點(diǎn)”的定義范圍,也因此產(chǎn)生了“準(zhǔn)筆畫(huà)”,并使“泛筆畫(huà)”的總數(shù)量大幅的增加。
增加了幾個(gè)一筆畫(huà),如:N2、N3、N5、D3、D4等等,還有兩個(gè)一筆畫(huà)成了單體的漢字:“了”(L4)、“鄉(xiāng)”(P5)。
有些漢字的筆畫(huà)數(shù)量有所減少,如“紅”的筆畫(huà)數(shù)從6畫(huà)變成5畫(huà)、“饗”的從12畫(huà)變成9畫(huà)。
請(qǐng)注意:“マ”與“厶”,看似有些相像,其實(shí)二者的筆畫(huà)數(shù)不一樣?!哎蕖笔且还P畫(huà);“ㄙ”是由、“ ”和“丶”組合的,書(shū)寫(xiě)時(shí)中間要有一收筆(筆尖離開(kāi)紙張),不是一筆畫(huà),它的筆畫(huà)數(shù)是兩個(gè)。
三、用筆畫(huà)的標(biāo)號(hào)給漢字排序
兩個(gè)或兩個(gè)以上的漢字列放在一起就有一個(gè)排隊(duì)、排序的問(wèn)題。
漢字查字法或稱(chēng)排檢法,從編者方而來(lái)說(shuō)是排序,從使用者方而來(lái)說(shuō)是檢索。排序要合理、簡(jiǎn)易、科學(xué),檢索才能輕松、準(zhǔn)確、快捷,甚至,僅依靠掃視(直接翻頁(yè)尋找)就能查到要查的字。
2021年3月1日,教育部、國(guó)家語(yǔ)委聯(lián)合發(fā)布實(shí)施的《通用規(guī)范漢字筆順規(guī)范》(GF0023-2020),為社會(huì)通用層面的漢字教學(xué)與研究、信息處理、排序檢索、辭書(shū)編纂等提供重要依據(jù)。
一個(gè)漢字,先按筆順排列其全部的筆畫(huà),并在每個(gè)筆畫(huà)上面加注其相應(yīng)的標(biāo)號(hào),再把這些標(biāo)號(hào)串聯(lián)起來(lái)就是該字的序號(hào)(相當(dāng)于該字的身份證號(hào)碼)。
排序規(guī)則:選出定量的漢字,先對(duì)比以上漢字的第1個(gè)筆畫(huà)的(兩位數(shù))標(biāo)號(hào),按標(biāo)號(hào)從小到大的排序。如果有幾個(gè)漢字的第1個(gè)筆畫(huà)的標(biāo)號(hào)相同,就對(duì)比它們的第2個(gè)筆畫(huà)的標(biāo)號(hào),照樣從小到大的排序。以此類(lèi)推,直到把選出的全部漢字都排序結(jié)束為止。
也可以用代號(hào)給漢字排序,代號(hào)排序和標(biāo)號(hào)排序的規(guī)則大致相仿。這兩種排序方法得出的漢字順序是一模一樣的。
舉例:
中:丨(11、S1)、┐(12、S2)、一(61、H1)、丨(11、S1)。
①標(biāo)號(hào)序:11、12、61、11→11126111;
②代號(hào)序:S1、S2、H1、S1→SS2HS。
國(guó):丨(11、S1)、┐(12、S2)、一(61、H1)、一(61、H1)、丨(11、S1)、一(61、H1)、丶(51、D1)、一(61、H1)。
①標(biāo)號(hào)序:11、12、61、61、11、61、51、61→1112616111615161;
②代號(hào)序:S1、S2、H1、H1、S1、H1、D1、H1→SS2HHSHDH。
給下面一句話的8個(gè)字排序:“她用新華字典查字”。
她:①520161221172;②D2PHX2SY2
用:①0122616111;②PX2HHS
新:①51615101616121515101016111;②DHDPHHXDDPPHS
華:①011101726111;②PSPY2HS
字:①5151023461;②DDP2L4H
典:①1112611111610151;②SS2HSSHPD
查:①611101411112616161;②HSPNSS2HHH
字:①5151023461;②DDP2L4H
這8個(gè)字的順序是:1華、2用、3典、4字(出現(xiàn)了兩次)、5新、6她、7查。
以上示范了(所抽樣的)漢字的新的“字序”、“字典序”,此排序方法的優(yōu)點(diǎn)是準(zhǔn)確、清晰,人們從視覺(jué)上、邏輯上都可輕松地分辨出漢字的先后順序。
漢字的排序方式及其使用的范圍:一是筆畫(huà)阿拉伯?dāng)?shù)字標(biāo)號(hào)的排序法,適用于計(jì)算機(jī)漢字信息處理技術(shù)應(yīng)用;二是筆畫(huà)代號(hào)的排序法,適用于字典正文、圖書(shū)檔案資料的標(biāo)注及索引;三是筆畫(huà)名稱(chēng)的排序法,適用于學(xué)校漢字漢語(yǔ)教學(xué)。
四、漢字的檢索
編排工具書(shū)索引、編制圖書(shū)檔案資料、排列姓名次序,以及漢字信息處理等,都需要有一個(gè)合理、巧妙的漢字字序排列法,以便查找。
漢字筆畫(huà)有50個(gè),可用作單字第一筆的只有19個(gè),因此字典的正文也劃分成這19個(gè)區(qū)域。
在字典正文頁(yè)眉處位置列出本頁(yè)的第一個(gè)和最后一個(gè)漢字的代號(hào)序,并給兩個(gè)代號(hào)序之間加上一個(gè)連接號(hào)。如果某頁(yè)的第一個(gè)字是“賀”,則寫(xiě)“X2PSS2HSS2PD”。
漢字的“第1部件”都應(yīng)標(biāo)注在本頁(yè)頁(yè)眉位置,同時(shí),也可標(biāo)注在漢字左側(cè)的空白位置,以便使用者查尋漢字。
要查找某個(gè)字,從該字的第1筆畫(huà)、第1部件開(kāi)始,直接翻頁(yè),用掃視法可查尋到。如:要查“笑”字,先從字典正文找到第1筆畫(huà)——“撇”、再找到第1部件,這樣,就能查到“笑”字。
采用上述的漢字檢索方法,字典本可以取消檢索表的。但是,為了讓使用者有個(gè)適應(yīng)過(guò)程,可設(shè)立一個(gè)(過(guò)渡性的)檢索表。把檢字表劃分成19個(gè)(第1筆畫(huà)的)區(qū)域,再按漢字的筆畫(huà)數(shù)量從少到多區(qū)分若干類(lèi),同類(lèi)的漢字也按照(上述的)字序排隊(duì)。如“笑”字排在“撇”區(qū)的“10畫(huà)”區(qū)內(nèi)。
五、漢字信息處理
光學(xué)字符識(shí)別法(OCR)就是把文字看作一個(gè)小的圖像,采用圖像掃描儀等設(shè)備對(duì)文稿進(jìn)行掃描,把文稿上的文字變成強(qiáng)弱的兩種電信號(hào),再變成二進(jìn)制數(shù)0和1儲(chǔ)存于計(jì)算機(jī)。
另外,還有統(tǒng)計(jì)模式識(shí)別方法,這兩種方法使用的效果并不理想。
在筆畫(huà)(形狀)的數(shù)字模式里,筆畫(huà)的分類(lèi)和編號(hào)帶有顯著的“數(shù)理感”,如果能在漢字的每一個(gè)筆畫(huà)上都“暗記”其標(biāo)號(hào),而形成一種“邏輯模式識(shí)別法”,也許會(huì)優(yōu)于光學(xué)字符識(shí)別法、統(tǒng)計(jì)模式識(shí)別法。
如果采用漢字新的字序,通過(guò)調(diào)試或升級(jí)軟件,或許能將“交換碼”與“內(nèi)部碼”這兩種碼合并或統(tǒng)一,可使計(jì)算機(jī)的智能識(shí)別、漢字信息處理變得更加輕松快捷。
文章來(lái)源: 《文化產(chǎn)業(yè)》 http://k2057.cn/w/wy/32640.html
欄目分類(lèi)
- 少數(shù)民族傳統(tǒng)手工藝產(chǎn)業(yè)化發(fā)展路徑研究
- 數(shù)字化轉(zhuǎn)型視域下文書(shū)檔案數(shù)字化的有效管理策略探究
- 鄉(xiāng)村振興視域下鄉(xiāng)村數(shù)字文化建設(shè)路徑研究
- 形態(tài)、生態(tài)與擬態(tài):論屏幕媒體發(fā)展的三個(gè)維度
- 世界傳統(tǒng)景觀形式對(duì)現(xiàn)代景觀的啟示
- 新數(shù)字鴻溝理論視閾下浙江省城市書(shū)房的構(gòu)建與展望
- 基于文化走出去外宣政策背景下博物館藏知識(shí)推介平臺(tái)的構(gòu)建與應(yīng)用研究
- 打造天朗氣清的網(wǎng)絡(luò)精神家園:全媒體時(shí)代主流媒體的責(zé)任與擔(dān)當(dāng)
- 公共圖書(shū)館少兒服務(wù)創(chuàng)新開(kāi)展
- 社會(huì)力量參與公共圖書(shū)館建設(shè)的策略分析
- 2023JCR影響因子正式公布!
- 國(guó)內(nèi)核心期刊分級(jí)情況概覽及說(shuō)明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學(xué)者
- 我用了一個(gè)很復(fù)雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問(wèn)題”。
- 重磅!CSSCI來(lái)源期刊(2023-2024版)最新期刊目錄看點(diǎn)分析!全網(wǎng)首發(fā)!
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應(yīng)該熟知的10個(gè)知識(shí)點(diǎn)。
- 注意,最新期刊論文格式標(biāo)準(zhǔn)已發(fā)布,論文寫(xiě)作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學(xué)術(shù)論文編寫(xiě)規(guī)則
- 盤(pán)點(diǎn)那些評(píng)職稱(chēng)超管用的資源,1,3和5已經(jīng)“絕種”了
- 職稱(chēng)話題| 為什么黨校更認(rèn)可省市級(jí)黨報(bào)?是否有什么說(shuō)據(jù)?還有哪些機(jī)構(gòu)認(rèn)可黨報(bào)?
- 《農(nóng)業(yè)經(jīng)濟(jì)》論文投稿解析,難度指數(shù)四顆星,附好發(fā)選題!