书写汉字时,一次写成的一个连续不断的线段。
由此可推知:
●多个笔画写成的是笔画结构,如“十、口”等,不能叫笔画。
●一个连贯的笔画,不能断开成几段来处理。例如,不能把“申”分解为“丨田丨”,也不能把“里”拆成“田土”等。
经科学归纳,汉字的基本笔画只有下表所示的5种。为了编码,这5种单笔画,分别以数字1、2、3、4、5作为代号:
代 号 基本笔画名称 笔画走向 笔画变形
1 横一 左-右

2 竖丨 上-下

3 撇丿 右上-左下

4 捺
左上-右下 丶5 折乙 带转折

变形笔画与基本笔画是同一类笔画,这是因为:
(1)由“现”是“王”字旁可知,提笔“
”实际是横的变形。 (2)由“村”是“木”字旁可知,点笔“丶”应属于“
”。 (3)由旧体的“木”字其竖笔带钩可知,竖笔向左带钩“
”应属汉字编码的单位-码元】
编码是给汉字以及笔画结构编制“代码”,或命名“代号”,就好象给人起名字一样。汉字编码既不涉及书法艺术,更不是“造字法”。
汉字是图形文字,笔画繁多、形态多变。如把几万个汉字分解成较小的块块,即使不细分,分解出来的“字根”或“部件”,也会多达上千种。无论如何,在标准键盘的26个字母键上,是无法摆得下将近1000个符号的。
把汉字理解为“字根”或“部件”,客观上是为汉字设计了“字母”。
然而汉字根本没有,也不可能有字母!
因此,我们不可能,也没有必要以文字学意义上的字根或部件为单位,在键盘上一笔不差地拼出汉字。
98王码中,是以“码元”为单位,向电脑输入汉字的。
我们把笔画结构特征相似,笔画形态及笔画多少大致相同的“笔画结构”,作为编码的“单元”,即编码的“元素”,简称“码元”。
“码元”是一个编码学上的概念,它是指笔画结构的特征,完全不同于文字学意义上的字根或部件。
如“打倒山”、“彐”和“
”,形态虽略有不同,但有视觉上的相同特征,这三个笔画结构,虽然是三个不同的字根(部件),但我们认为属于同一个“码元”。其中“彐”有代表性,使用次数多,叫“主码元”,简称“主元”;而使用次数少的“
、
”,则叫“次元”,或“副元”。再如:“水”的同源字形,以及与“水”的笔画特征大致相同的笔画结构,有“
”等等,合在一起,在编码学中,就可以归为同一码元。其中,“水”叫“主元”,其余的叫“次元”。总之,“码元”只是编码学意义上的“单元”,是经过抽象的“字根”或“部件”。码元只代表“笔画特征”,而不代表笔画的具体结构和细节。
因此,只要“特征”相同,笔画的细节尽管不一样,也并不影响它们是同属一个“码元”。
例如:“
”就是同一码元。很明显,它们的共同“特征”是“笔画向下构成一个罩”,这里,“
”是“主元”,“
”是“次元”。98王码的“码元”除5个单笔画外,“主元”有150个,“次元”有90个。
最后,为了学好用好98王码,我们必须反复强调,“码元”完全不同于文字学意义上的“字根”或“部件”。
“码元”只是我们为了给无比复杂的汉字编制代码,命名代号。我们把曲直长短略有不同,但总体形似的笔画结构归为同一码元。
字根或部件,是作为汉字的构成部分,不可以随意改动变形的,否则就“不是那个字”了。
理清文字学中“字根”与编码学中“码元”的概念混淆,对于消除长期以来不同学科之间的相互非难和误解,对于融多学科之长用于编码研究,具有深刻的理论意义和重要的现实意义。


雷达卡



京公网安备 11010802022788号







