【解析新特性】300W单路输出工业电源>>
电子产品世界 » 论坛首页 » DIY与开源设计 » 电子DIY » 带声、韵、调读音的汉字内码输入法,专利号:2011100933842

共7条 1/1 1 跳转至

带声、韵、调读音的汉字内码输入法,专利号:2011100933842

菜鸟
2017-05-31 02:26:25    评分
带声、韵、调读音的汉字内码输入法,专利号:2011100933842发明人:林坤明,联系电话15892031030  13860853919.寻求合作开发
本发明公开了一种带声、韵、调读音的汉字内码输入法,旨在提供一种输入码与内码一致并代表汉语的编码。它利用若干原拼音字母之外新

增若干同音不同形的新拼音字母并与键盘一一对应,将原、新拼音字母互相配对,构成4对相同读音不同字形的编码来表征汉语4个声调,程

序将语音变字,两键一字。一个带有声、韵、调读音的编码加一个序号字母的输入码定位GB 18030-2000的27533个汉字,无重码,准确率

100%,它达到输入码、内码、电脑文合体的境界,与现有方块汉字相比,如果中国人省下几年苦学方块汉字的时间,用于学习其它的知识和

学问,其导致的社会进步与发展完全不可估量。



关键词: 输入法          专利号     键盘    

专家
2017-05-31 08:32:32    评分
2楼
也就是说,是拼音输入法吧。

院士
2017-05-31 17:15:43    评分
3楼
    有了声调的区别,重码的情况更加减少,有利于输入,谢谢楼主分享。不知能否与现有的输入法合并使用。

菜鸟
2017-06-01 02:28:30    评分
4楼
可以与现有的输入法合并使用。不只是拼音输入,可以化为单词输入。详细可以见专利文件。在国家知识产权局官网,用专利号查询或输入发明人查询。

菜鸟
2017-06-01 02:30:28    评分
5楼


带声、韵、调读音的汉字内码输入法

 

技术领域:

本发明涉及一种汉字输入计算机的输入法。特别是涉及一种汉字输入计算机的带声、韵、调读音的汉字内码输入法。

 

背景技术:

1946年人类第一台电脑诞生于美国宾夕法尼亚大学的莫尔电机学院内。英文不需要编码,是直接输入计算机的文字,当仁不让进驻计算机。

汉字总数庞大,《中华字海》收字数多达八万五千字。构成汉字的笔划、读音、空间主要三个要素中,读音和空间是固定的,能够自由发展的只有笔划一个要素。八万五千个汉字使得笔划越来越多,最多的多达52个笔划。汉字缺乏和语音的直接联系,字形复杂,同音字、异体字也很多。学习汉字只能靠死记硬背,难学难认。汉字输入计算机的编码也很复杂,需要输入码、交换码、内部码和字形码。美国儿童4岁就能阅读,中国儿童平均8岁才能阅读。以致造成整个民族智力发展的滞后,影响了国家的竞争力。

1951年,毛泽东指示:“文字要在一定的条件下加以改革,要走世界文字共同的拼音化方向”。汉字拼音化运动,一度风起云涌,成燎原之势。1958年国家颁布的《汉语拼音方案》,过于简单化,拼式冗长,描述汉字不精确。

方块汉字输入计算机编码方案可分为:1、拼音码;2、拼形码;3、音形码;4、流水码(国标码、区位码)。随着计算机运算能力的飞跃,从音到字的翻译工作大部分交给了计算机程序来完成,音落文出。例如日本的“拼音变换法”,只要输入发音,电脑就可以运算出日文中的汉字,运指如飞,打出了一度失去了的方块汉字自信心。

60年代,美国王安输入法6键一字,70年代,台湾仓颉输入法5键一字,80年代王码五笔输入法4键一字,每减少一键,意味着汉字输入速度有了提高,也意味着汉字输入已有了实用性。90年代出现ccdos简化拼音方案和WPS和四通双拼方案。1988年周志农先生将双拼压缩到26个字母键,保证每一个字都是两个音。

汉语是声、韵、调三维结构,汉语的四声也是世界独一无二的。汉语拼音方案如果不进行标调,就不能成为汉语电脑文字。如:“我买东西”和“我卖东西”,若不带声调,电脑性能再高,也很难判定是“买”还是“卖”。现有汉语拼音输入法的标调方法有:符号标调、异拼标调、字母标调、混合标调、数字标调、大小写标调等。

汉语同音字多,日本的“拼音变换法”在中国遇到难题。有人称:“当你想出来闪光前,请先关起门看看这个问题:231yi4字怎么打……”。

汉字输入计算机的内码有:中国大陆的GB码(6763个汉字)、GBK码(21003个汉字)、GB 18030-200027533个汉字)、GB 18030-200570244个汉字)。港、澳、台地区的Big-5码,外国公司如微软等的Unicode码。

201146日,在国家知识产权局官方网站以“输入法”为检索词,有发明专利公告1941件。尽管万“码”奔腾,但形码还是难学难拆,音码还是重码高、打不快。机器语言是0和1,没有语种分别。英语能直接输入传统汉字输入法却需多次转换。如果我们能设计出输入码与内码一致的编码,直接输入计算机中作为内码并代表汉语,汉语编码文字将赶上并超过西方国家。但是,以汉语电脑文字身份出现的编码,至今仍然没有成熟。用更先进的输入法取代相对落后的传统输入法是民族进步的必然要求。

著名科学家钱伟长教授指出:“好的编码方案还没有出来,好的编码方案应该是一种文字,或者是准文字”。汉字输入法是一种文化工具,工具不需要多。由于输入法太多,让人无所适从。国家为什么不统一汉字输入法呢?实在也为难,目前面市的各种笔和码,总是有较大的缺憾,总是不完美,如其匆促选定,那也坑害百姓,还是慢慢等待吧!

 

发明内容:

本发明的目的为:

依据著名科学家钱伟长教授“好的编码方案应该是一种文字”的设想,创制出一种用两个拼音字母表征一个带声、韵、调读音的汉字音节,输入码与内码一致并代表汉语的编码。计算机将一个个带声、韵、调读音的汉字音节构成的语音翻译成具体汉字,两键一字。一个声韵调音节加1个序号字母的输入码有9万以上字位,能对应GB 18030-2000的27533个汉字,无重码,准确率100%。一个声韵调音节加2个序号字母的输入码有600万以上字位,能对应GB 18030-2005的70244个汉字,无重码,准确率100%。这种输入码构成带声、韵、调读音的计算机内码文字。将计算机内码文字增加大写、分写、连写格式等若干规则的输入码构成一种带声、韵、调读音的汉语计算机书面文字。这种输入码还能区分数百个同音字;字符集为七位ASCII码或者其最高位编码字符;若干个奇数不做声母的拼音字母表征若干个特高频汉字。

发明的目的是这样实现的:

采用声韵双拼,奇数(单数)击键是声母,偶数(双数)击键是韵母。即:第1个拼音字母为声母,第2个拼音字母为韵母。零声母音节,补齐一个用来占位的空声母(本发明用字母“o”做为空声母)。

创制能两键准确表记汉语声韵调音节的字符集。在汉语若干原拼音字母之外,新增若干同音不同形的新拼音字母;若干原拼音字母和若干新拼音字母与计算机键盘的按键一一对应,或者通过计算机按键的单击与双击实施区分而与计算机键盘的按键一一对应;一个奇数击键的原拼音字母或者新拼音字母的声母或者空声母,与一个偶数击键的原拼音字母或者新拼音字母的韵母相互配成4对同音不同形的编码,这4对同音不同形的编码分别表征汉语的4个声调,两键输入一个带有声、韵、调读音的汉字音节。

若干原、新汉语拼音字母的数量可参照自然码双拼的26个拉丁字母,亦可参照微软双拼的26个拉丁字母加一个标点符号(27个字符)等。本发明有28个音符,即:增设“ing”和“ü”两个字母,共有28个读音56个拼音字母。大写字母的输入方法与现有标准键盘相同,按大写锁定键或上档键输入大写字母。大写也有音调的区分,击打原拼音字母键,是正常的大写字母,表征其原为原拼音字母;击打新拼音字母键,则大写字母的下方多一短横,表征其原来为新拼音字母。这种声韵调编码,用28音56个字符表达1351个带声调音节,两个字母表达汉语四个声调,相较已知的各种带调音节,拼式最简短。它解决了汉语声调符号只有四个,多一位码则浪费,少一位码则不足的瓶颈。它音与调如影随形,不但阅读效率高,也使汉字拼音化成为现实。

10个阿拉伯数字做序号字母,以区分同音字,它不参与拼音。

以上全部字符集共有94个字符,其中,56个原拼、新拼音字母和10个阿拉伯数字参与编码,28个大写字母只参与书写。66个参与编码字符,可以用ASCII码的52个大、小写拉丁字母、10个阿拉伯数字,再另选4个其他的字符。或者使用ASCII码闲置的最高位编码。全部94个字符均为七位或者八位单字节编码图形字符。

在笔记本键盘或者台式机键盘上有56个参与编码的原拼、新拼音字母的键位,或者在标准键盘上以单、双击区分56个原拼、新拼音字母。这样,28读音56个字母一一对应到输入键盘的具体按键上,当一个特定的键在键盘上被单击或者被双击时,其对应的字符被激活。

众所周知,带声、韵、调读音的汉字音节是一个个精确的汉字字音,两个拼音字母为一个声韵调编码,计算机程序默认每输入两个拼音字母的编码表征一个带有声、韵、调读音的的汉字音节。程序将其翻译成汉字,拼音变字,两键一字。两键就可直接上屏,不用择字,也无须按空格键。

对新华字典全部1万余个汉字,其输入码为一个带声、韵、调读音的编码加一个阿拉伯数字的序号。单击阿拉伯数字时,阿拉伯数字位置据字行的中间,代表1-10;双击阿拉伯数字时,阿拉伯数字位置据字行的下方(下沉),代表11-20。《新华字典》有1351带声调的实音节,乘以20个序号有2万7千个字位,经过同音字处理,足够容纳新华字典里的1万余个汉字,更足够容纳《通用规范汉字表》全部8300个规范汉字。对新华字典以外的罕用汉字,其输入码为一个带声、韵、调读音的编码加一个原拼音字母或者新拼音字母的序号。拼音字母的序号为除a、e、λ、э外的48个拼音字母,表征序号为21-68。单词连写时,如有混淆则加隔音符号。1351带声调的实音节乘以(20+48),有九万一千八百个字位,结合同音组设置,能一一对应GB 18030的27533个汉字并且可以互为替代,无重码,准确率100%。一个声韵调音节加2个序号字母的输入码则有600万以上字位,能对应GB 18030-2005的70244个汉字并且可以互为替代,无重码,准确率100%。

带声、韵、调读音的计算机内码文字,增加大写、分写、连写格式,或者增加单字序号为“1”时省略序号,或者增加单词在不相混淆时省略一个至全部序号等若干规则,表征GB 18030-2000的27533个汉字,则构成一种直接输入计算机的带声、韵、调读音的电脑书面文字。其中,阿拉伯数字不参与拼音,是天然的隔音标识,有99%的音调合一内码输入码是用阿拉伯数字定位到字。序号分布在1351带声调的实音节中,高频字序号靠前,低频字序号靠后,常用字平均不到3个,不用专门记,经常出现,就会记住。

现有拼音输入法中都带有择字框,保留这种择字框。在择字框里,分出1-4声。每个声调一格,保留常用字跳前的规则,但每个带声调汉字的序号固定不变,当前声调高亮。此时可鼠标直接择字,或用4个方向控制4个声调的高亮后,输入选定汉字的序号。在输入过程中,“提示”框不停地显示汉字和声调与序号的对应式供参考。当用户记得声调和序号时完全可以不必理会这些提示,只有不记得声调和序号时才去注意它。实践证明,常用字多打几次,就能记住序号。

当同一个带调音节有众多汉字时,增设同音组分组容纳同音字。同音组的读音相同,拼音字母不同。汉字拼音不带声调的理论音节组合有735个(21*35),实际音节只有418个,其余是不相拼音节和潜音节,有300余个音节空置。借用空置音节,特别是不相拼音节的整体认读可以构成若干读音相同,拼音字母不同的同音组。在GB码的6763个汉字中有27个音节同音字超过20字,只占6.5 %。在300余个空置音节中指定27个同音组,没有难度。

例如:yi的4组同音组可用yi、oi、wi、fi表示。其中,yi是汉字拼音法定音节,oi是双拼输入法特定零声母音节,wi、fi是不相拼音节。又例如:bi的3组同音组可用bi、by、bt表示。其中,bi是汉字拼音法定音节,by的在y汉字拼音中能与i互换,bt是不相拼音节。汉字同音字最多的iy4,《新华字典》有72个,分4组,每组不到20个字,可用阿拉伯数字。GBK码的231个yi4同音字,分4组,每组也不到60个字。用20阿拉伯数字加48个原、新拼音字母做序号,共有272个字位,足够容纳231个yi4同音字。

若干个奇数不做声母的拼音字母表征若干个特高频汉字。汉语拼音有21个声母及W、Y代声母,双拼有“O”做空声母。声母、代声母、空声母合计有24个。在奇数键上,a、e、λ、э的8个原、新拼音字母不做声母,将其作为“的、一、了、是、我、不、在、人、”8个特高频汉字的单字母。现代汉语中,汉字“的”字约占4%,约有10%的音序电脑汉字是单字母定位到字。

本发明与现有技术相比较,具有如下显而易见的突出实质性特点和显著优点:它用有限的元件(66个字符),两键表达一个带声、韵、调读音的汉语精确读音,较之20世纪60年代的美国王安输入法6键一字,70年代,台湾仓颉输入法5键一字,80年代王码五笔4键一字之后,开创出21世纪20年代两键一字的新时代。它三键定位GB 18030-2000的27533个带声、韵、调读音的汉字,无重码,准确率100%,它四键有600多万个字位,能定位GB 18030-2005的70244带带声、韵、调读音的汉字,是一种计算机内码文字。它读写完全一致而又不需语法,远比英语易学。它拼式简短、易于认读,直接输入计算机、是一种带声、韵、调读音的精准书面文字,是著名科学家钱伟长教授指出的:“好的编码方案”。它保留汉字一字一音及音形义全部内涵,与简繁汉字互为替代,只有方块汉字的功成身退,不对现行的简繁汉字进行改进或改造,不但能实现中国政府1951年推行“汉字拉丁化”拼音文字的目标,而且与时俱进,是单字节汉语计算机编程语言。它字在码中,不再提笔忘字。它音在字中,博学的人不会遇到生僻字不知发音的难处。它字在话中,会说话就会打字,不存在文盲问题。中国儿童都学拼音,只需再用几天记双拼和新拼音字母,中国娃娃4岁能阅读和打字不是梦。它达到输入码、内码、电脑文合体的境界,与现有方块汉字相比,如果中国人省下几年苦学方块汉字的时间,用于学习其它的知识和学问,其导致的社会进步与发展完全不可估量。


专家
2017-06-01 08:16:45    评分
6楼
不错的发明,支持一下。

院士
2017-06-01 11:20:44    评分
7楼
介绍得好详细,谢谢楼主。这个确实值得好好学习,大力推广、尽快普及,只是担心又要像“五笔字形”那样背字根。麻烦楼主做5-10个字、4个声调输入的演示;比方有双拼基础的如何学习、有五笔基础的如何学习。

共7条 1/1 1 跳转至

回复

匿名不能发帖!请先 [ 登陆 注册 ]