这些小活动你都参加了吗?快来围观一下吧!>>
电子产品世界 » 论坛首页 » 综合技术 » 基础知识 » unicode 求救:有否汉字内码与unicode的转换资料??

共2条 1/1 1 跳转至

,unicode 求救:有否汉字内码与unicode的转换资料??

院士
2006-09-17 18:14:16     打赏
,unicode 求救:有否汉字内码与unicode的转换资料??



关键词: unicode     求救     有否     汉字     内码     转换     资料    

院士
2006-12-22 22:43:00     打赏
2楼
问 或者是汉字区位码与unicode的转换资料也行,麻烦传给我一份 andy-99@tom.com 谢谢!小弟是想要用vb编一个汉字跟中文短信的转换小程序。 1: 放狗 2: 查表 3: 用VB?直接用函数就行了,windows编程下不用查表了每个字符串函数后面加上w就是unicode编码的了。

?hex(ascw("啊"))  'unicode内码
554A

?hex(asc("啊"))   '一般内码
B0A1
4: 如何制作GB与UNICODE装换表    首先编一个程序,生成一个“GB.txt”文件,文件内容是(用16进制表示):2020 2021……202F 2120 2121……FFFF  当然其中不应包含空格,这里只是为了方便描述。知道GB2312的人肯定明白了,这个GB.txt实际上就是一张95x95的GB2312汉字表。
    然后启动微软写字板,打开GB.txt文件,另存为—UNICODE文本文件,取名为UCS.txt。
    再编写一个程序,将UCS.txt的前面两个字符删除后保存(我记得好像是FFFE,是UNICODE文本文件的文件头标志)。这样就得到你想要的转换表了。
    使用方法很简单,如果你想查找某个汉字的UNICODE编码,你首先计算该汉字的区位码(理解GB2312的人都知道,内码两个字节分别减去A0H……),得到该汉字的偏移量,然后到UCS.txt中利用这个偏移量就查找到了其UNICODE编码。
    很多人应该理解这个方法了吧,不理解的即使我说得在详细也没用。

背景简介:
    GB2312是中国制定的常用汉字的字符集编码规范,同时也是新加坡的国家标准,收录汉字6K多,还有常用符号、各语种字母等;后来还制定了其他的字符集,除了GB2312的字符之外,还收录了非常用字、繁体字等。
    UNICODE编码是ISO制定的,试图收集当前人类使用的所有书写符号,也就是想制定适用于全球的字符编码标准,主要包含中文汉字、韩国文字符号、日文符号、希腊、拉丁、俄语、英语、阿拉伯语等符号。采用16bit编码,目前已经编码3万个符号,其中80%以上是汉字。其中的汉字编码基本上以中国的国标为基础。
   这两者之间不存在线性映射关系,因此无法使用一个简单的公式相互查找。通过GB查找UNICODE比较容易,而反过来通过UNICODE查找GB,就很困难了,GB只有不到1万个符号,因此一个任意的UNICODE字符还不一定能有对应的GB字符,即使有,查表工作量也相当大。
    

共2条 1/1 1 跳转至

回复

匿名不能发帖!请先 [ 登陆 注册 ]