免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: fyimail
打印 上一主题 下一主题

如何用C程序实现将GB2312的6763个汉字按输出到一个文本文件 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2008-10-21 22:00 |只看该作者
原帖由 雨过白鹭洲 于 2008-10-21 19:23 发表
一直没搞清楚multi-byte字符,和unicode...

所以我写C语言一直都是直接char,惭愧



其实很容易理解, unicode是把世界上任何一个国家的文字和字符都统一到一个表里, 也就是给你一个编码数字,
以前的unicode是short两个字节也就是65535个字符, 后来好像扩大了.
其他的一些比如UTF-8 UTF-16都是unicode的一种编码实现. 实际上最后的码还是unicode, 真正的的unicode只是一些数字.
我国的gb2312 GBK 都是自己的编码规则, 其实也是数字编码.
后来的gb18030好像扩大了码表可以兼容其他国家的字符.

一般做字符转换是先转成对应的unicode 然后在转成其他的编码, 因为任何字符编码最后都可以转成unicode.

论坛徽章:
0
12 [报告]
发表于 2008-10-22 10:27 |只看该作者
原帖由 cnangel 于 2008-10-21 17:57 发表
    int i = 32768;
&nbsp;&nbsp;&nbsp;&nbsp;for (; i < 65536; i ++)
&nbsp;&nbsp;&nbsp;&nbsp;{
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if (i % 256 < 0x20)
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ...


非常感谢。
但是里面的一些语句不太懂,32678,65535都代表什么,256代表什么,这段代码执行后,打印出来是好多乱码?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP