免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
1234下一页
最近访问板块 发新帖
查看: 15737 | 回复: 33
打印 上一主题 下一主题

[C] 请教。关于汉字编码转换UTF-8->GB2312。 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-06-11 13:27 |只看该作者 |倒序浏览
大家有做过这个的实现吗?UTF-8到GB2312的转换。
linux汉字编码为UTF-8,汉字库编码为GB2312。所以需要UTF-8到GB2312的转换。
交叉工具链中没有iconv函数,所以需要自己实现。网上搜到的全都是windows下的不可移植代码。
或者unicode到GB2312的转换。现在可以从UTF-8转到unicode。
多谢大家不吝赐教。

论坛徽章:
0
2 [报告]
发表于 2008-06-11 13:28 |只看该作者
man iconv

论坛徽章:
0
3 [报告]
发表于 2008-06-11 13:30 |只看该作者
原帖由 net_robber 于 2008-6-11 13:28 发表
man iconv

汗~~人家说了没有iconv了

论坛徽章:
0
4 [报告]
发表于 2008-06-11 13:31 |只看该作者
关键字:gb2312.txt
网上很多人作过这个
http://download.csdn.net/source/205564

论坛徽章:
0
5 [报告]
发表于 2008-06-11 13:31 |只看该作者
把iconv的代码下载下来,抄一抄~~!

论坛徽章:
0
6 [报告]
发表于 2008-06-11 13:33 |只看该作者
iconv的代码比较复杂,不适合楼主的需要。(估计楼主是要在嵌入式上用)

论坛徽章:
0
7 [报告]
发表于 2008-06-11 13:41 |只看该作者
如5楼说的,摘出需要的部分用

源代码都给你了,自己复制一下不好么??

论坛徽章:
0
8 [报告]
发表于 2008-06-11 13:55 |只看该作者
汗。iconv源码。。

论坛徽章:
2
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:56:11
9 [报告]
发表于 2008-06-11 14:07 |只看该作者
UTF只是UNICODE的一种表现形式,
UTF-8是用字节序列来表示UNICODE
还有UTF-16和UTF-32等等形式
若要将UTF-8转换为GB2312,应该先将UTF-8转换为UNICODE(一般用UTF-16表示即可,当然用UTF-32表示就更完整了),然后通过查表来实现UNICODE到GB2312的转换.

论坛徽章:
0
10 [报告]
发表于 2008-06-11 15:54 |只看该作者
多谢楼上指点。那请再问我如何通过查表得到unicode与gb2312间的映射关系?是否有公式或法则?
刚才看了unicode字符映射表,目前状况大致如:
汉字“啊”,通过utf-8转unicode得到其字符编码为0x554a,unicode字符映射表里0x554a的位置确实是“啊”字。但是不知道如何将之与gb2312的1601对应。“啊”在gb2312汉字库中的区位码是1601。
请指教。谢谢。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP