免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1801 | 回复: 3
打印 上一主题 下一主题

[其他] 求UNICODE编码解惑 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-12-16 22:12 |只看该作者 |倒序浏览
我的理解是:
UNICODE 是国际标准 有UCS-2 UCS-4
UTF 是编码方式 有utf-n等
那么只要是实际存储的字符,必然需要对应一种utf-n

我这么理解对吗?
那么fopen(xx,“w+,ccs=UNICODE”)将创建一种什么样的编码格式的文件呢?  写程序验证,输出的是2字节的编码,这是什么编码?
还有,在gedit上为什么可以选择“ucs2”和“ucs4”的编码方式呢?
如果ucs2确实是一种编码,那就应该有大小端的问题阿,就应该有UCS2LE和UCS2BE,为什么在gedit上都看不到选项呢



论坛徽章:
14
巨蟹座
日期:2013-11-19 14:09:4615-16赛季CBA联赛之青岛
日期:2016-07-05 12:36:0515-16赛季CBA联赛之广东
日期:2016-06-29 11:45:542015亚冠之全北现代
日期:2015-07-22 08:09:472015年辞旧岁徽章
日期:2015-03-03 16:54:15巨蟹座
日期:2014-12-29 08:22:29射手座
日期:2014-12-05 08:20:39狮子座
日期:2014-11-05 12:33:52寅虎
日期:2014-08-13 09:01:31巳蛇
日期:2014-06-16 16:29:52技术图书徽章
日期:2014-04-15 08:44:01天蝎座
日期:2014-03-11 13:06:45
2 [报告]
发表于 2012-12-17 09:12 |只看该作者
那么fopen(xx,“w+,ccs=UNICODE”)将创建一种什么样的编码格式的文件呢?
------ 这是VC++8.0开始的,非标准的东西
对于ccs=UNICODE,如果文件本身有BOM,当然按照本身的BOM来
如果没有,或者是新建文件,当作ANSI编码
你用"w+",当然就属于新建文件了,所以答案是ANSI

论坛徽章:
0
3 [报告]
发表于 2012-12-17 09:12 |只看该作者
和UTF16LE UTF16BE这种明显指定了字节序的方式相比,我个人感觉ucs2 ucs4或者是unicode这种纯编码的,字节序应该是取决于系统的ABI吧,比如x86是小端的,那么存的UNICODE编码也是小端的吧……

希望有高人来解答

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:032015年亚洲杯之中国
日期:2015-04-22 15:52:45
4 [报告]
发表于 2012-12-17 13:12 |只看该作者
C的文件都是流的概念, 没有什么编码吧......
如果有编码的, 就是非标准~~~
你写一个二进制串进去, 它就原样存....
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP