Chinaunix

标题: 源文件用的编码对其中的字符串变量的编码有影响吗？ [打印本页]

作者: hackqiang 时间: 2010-07-11 22:49
标题: 源文件用的编码对其中的字符串变量的编码有影响吗？
RT，
如果我源文件用的是UTF-8编码或是GBK编码那对其中的字符串变量的编码有影响吗？
如果有大侠给我讲讲编码的问题那就更好了，一直很疑惑这个东西。

作者: 没本 时间: 2010-07-11 23:12
对编译有影响，如果编译器不能正确识别文件的编码，就会出现问题。推荐全部用UTF-8 BOM格式来存放源程序文件。

作者: benjiam 时间: 2010-07-12 09:34
很有影响。这个不知道怎么做呢

我现在都是gb212 代码。 g++ 代码再内部用iconv 进行一次转换。

好像直接保存utf-8 格式源码 g++ 会有问题 vc2005 不会头疼

作者: 没本 时间: 2010-07-12 11:59
回复 3# benjiam

g++编译前要设置正确的环境变量。或者文件带UTF-8 BOM。

作者: fender0107401 时间: 2010-07-12 12:03
没想过，我什么都是utf-8。

作者: 笑里藏火箭筒 时间: 2010-07-13 05:47
提示: 作者被禁止或删除内容自动屏蔽

作者: c/unix 时间: 2010-07-13 07:57
提示: 作者被禁止或删除内容自动屏蔽

作者: benjiam 时间: 2010-07-13 09:15
我昨天做了一个测试

你好这样2个中文

gb2312 码是 C4E3 BaC3
Utf-8 e4 bd a0 e5 a5 bd
unicode-16 60 F 7D 59

这样一行代码
char * p = "你好"

vc2005 下编译

源文件使用gb2312

内存中保持为 gb2312

源码为utf-8 BMO
内存中为 GB2312

源码为UTF-8 without BMO

内存为UTF-8

源码为Unicode

内存为 GB2312

wchar_t *p = L"你好"

这样一句

源文件使用gb2312

内存中保持为 unicode编码

源码为utf-8 BMO
内存中为 unicode编码

源码为UTF-8 without BMO

内存为???  63 bd b2 72 bd 30 ???

源码为Unicode

内存为 unicode 编码

在linux 下

char *p = " 你好"

首先unicode 编码的文件  我无法编过。
utf-8 BMO 也无法编译

gb2312 是可以的。
需要设置locale zh_CN.gb2312

内存里面保存的是 gb2312

utf-8
设置成zh_CN.UTF-8 可以编过
可以正常显示
内存里面是 Utf-8编码

wchar_t p =l"你好“
gb2312 utf-8 bmo unicode 都无法编译

utf-8 可以编译

内存里面放置的是 utf-32 编码
内存是unicdoe 的utf-32 编码

所以希望用一种源码格式跨平台跨编译器  问题挺多的。

作者: 红星生活 时间: 2010-07-17 11:19
提示: 作者被禁止或删除内容自动屏蔽

欢迎光临 Chinaunix (http://bbs.chinaunix.net/)