Chinaunix

标题: 源文件用的编码对其中的字符串变量的编码有影响吗 ? [打印本页]

作者: hackqiang    时间: 2010-07-11 22:49
标题: 源文件用的编码对其中的字符串变量的编码有影响吗 ?
RT,
如果我源文件用的是UTF-8编码或是GBK编码 那对其中的字符串变量的编码有影响吗 ?
如果有大侠给我讲讲编码的问题那就更好了,一直很疑惑这个东西。
作者: 没本    时间: 2010-07-11 23:12
对编译有影响,如果编译器不能正确识别文件的编码,就会出现问题。推荐全部用UTF-8 BOM格式来存放源程序文件。
作者: benjiam    时间: 2010-07-12 09:34
很有影响。 这个不知道怎么做呢


我现在都是gb212 代码。 g++ 代码再内部用iconv 进行一次转换。

好像直接保存utf-8 格式源码 g++ 会有问题 vc2005 不会 头疼
作者: 没本    时间: 2010-07-12 11:59
回复 3# benjiam


    g++编译前要设置正确的环境变量。或者文件带UTF-8 BOM。
作者: fender0107401    时间: 2010-07-12 12:03
没想过,我什么都是utf-8。
作者: 笑里藏火箭筒    时间: 2010-07-13 05:47
提示: 作者被禁止或删除 内容自动屏蔽
作者: c/unix    时间: 2010-07-13 07:57
提示: 作者被禁止或删除 内容自动屏蔽
作者: benjiam    时间: 2010-07-13 09:15
我昨天做了一个测试

你好 这样2个中文

gb2312 码是 C4E3 BaC3
Utf-8   e4 bd a0 e5 a5 bd
unicode-16   60 F 7D 59


这样一行代码
char * p = "你好"

vc2005 下编译

源文件使用gb2312

内存中保持为 gb2312


源码为utf-8 BMO
内存中为 GB2312


源码为UTF-8 without BMO

内存为UTF-8


源码为Unicode

内存为 GB2312







wchar_t *p = L"你好"

这样一句

源文件使用gb2312

内存中保持为 unicode编码


源码为utf-8 BMO
内存中为 unicode编码


源码为UTF-8 without BMO

内存为???  63 bd b2 72 bd 30 ???



源码为Unicode

内存为 unicode 编码



在linux 下

char *p = " 你好"

首先unicode 编码的文件  我无法编过。
utf-8 BMO 也无法编译

gb2312 是可以的。
需要设置locale zh_CN.gb2312  

内存里面保存的是 gb2312

utf-8
设置成zh_CN.UTF-8 可以编过
可以正常显示
内存里面是 Utf-8编码


wchar_t p =l"你好“
gb2312 utf-8 bmo unicode 都无法编译

utf-8 可以编译

内存里面放置的是 utf-32 编码
内存是unicdoe 的utf-32 编码


所以希望用一种源码格式 跨平台 跨编译器  问题挺多的。
作者: 红星生活    时间: 2010-07-17 11:19
提示: 作者被禁止或删除 内容自动屏蔽




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2