论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2009-11-10 17:10 |只看该作者 |倒序浏览

书上说，字符串前面加个u就是unicode字符串。
我在cmd命令行模式下运行python，然后手动测试，没什么问题。

然后打开自带的那个IDLE，就有问题了。
如图，加了u的string，编码内容还是gbk编码....
这是什么原因呢？

而且我想把a转化长unicode编码，不管是unicode() 还是decode()都会报错。
只有把b变量，unicode()或者decode()才能获得对应的unicode编码。

麻烦大家解释下，谢谢了。

文库|博客

fengyizi

稍有积蓄

论坛徽章:: 0

2楼 [报告]

发表于 2009-11-10 17:36 |只看该作者

刚试了下，建立一个文件，指定# -*- coding: gbk -*- 或者指定成utf-8，然后在文件中，那样建立变量a，则就ok了。
但是，在idle环境下，如此定义string就是不得正常。
我疑点在，u"string"就是把string unicode编码，和当前源文件的编码格式为什么要联系啊？非要指定下么？
源文件不指定编码，默认就是ascii码，而那个编码 a = u'你' 貌似也不是ascii编码，而且还莫名其妙的成了两个字符的unicode格式，他好像是直接把gbk的每个字节，当成每个字符直接编码，而且再度decode或者encode都会出错。
而且cmd下就ok，在idle中定义变量，貌似永远也不会正常。

[ 本帖最后由 fengyizi 于 2009-11-10 17:37 编辑 ]