免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2244 | 回复: 8
打印 上一主题 下一主题

汉字编码问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-08-14 00:46 |只看该作者 |倒序浏览
linux环境,默认

>>> s='中文'
>>> s
'\xe4\xb8\xad\xe6\x96\x87'

请问这个'\xe4\xb8\xad\xe6\x96\x87'是什么编码?

论坛徽章:
5
巨蟹座
日期:2014-08-28 18:12:342015年迎新春徽章
日期:2015-03-04 10:01:4415-16赛季CBA联赛之江苏
日期:2016-04-28 09:43:3115-16赛季CBA联赛之吉林
日期:2016-06-22 10:34:4315-16赛季CBA联赛之山西
日期:2016-08-16 16:29:55
2 [报告]
发表于 2014-08-14 09:35 |只看该作者
unicode      

论坛徽章:
0
3 [报告]
发表于 2014-08-14 11:02 |只看该作者
>>> s=u'中文'
>>> s
u'\u4e2d\u6587'
>>>

那这个呢?

论坛徽章:
5
巨蟹座
日期:2014-08-28 18:12:342015年迎新春徽章
日期:2015-03-04 10:01:4415-16赛季CBA联赛之江苏
日期:2016-04-28 09:43:3115-16赛季CBA联赛之吉林
日期:2016-06-22 10:34:4315-16赛季CBA联赛之山西
日期:2016-08-16 16:29:55
4 [报告]
发表于 2014-08-14 11:43 |只看该作者
本帖最后由 Linux_manne 于 2014-08-14 11:44 编辑

回复 3# bigfrog7


   在python中str和unicode在编码和解码过程中,如果将一个str直接编码成另一种编码,会先把str解码成unicode,采用的编码为默认编码,一般默认编码是anscii
>>> s='中文'
>>> x=u'中文'
>>> type(s)
<type 'str'>
>>> type(x)
<type 'unicode'>

论坛徽章:
5
巨蟹座
日期:2014-08-28 18:12:342015年迎新春徽章
日期:2015-03-04 10:01:4415-16赛季CBA联赛之江苏
日期:2016-04-28 09:43:3115-16赛季CBA联赛之吉林
日期:2016-06-22 10:34:4315-16赛季CBA联赛之山西
日期:2016-08-16 16:29:55
5 [报告]
发表于 2014-08-14 11:46 |只看该作者
然后unicode 对象可以转成自己需要的码
>>> x.encode('utf-8')
'\xe4\xb8\xad\xe6\x96\x87'

论坛徽章:
0
6 [报告]
发表于 2014-08-14 19:01 |只看该作者
回复 5# Linux_manne

感谢热情回答!

'\xe4\xb8\xad\xe6\x96\x87'应该是utf8编码
因为可以用utf8 decode:
>>> s
'\xe4\xb8\xad\xe6\x96\x87'
>>> s.decode('utf-8')
u'\u4e2d\u6587'
>>> print s.decode('utf-8')
中文
>>> s
'\xe4\xb8\xad\xe6\x96\x87'


u'\u4e2d\u6587'这应该是unicode编码

不知我说的对吗?

论坛徽章:
1
巨蟹座
日期:2014-08-15 14:56:13
7 [报告]
发表于 2014-08-15 14:59 |只看该作者
与你使用的telnet或ssh连接服务器的终端的设置有关。

这里应当是utf8,因为是6字节。如果是4字节的话应当是gbk。都是可以在终端上设置编码类型的。

论坛徽章:
5
巨蟹座
日期:2014-08-28 18:12:342015年迎新春徽章
日期:2015-03-04 10:01:4415-16赛季CBA联赛之江苏
日期:2016-04-28 09:43:3115-16赛季CBA联赛之吉林
日期:2016-06-22 10:34:4315-16赛季CBA联赛之山西
日期:2016-08-16 16:29:55
8 [报告]
发表于 2014-08-15 16:25 |只看该作者
回复 6# bigfrog7


    嗯 是的。。 主要是str 在python 内部都会转成unicode  然后会 通过unicode 去转码

论坛徽章:
0
9 [报告]
发表于 2014-08-15 22:12 |只看该作者
感谢大家解惑,谢谢!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP