免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1799 | 回复: 1

请教python3的中文解码问题 [复制链接]

论坛徽章:
0
发表于 2012-12-24 10:42 |显示全部楼层
本人是python新手, 工作需要用到python3.  现在有下面这么一个字符串.

ss = '<th colspan="8" align=left>\xe8\xaf\xb4\xe6\x98\x8e\xe6\xad\xa4\xe4\xb8\xba1\xe6\x96\xb9\xe6\xa1\x88\xef\xbc\x88'

2.7的话直接ss.decode('utf-8')就能得到正确的解码了.

但是3的话会报错。。。  查文档是字符串没有decode方法,只有bytes对象有。。

但是尝试转化成bytes对象的话用bytes() 或者是ss.encode都会把字符串再次编码成b'<th colspan="8" align=left>\xc3\xa8\xc2\xaf\'  这样的数据。。。

再尝试用 eval('b\''+ss+'\'')   会报SyntaxError: bytes can only contain ASCII literal characters.这样的错误。。。


无奈了    求大侠们指点啊

论坛徽章:
0
发表于 2012-12-24 12:34 |显示全部楼层
ss本来就应该是byte对象
>>> ss = b'<th colspan="8" align=left>\xe8\xaf\xb4\xe6\x98\x8e\xe6\xad\xa4\xe4\xb8\xba1\xe6\x96\xb9\xe6\xa1\x88\xef\xbc\x88'
>>> ss.decode ('utf-8')
'<th colspan="8" align=left>说明此为1方案('
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP