平台论坛博客文库

› 论坛 › 程序设计 › Python › 请教python3的中文解码问题

请教python3的中文解码问题 [复制链接]

strayhrt

白手起家

论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2012-12-24 10:42 |只看该作者 |倒序浏览

本人是python新手, 工作需要用到python3.  现在有下面这么一个字符串.

ss = '<th colspan="8" align=left>\xe8\xaf\xb4\xe6\x98\x8e\xe6\xad\xa4\xe4\xb8\xba1\xe6\x96\xb9\xe6\xa1\x88\xef\xbc\x88'

2.7的话直接ss.decode('utf-8')就能得到正确的解码了.

但是3的话会报错。。。  查文档是字符串没有decode方法，只有bytes对象有。。

但是尝试转化成bytes对象的话用bytes() 或者是ss.encode都会把字符串再次编码成b'<th colspan="8" align=left>\xc3\xa8\xc2\xaf\'  这样的数据。。。

再尝试用 eval('b\''+ss+'\'') 会报SyntaxError: bytes can only contain ASCII literal characters.这样的错误。。。

无奈了求大侠们指点啊

文库|博客

zenghay

白手起家

论坛徽章:: 0

2楼 [报告]

发表于 2012-12-24 12:34 |只看该作者

ss本来就应该是byte对象
>>> ss = b'<th colspan="8" align=left>\xe8\xaf\xb4\xe6\x98\x8e\xe6\xad\xa4\xe4\xb8\xba1\xe6\x96\xb9\xe6\xa1\x88\xef\xbc\x88'
>>> ss.decode ('utf-8')
'<th colspan="8" align=left>说明此为1方案（'

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

返回列表

Chinaunix › 论坛 › 程序设计 › Python › 请教python3的中文解码问题

请教python3的中文解码问题 [复制链接]

浏览过的版块