免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 5899 | 回复: 5

python3.3byte.decode时常出现中文utf8解码失败,还有人遇到过嘛? [复制链接]

论坛徽章:
0
发表于 2013-12-23 17:20 |显示全部楼层

从android系统(厂商提供的服务)发出的utf8字符串,python3.3收到以后调用decode("utf8",“strick")时常报异常,例如”涂“字,utf8表示为E6B682,就解不了。还有部分以0xE8打头的,比如”连“字,也解不了。系统是win7+sp1。

论坛徽章:
0
发表于 2013-12-23 17:34 |显示全部楼层
你这“从android系统(厂商提供的服务)发出的”应该不是utf8字符串(符合某协议的二进制?)

论坛徽章:
0
发表于 2013-12-23 18:08 |显示全部楼层
回复 2# remyzane

我把二进制保存了看了,是合法的。像”涂“字,utf8表示为E6 B6 82,在里面表示是正确的。python解码raise异常。

   

论坛徽章:
0
发表于 2013-12-23 18:58 |显示全部楼层
>>> tu = '涂'.encode('utf8')
>>> tu
b'\xe6\xb6\x82'
>>> tu.decode('utf8')
'涂'

你确定那个E6B682是b'\xe6\xb6\x82'?
还有你确定是b'\xe6\xb6\x82'报错吗,而不是它前面有什么特殊字符?

论坛徽章:
0
发表于 2013-12-25 10:37 |显示全部楼层
我已经用c语言自己转码了

论坛徽章:
0
发表于 2013-12-27 10:29 |显示全部楼层
可以试试gb18030的汉字编码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

SACC2021中国系统架构师大会

【数字转型 架构重塑】2021年5月20日-22日第十三届中国系统架构师大会将在云端进行网络直播。

大会为期3天的议程,涉及20+专场,近120个主题,完整迁移到线上进行网络直播对会议组织来说绝非易事;但考虑到云端会议的直播形式可以实现全国各地技术爱好者的参与,也使ITPUB作为技术共享交流平台得到更好的普及,我们决定迎难而上。
http://sacc.it168.com/


大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP