免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2248 | 回复: 4
打印 上一主题 下一主题

python处理中文问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-01-19 23:27 |只看该作者 |倒序浏览
一个网页编码是gb2312
我在python中
这么设定
# -*- coding: gb2312 -*-
reload(sys)
sys.setdefaultencoding('gb2312')

但是出现: 'gb2312' codec can't decode bytes in position 0-1: illegal multibyte sequence
咋整?

论坛徽章:
0
2 [报告]
发表于 2010-01-20 08:36 |只看该作者
虽然是网页是gb2312,但是还是推荐用gb18030
# -*- coding: gb2312 -*- 跟网页的编码没有直接关系  所有文件统一用utf-8比较好

论坛徽章:
0
3 [报告]
发表于 2010-01-20 08:59 |只看该作者
我全换成gb18030
还是提示gb2312的错误
'gb2312' codec can't encode character u'\u2014' in position 235: illegal multibyte sequence

论坛徽章:
0
4 [报告]
发表于 2010-01-20 09:52 |只看该作者
加QQ聊吧..我帮你看看

[ 本帖最后由 check1234 于 2010-1-20 13:44 编辑 ]

论坛徽章:
0
5 [报告]
发表于 2010-01-20 13:19 |只看该作者
,我也碰到这样的问题.
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP