免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1643 | 回复: 9
打印 上一主题 下一主题

这种字符实在是让小弟无语凝噎,求高手帮忙 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-06-13 17:42 |只看该作者 |倒序浏览
小弟接触Python也就几天,问题可能确实比较幼稚,希望各位高手不要笑话小弟才是,小弟感谢。

实际上最近老大丢给我个项目,大概就是从AppStore的RSS源(我也不知道BOSS怎么弄到这个URL的,反正我是没有Google到),然后存到本地数据库里。小弟这二把刀的水平勉强弄了个小的脚本出来,现在基本功能倒是都满足了,不过发现数据里会有一些不太常见的字符,比如“®”这种。

小弟尝试了下用UTF-8编码,不过好像杯具了。请教高手像这类的符号一般应该怎么处理呢?感谢

论坛徽章:
0
2 [报告]
发表于 2012-06-13 17:45 |只看该作者
补充,小弟的测试程序是这样的:
  1. #-*- coding: utf-8 -*-

  2. str = "兄弟连® 2:全球战线 免费版+"
  3. print str
复制代码
得到的结果是“鍏勫紵杩灺?2锛氬叏鐞冩垬绾?鍏嶈垂鐗?”这样的乱码;如果换用gbk则会直接提示“encoding problem”。小弟确实没招了,再次感谢各位帮忙

论坛徽章:
0
3 [报告]
发表于 2012-06-13 23:34 |只看该作者
回复 2# caibird1984

我复制你的代码运行,显示正常啊。
不知道楼主说的是什么问题。

论坛徽章:
0
4 [报告]
发表于 2012-06-14 03:57 |只看该作者
print  str.decode('utf-8').encode('gbk')

论坛徽章:
0
5 [报告]
发表于 2012-06-14 04:55 |只看该作者
print str.decode('utf-8').encode('gbk')

论坛徽章:
0
6 [报告]
发表于 2012-06-14 05:56 |只看该作者
回复 2# caibird1984


python t.py
兄弟连® 2:全球战线 免费版+

没有问题亚,估计是你的console的编码不是utf8

论坛徽章:
0
7 [报告]
发表于 2012-06-14 08:10 |只看该作者
python 3 没问题

论坛徽章:
0
8 [报告]
发表于 2012-06-14 10:46 |只看该作者
小弟这是在windows下用的ActivePython 2.6用windows控制台输出的

那小弟再去试试看,多谢各位高手指点

论坛徽章:
2
CU大牛徽章
日期:2013-04-17 11:46:28CU大牛徽章
日期:2013-04-17 11:46:39
9 [报告]
发表于 2012-06-14 11:57 |只看该作者
试试:
  1. print str.decode('gb18030')
复制代码

论坛徽章:
0
10 [报告]
发表于 2012-06-14 12:19 |只看该作者
感谢楼上诸位,小弟换了个console试了试代码确实是没问题的。

看来以后得弄个Linux来开发脚本了,windows的cmd似乎有些编码问题
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP