免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2382 | 回复: 2
打印 上一主题 下一主题

函数模块中不能写文件么?还有windows下的utf8编码问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-11-10 23:17 |只看该作者 |倒序浏览
  1. #!/usr/bin/python
  2. # -*- coding: utf-8 -*-
  3. #gb2312-utf8
  4. import sys
  5. import chardet
  6. import urllib2

  7. def blog(blogurl):
  8.     '''
  9.     检测blog的编码方式
  10.     @param blogurl: 要检测blog的url
  11.     '''
  12.     try:
  13.         fp = urllib2.urlopen(blogurl)                       #尝试打开给定url
  14.     except Exception, e:                                    #若产生异常,则给出相关提示并返回
  15.         print e
  16.         print 'download exception %s' % blogurl
  17.         return 'hello world'
  18.     blog = fp.read() #读取内容
  19.     codedetect = chardet.detect(blog)["encoding"]           #检测得到编码方式
  20.     f=file('index.html','w')
  21.     f.write(blog)
  22.     f.close()
  23.     ting=unicode(blog,'utf-8')
  24.     fp.close()
  25. if __name__ == "__main__":
  26.     blog('http://blog.chinaunix.net/u4/121053/')
复制代码
上边的代码遇到两个问题,一个是写文件不成功,但是放到main函数中就可以
还有一个是编码问题UnicodeDecodeError: 'utf8' codec can't decode bytes in position 330-331,但是在linux下就没有这个错误,是不是utf8写的有问题?

论坛徽章:
0
2 [报告]
发表于 2010-11-11 10:30 |只看该作者
文件另存为utf8格式试试

论坛徽章:
0
3 [报告]
发表于 2010-11-12 14:41 |只看该作者
回复 2# smallfish_xy


    多谢楼上回复,最后通过先解码然后再编码就可以了decode/encode
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP