免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: t6760915
打印 上一主题 下一主题

怎么把文件存储为utf-8格式的啊? [复制链接]

论坛徽章:
0
11 [报告]
发表于 2010-05-20 10:07 |只看该作者
utf-8也存在有BOM和无BOM格式的。

论坛徽章:
0
12 [报告]
发表于 2010-05-20 10:17 |只看该作者
utf-8也存在有BOM和无BOM格式的。
2gua 发表于 2010-05-20 10:07



    我说的意思不是很明白嘛,想转成无bom的utf8存储

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
13 [报告]
发表于 2010-05-20 11:02 |只看该作者
你是用windows编程啊?
如果使用IDE,一般都有设置默认编码的选项。
比如eclipse ,编辑--设置编码

论坛徽章:
0
14 [报告]
发表于 2010-05-20 11:10 |只看该作者
你是用windows编程啊?
如果使用IDE,一般都有设置默认编码的选项。
比如eclipse ,编辑--设置编码
昭襄王 发表于 2010-05-20 11:02



    牛头不对马嘴,你看我的问题了没有?我写文件的编码跟ide有几毛关系?

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
15 [报告]
发表于 2010-05-20 11:23 |只看该作者
牛头不对马嘴,你看我的问题了没有?我写文件的编码跟ide有几毛关系?
t6760915 发表于 2010-05-20 11:10



    算了,你就继续糊涂吧

论坛徽章:
0
16 [报告]
发表于 2010-05-20 11:24 |只看该作者
算了,你就继续糊涂吧
昭襄王 发表于 2010-05-20 11:23



    我倒,还生气了。。

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
17 [报告]
发表于 2010-05-20 11:28 |只看该作者
我没生气啊,我生的哪门子气?我挺愿意陪你玩。真的没生气

论坛徽章:
0
18 [报告]
发表于 2010-05-20 11:28 |只看该作者
本帖最后由 t6760915 于 2010-05-20 11:31 编辑

我使用的ide就是editplus,这有什么问题啊[img][/img]

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
19 [报告]
发表于 2010-05-20 11:47 |只看该作者
小游戏:
  1. $ cat poem1 && enca poem1
  2. Programming is fun
  3. When the work is done
  4. if you wanna make your work also fun:
  5.         use Python!
  6. 7bit ASCII characters
复制代码
然后poem1里面敲几个汉字
  1. $ cat poem1 && enca poem1
  2. Programming is fun
  3. When the work is done
  4. if you wanna make your work also fun:
  5.         use Python!
  6. 你好
  7. Universal transformation format 8 bits; UTF-8
复制代码

论坛徽章:
0
20 [报告]
发表于 2010-05-20 15:12 |只看该作者
本帖最后由 luffy.deng 于 2010-05-20 15:15 编辑

手工加上bom就行了  这是我得到的结果,win32下。
  1. import chardet
  2. import sys
  3. import codecs

  4. html=open('a.txt','r').read()
  5. htmlCharSet = chardet.detect(html)['encoding']
  6. print htmlCharSet
  7. html = html.decode(htmlCharSet)
  8. html = html.encode('utf-8')
  9. html =codecs.BOM_UTF8+html
  10. print chardet.detect(html)['encoding']

  11. f= open('au.txt','w')
  12. f.write(html)
  13. f.close()
复制代码
  1. autf8.zip (114 Bytes, 下载次数: 8) a.zip (109 Bytes, 下载次数: 4)
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP