免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 5716 | 回复: 4
打印 上一主题 下一主题

文件读取 utf8 中文乱码? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-04-30 14:28 |只看该作者 |倒序浏览
一小段代码,从文件中读取内容,并打印出来。
  1. #!/usr/bin/perl
  2. use utf8;
  3. use strict;
  4. binmode(STDOUT,':encoding(utf8)');
  5. binmode(MYFILE,':encoding(utf8)');#########Point I

  6. # txt 里面只有一句话:我是中国人  Hello,I'm from China. 文件编码utf8。
  7. unless(open(MYFILE,"n1.txt"))
  8. {
  9.         die ("open the file failed...\n");
  10. }

  11. my $line = <MYFILE>;
  12. print $line;  ##############Question Point?

  13. my $line2="我是中国人  Hello,I'm from China.";
  14. print $line2," \n";

  15. print $line==$line2;
复制代码
为什么$line的打印的结果是乱码? <oint I>的声明似乎不起作用。。。

论坛徽章:
78
双子座
日期:2013-10-15 08:50:09天秤座
日期:2013-10-16 18:02:08白羊座
日期:2013-10-18 13:35:33天蝎座
日期:2013-10-18 13:37:06狮子座
日期:2013-10-18 13:40:31双子座
日期:2013-10-22 13:58:42戌狗
日期:2013-10-22 18:50:04CU十二周年纪念徽章
日期:2013-10-24 15:41:34巨蟹座
日期:2013-10-24 17:14:56处女座
日期:2013-10-24 17:15:30双子座
日期:2013-10-25 13:49:39午马
日期:2013-10-28 15:02:15
2 [报告]
发表于 2010-04-30 14:57 |只看该作者
utf8下的中文不就是乱码。。。gb2312下才能看中文吧

print encode("gb2312",decode("utf8",$line));

或者

binmode(STDOUT,':encoding(gb2312)');

print decode("utf8",$line);

论坛徽章:
0
3 [报告]
发表于 2010-04-30 15:11 |只看该作者
回复 2# yybmsrs


    额不是这个意思。utf8下也可以看中文。我的n1.txt就包含utf-8下的中文。
   你的方式把内容转成gb2312。或许可以,但项目整体都是utf8的。

我感觉是 文件读取进来一开始就没有按utf8编码。

刚刚强制转了一次,结果倒是正常了。

  1. Encode::_utf8_on($line);
  2. print $line;
复制代码
但理想的情况是希望做统一的设置,不必每次都自己装换。
binmode(MYFILE,":utf8") 那句为什么不起作用呢?

论坛徽章:
78
双子座
日期:2013-10-15 08:50:09天秤座
日期:2013-10-16 18:02:08白羊座
日期:2013-10-18 13:35:33天蝎座
日期:2013-10-18 13:37:06狮子座
日期:2013-10-18 13:40:31双子座
日期:2013-10-22 13:58:42戌狗
日期:2013-10-22 18:50:04CU十二周年纪念徽章
日期:2013-10-24 15:41:34巨蟹座
日期:2013-10-24 17:14:56处女座
日期:2013-10-24 17:15:30双子座
日期:2013-10-25 13:49:39午马
日期:2013-10-28 15:02:15
4 [报告]
发表于 2010-04-30 16:55 |只看该作者
回复 3# jenghau

   用你说的试了下还是乱码  可能是我的环境没配好

    把open MYFILE 放在binmode(MYFILE,':encoding(utf');前面试试

论坛徽章:
0
5 [报告]
发表于 2010-05-03 11:07 |只看该作者
这个如果在windows下,是否还与cmd.exe的设置有关呢?
即使使用了Encode::_utf8_on($line);,仍然乱码。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP