免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1413 | 回复: 6
打印 上一主题 下一主题

还是汉字编码问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-07-16 15:46 |只看该作者 |倒序浏览
@a = qw(张 刘| 李| 王 珅);
foreach $b (@a) {
        $b =~ s/\|//g;
        print "$b\n";
}

最近在处理一个文件的时候,用户名很混乱,含有一些乱七八糟的字符,比如=,|,(,)等等。我的想法是将里面的|,这个符号全部删除。其他的字符就不管了。因为后续的处理要|做分隔符。代码如上,可处理到汉字"珅"的时候,就出现了乱码。不知道这种该怎么处理?求指点。

论坛徽章:
2
金牛座
日期:2013-09-06 09:16:182015年迎新春徽章
日期:2015-03-04 09:53:17
2 [报告]
发表于 2012-07-16 16:00 |只看该作者
加上 use encoding "utf-8", STDOUT=>"GBK";

论坛徽章:
7
2015年亚洲杯之约旦
日期:2015-03-05 17:03:522015亚冠之山东鲁能
日期:2015-09-29 13:01:2115-16赛季CBA联赛之四川
日期:2016-01-18 15:47:0215-16赛季CBA联赛之广夏
日期:2016-02-24 11:47:1515-16赛季CBA联赛之辽宁
日期:2016-11-01 09:45:4115-16赛季CBA联赛之青岛
日期:2017-02-15 10:02:182016科比退役纪念章
日期:2017-02-16 17:25:35
3 [报告]
发表于 2012-07-16 16:07 |只看该作者
shell  不懂

论坛徽章:
0
4 [报告]
发表于 2012-07-16 16:16 |只看该作者
回复 2# nixiaoweihunter


    这个怎么加?没用过。谢谢。

论坛徽章:
2
CU大牛徽章
日期:2013-04-17 11:46:28CU大牛徽章
日期:2013-04-17 11:46:39
5 [报告]
发表于 2012-07-16 18:39 |只看该作者
貌似正则这东西,还得具体问题具体分析。
很难做到适用于所有情况

论坛徽章:
0
6 [报告]
发表于 2012-07-17 10:03 |只看该作者
顶起,找人帮忙呀

论坛徽章:
46
15-16赛季CBA联赛之四川
日期:2018-03-27 11:59:132015年亚洲杯之沙特阿拉伯
日期:2015-04-11 17:31:45天蝎座
日期:2015-03-25 16:56:49双鱼座
日期:2015-03-25 16:56:30摩羯座
日期:2015-03-25 16:56:09巳蛇
日期:2015-03-25 16:55:30卯兔
日期:2015-03-25 16:54:29子鼠
日期:2015-03-25 16:53:59申猴
日期:2015-03-25 16:53:29寅虎
日期:2015-03-25 16:52:29羊年新春福章
日期:2015-03-25 16:51:212015亚冠之布里斯班狮吼
日期:2015-07-13 10:44:56
7 [报告]
发表于 2012-07-17 10:49 |只看该作者
Perl 默认字符串是 bytes 一个汉字会被当成多个字符,所以处理字符串往往不符合中文的语意,看下仙子关于编码的帖子吧。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP