免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: beyondlee1
打印 上一主题 下一主题

正则---请教 [复制链接]

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
11 [报告]
发表于 2016-11-16 10:17 |显示全部楼层
  1. sub get_values{
  2.     my $val = shift;
  3.     ($_, $val) = $val =~ /油墨型号([^a-z]*)((?:\s*[-\/a-z0-9]+|\s*[((]指定[))])+)/i;
  4.     $val .= $1 if (/([((]指定[))])/);
  5.     return "$val\n";
  6. }
复制代码

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
12 [报告]
发表于 2016-11-16 12:41 |显示全部楼层
把你的 get_values 函数完整的贴出来. 看下问题出在哪里???

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
13 [报告]
发表于 2016-11-16 12:50 |显示全部楼层
本帖最后由 sunzhiguolu 于 2016-11-16 12:52 编辑

比较一下, 哪里不同?
  1. perl test.pl
复制代码

ZM-400 WF(指定)
PSR-2000 LF03HF(指定)

  1. cat test.pl
复制代码
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;
  4. use utf8;

  5. binmode (STDOUT, ':encoding(utf8)');

  6. sub get_values{
  7.         my $val = shift;
  8.         ($_, $val) = $val =~ m!油墨型号([^a-z]*)((?:\s*[-/a-z0-9]+|\s*[((]指定[))])+)!i;
  9.         $val .= $1 if (/([((]指定[))])/);
  10.         return "$val\n";
  11. }

  12. while (<DATA>){
  13.         print get_values ($_);
  14. }

  15. __DATA__
  16. 双面阻焊,油墨型号:ZM-400 WF(指定);颜色:绿色;油墨特性:感光;油墨厚度:厂内管控20+/-5um;导电孔方式:塞孔;无卤素板材,阻焊不可退洗,如要退洗,请提出申请
  17. 单面阻焊:S/S面;油墨型号:PSR-2000 LF03HF(指定);颜色:绿色;油墨特性:感光;油墨厚度:10-25um;无卤素板材不可以退洗,如要退洗请提出申请
复制代码



论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
14 [报告]
发表于 2016-11-16 15:00 |显示全部楼层
你在什么环境下 调用的 perl 脚本?

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
15 [报告]
发表于 2016-11-16 15:14 |显示全部楼层
如果是 Windows DOS 环境调用的话:
1.> 确保脚本文件的编码方式为 UTF8;
2.> 确保脚本的输出内容与 Windows 控制台的默认编码一致;

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
16 [报告]
发表于 2016-11-16 15:24 |显示全部楼层
本帖最后由 sunzhiguolu 于 2016-11-16 15:26 编辑

比较一下, 设置哪里不同?

abc.gif (51.32 KB, 下载次数: 20)

DOS Console

DOS Console

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
17 [报告]
发表于 2016-11-16 17:28 |显示全部楼层
本帖最后由 sunzhiguolu 于 2016-11-16 17:29 编辑

谢谢你的推荐, 我已经有了文本编辑器了.
Windows 控制台不能更改默认的编码 (我已经折腾过好长时间了), 但是你可以将 perl 的标准输出编码与 Windows DOS 控制台的编码保持一致, 这样就解决 "Malformed UTF-8 character" 问题了.

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
18 [报告]
发表于 2016-11-17 11:15 |显示全部楼层
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;
  4. use utf8;

  5. binmode (STDOUT, ':encoding(gb2312)');

  6. sub get_values{
  7.         my $val = shift;
  8.         ($_, $val) = $val =~ m!油墨型号([^a-z]*)((?:\s*[-/a-z0-9]+|\s*[((]指定[))])+)!i;
  9.         $val .= $1 if (/([((]指定[))])/);
  10.         return "$val\n";
  11. }

  12. while (<DATA>){
  13.         print get_values ($_);
  14. }

  15. __DATA__
  16. 双面阻焊,油墨型号:ZM-400 WF(指定);颜色:绿色;油墨特性:感光;油墨厚度:厂内管控20+/-5um;导电孔方式:塞孔;无卤素板材,阻焊不可退洗,如要退洗,请提出申请
  17. 单面阻焊:S/S面;油墨型号:PSR-2000 LF03HF(指定);颜色:绿色;油墨特性:感光;油墨厚度:10-25um;无卤素板材不可以退洗,如要退洗请提出申请
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP