免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2249 | 回复: 4
打印 上一主题 下一主题

perl的字面串(或曰明文)是什么编码的? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-05-19 22:36 |只看该作者 |倒序浏览
perldoc里有两个概念,text string和binary string,按其建议,除了特别要针对二进制做处理外,应该对外部来的string都decode成text string。那么perl里的明文是什么string呢?和源代码的编码有关吗?我有一个明文my $mt='贴子数<span class="red">([\d]+)</span>‘;如果我不对其decode ,它无法与一个从外部来的decode好的string进行正则式匹配,如果decode('gb2312',$mt),则又报错:malformated utf-8 character (unexpected non-continuation byte 0xf9…………。
咋地办呢?我感觉perl的编码问题很麻烦。

论坛徽章:
46
15-16赛季CBA联赛之四川
日期:2018-03-27 11:59:132015年亚洲杯之沙特阿拉伯
日期:2015-04-11 17:31:45天蝎座
日期:2015-03-25 16:56:49双鱼座
日期:2015-03-25 16:56:30摩羯座
日期:2015-03-25 16:56:09巳蛇
日期:2015-03-25 16:55:30卯兔
日期:2015-03-25 16:54:29子鼠
日期:2015-03-25 16:53:59申猴
日期:2015-03-25 16:53:29寅虎
日期:2015-03-25 16:52:29羊年新春福章
日期:2015-03-25 16:51:212015亚冠之布里斯班狮吼
日期:2015-07-13 10:44:56
2 [报告]
发表于 2011-05-19 23:03 |只看该作者
Encode 模块,encoding pragma,文件的编码 这三个方面懂了就没什么问题。仙子有个精华

论坛徽章:
0
3 [报告]
发表于 2011-05-19 23:06 |只看该作者
上面写错了,报的是:wide character in subroutine entry at D:/perl/lib/Encode.pm line 174

论坛徽章:
0
4 [报告]
发表于 2011-05-19 23:09 |只看该作者
decode时,decode处报wide character in subroutine entry at D:/perl/lib/Encode.pm line 174
不decode时,在匹配处报malformated utf-8 character (unexpected non-continuation byte 0xf9…………。

论坛徽章:
0
5 [报告]
发表于 2011-05-20 08:06 |只看该作者
你的Perl是什么版本?Perl新版本编码方面的功能很方便了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP