免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2127 | 回复: 2
打印 上一主题 下一主题

关于 TreeBuilder 与unicode 问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-11-12 07:07 |只看该作者 |倒序浏览
      用 TreeBuilder 提取中文时不能用正则匹配,把中文转成UTF8后就可匹配,但当用上 use encoding 'euc_cn';这句时又不能匹配了。有大侠能解释下原因和用上use encoding 'euc_cn' 能正则匹配解决办法吗?谢了!

论坛徽章:
46
15-16赛季CBA联赛之四川
日期:2018-03-27 11:59:132015年亚洲杯之沙特阿拉伯
日期:2015-04-11 17:31:45天蝎座
日期:2015-03-25 16:56:49双鱼座
日期:2015-03-25 16:56:30摩羯座
日期:2015-03-25 16:56:09巳蛇
日期:2015-03-25 16:55:30卯兔
日期:2015-03-25 16:54:29子鼠
日期:2015-03-25 16:53:59申猴
日期:2015-03-25 16:53:29寅虎
日期:2015-03-25 16:52:29羊年新春福章
日期:2015-03-25 16:51:212015亚冠之布里斯班狮吼
日期:2015-07-13 10:44:56
2 [报告]
发表于 2015-11-12 10:07 |只看该作者
编码问题很繁琐,不难但是要两边都对上才好做。我只会最笨的方法,输入全部用 Encode::decode 给转成 perl 的内部格式 utf8, 脚本里面用 use utf8; 脚本保存格式设为 UTF-8。

简单的问题还好,麻烦点的本身就一团浆糊了靠试就更不可能解决问题了。

论坛徽章:
0
3 [报告]
发表于 2015-11-12 11:01 |只看该作者
问题已自己解了,当加有use encoding 'euc_cn时,utf8开关是关闭的的,有中文时只要把utf8打开即可。谢谢你的回答。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP