Chinaunix

标题: 关于 TreeBuilder 与unicode 问题 [打印本页]

作者: abcgac    时间: 2015-11-12 07:07
标题: 关于 TreeBuilder 与unicode 问题
      用 TreeBuilder 提取中文时不能用正则匹配,把中文转成UTF8后就可匹配,但当用上 use encoding 'euc_cn';这句时又不能匹配了。有大侠能解释下原因和用上use encoding 'euc_cn' 能正则匹配解决办法吗?谢了!
作者: zhlong8    时间: 2015-11-12 10:07
编码问题很繁琐,不难但是要两边都对上才好做。我只会最笨的方法,输入全部用 Encode::decode 给转成 perl 的内部格式 utf8, 脚本里面用 use utf8; 脚本保存格式设为 UTF-8。

简单的问题还好,麻烦点的本身就一团浆糊了靠试就更不可能解决问题了。
作者: abcgac    时间: 2015-11-12 11:01
问题已自己解了,当加有use encoding 'euc_cn时,utf8开关是关闭的的,有中文时只要把utf8打开即可。谢谢你的回答。




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2