Chinaunix
标题:
关于 TreeBuilder 与unicode 问题
[打印本页]
作者:
abcgac
时间:
2015-11-12 07:07
标题:
关于 TreeBuilder 与unicode 问题
用 TreeBuilder 提取中文时不能用正则匹配,把中文转成UTF8后就可匹配,但当用上 use encoding 'euc_cn';这句时又不能匹配了。有大侠能解释下原因和用上use encoding 'euc_cn' 能正则匹配解决办法吗?谢了!
作者:
zhlong8
时间:
2015-11-12 10:07
编码问题很繁琐,不难但是要两边都对上才好做。我只会最笨的方法,输入全部用 Encode::decode 给转成 perl 的内部格式 utf8, 脚本里面用 use utf8; 脚本保存格式设为 UTF-8。
简单的问题还好,麻烦点的本身就一团浆糊了靠试就更不可能解决问题了。
作者:
abcgac
时间:
2015-11-12 11:01
问题已自己解了,当加有use encoding 'euc_cn时,utf8开关是关闭的的,有中文时只要把utf8打开即可。谢谢你的回答。
欢迎光临 Chinaunix (http://bbs.chinaunix.net/)
Powered by Discuz! X3.2