免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3057 | 回复: 3
打印 上一主题 下一主题

请问"\u4E2D"这样的unicode字符怎么处理 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-07-31 15:49 |只看该作者 |倒序浏览
想用perl处理别人的网页上的一些信息。

但遇到了一点问题

对方的网站使用了ajax,而我分析了格式后直接提交

获取回的数据内有如下内容
  1. <span><a href="#">\u505c\u8f66</a>
复制代码

\u505c\u8f66 实际上是 停车 两个汉字

如果我这样写
my $unicode = "\x{505c}\x{8f66}";
print encode("gb2312", $unicode);
就可以打印出“停车”

但我不知道如何对获取到的html的内容中的 \uXXXX 进行处理。

麻烦各位达人帮帮忙,谢谢了

ps:在javascript中,"\u505c\u8f66"是会被内部处理的。
比如
<script type="text/javascript">
alert("\u505c\u8f66");
</script>
会直接显示“停车”

[ 本帖最后由 透明de面具 于 2008-7-31 15:52 编辑 ]

论坛徽章:
0
2 [报告]
发表于 2008-07-31 15:54 |只看该作者
那你的意思是想分析出\u505c\u8f66 这段信息么

论坛徽章:
0
3 [报告]
发表于 2008-07-31 15:58 |只看该作者
嗯,也就是可以显示出其所代表的中文字

论坛徽章:
0
4 [报告]
发表于 2008-07-31 16:46 |只看该作者
想不到什么好的办法 按4位取也不稳妥 期待高人出现
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP