免费注册	查看新帖 \|


平台论坛博客文库

› 论坛 › 程序设计 › Perl › 关于网页内容解码的一个问题

最近访问板块

发新帖

查看: 1695 | 回复: 6

上一主题

下一主题

关于网页内容解码的一个问题 [复制链接]

论坛徽章:: 0

电梯直达

跳转到指定楼层

1楼 [收藏(0)] [报告]

发表于 2012-06-14 14:12 |只看该作者 |倒序浏览

通过LWP得到一个网页的内容，编码是iso-8859-1

我把提取的内容直接打印会有一些类似“聽”的乱码，用decode("iso-8859-1", "聽");之后还是一样

看网页的source这应该是一个空格，请问如何才能把它变成 ？（不是乱码就行）（这个字符占了2个位置，就是用..才能匹配上）

多谢指教~

文库|博客

论坛徽章:: 2

CU大牛徽章
日期:2013-04-17 11:46:28

CU大牛徽章
日期:2013-04-17 11:46:39

2楼 [报告]

发表于 2012-06-14 15:50 |只看该作者

那个网页？那一行？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

py

论坛徽章:: 1

2015年辞旧岁徽章
日期:2015-03-03 16:54:15

3楼 [报告]

发表于 2012-06-14 15:53 |只看该作者

use HTML::Entities;

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 1

摩羯座
日期:2014-12-29 15:59:36

4楼 [报告]

发表于 2012-06-15 12:46 |只看该作者

iso-8859-1???确定

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

xiyoulaoyuanjia

论坛徽章:: 0

5楼 [报告]

发表于 2012-06-15 13:42 |只看该作者

觉得还是先把编码搞清楚再 decode 吧

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

6楼 [报告]

发表于 2012-06-18 10:32 |只看该作者

回复 4# ziyunfei

应该是，view source的时候有这么一行：
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

7楼 [报告]

发表于 2012-06-18 10:36 |只看该作者

回复 2# cdtits

是公司内部访问的网址。。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

发新帖

Chinaunix › 论坛 › 程序设计 › Perl › 关于网页内容解码的一个问题

北京盛拓优讯信息技术有限公司. 版权所有京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号：11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员联系我们：huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP