免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3414 | 回复: 6
打印 上一主题 下一主题

请问如何调用浏览器来处理html文件? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-11-13 16:04 |只看该作者 |倒序浏览
从网上抓下来的html里头都带有js
而js有可能修改html的内容
所以如果简单判断html是不行的
真正需要的是跑完js之后的html

请问有没有什么工具可以将这样的html预处理一遍?
最好是跨平台的工具
高手指点一下吧

论坛徽章:
324
射手座
日期:2013-08-23 12:04:38射手座
日期:2013-08-23 16:18:12未羊
日期:2013-08-30 14:33:15水瓶座
日期:2013-09-02 16:44:31摩羯座
日期:2013-09-25 09:33:52双子座
日期:2013-09-26 12:21:10金牛座
日期:2013-10-14 09:08:49申猴
日期:2013-10-16 13:09:43子鼠
日期:2013-10-17 23:23:19射手座
日期:2013-10-18 13:00:27金牛座
日期:2013-10-18 15:47:57午马
日期:2013-10-18 21:43:38
2 [报告]
发表于 2010-11-13 16:49 |只看该作者
windows下可以用IHTMLDocument2这个COM接口,跨平台的不知道

论坛徽章:
0
3 [报告]
发表于 2010-11-13 23:33 |只看该作者
不懂windows更不懂COM
不过还是感谢楼上的大好人

论坛徽章:
26
处女座
日期:2016-04-18 14:00:4515-16赛季CBA联赛之深圳
日期:2020-06-02 10:10:5015-16赛季CBA联赛之广夏
日期:2019-07-23 16:59:452016科比退役纪念章
日期:2019-06-26 16:59:1315-16赛季CBA联赛之天津
日期:2019-05-28 14:25:1915-16赛季CBA联赛之青岛
日期:2019-05-16 10:14:082016科比退役纪念章
日期:2019-01-11 14:44:062016科比退役纪念章
日期:2018-07-18 16:17:4015-16赛季CBA联赛之上海
日期:2017-08-22 18:18:5515-16赛季CBA联赛之江苏
日期:2017-08-04 17:00:4715-16赛季CBA联赛之佛山
日期:2017-02-20 18:21:1315-16赛季CBA联赛之天津
日期:2016-12-12 10:44:23
4 [报告]
发表于 2010-11-14 11:10 |只看该作者
可以使用XML库来解析HTML文件 ,不过对HTML格式要求比较严格 ~

论坛徽章:
0
5 [报告]
发表于 2010-11-14 11:11 |只看该作者
firefox可以吧

论坛徽章:
0
6 [报告]
发表于 2010-11-14 19:10 |只看该作者
浏览器肯定能处理带有JS的html代码
并且很好的显示出来

但是查看html源代码的时候依然是最原始的web server发过来的html
我只知道用GreenBrowser可以看到经过JS解析之后的html代码
但是用编程的办法还不知道怎么搞

是不是应该有那么一个函数
将html代码和js代码都传给它
然后它返回一个处理后的html给我?

论坛徽章:
1
CU十二周年纪念徽章
日期:2013-10-24 15:41:34
7 [报告]
发表于 2010-11-15 08:48 |只看该作者
类似一些chm资料文件显示网页么?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP