免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 24615076 | 回复: 24615076

[C++] WebKit解析HTML问题 [复制链接]

论坛徽章:
0
发表于 2008-07-11 10:53 |显示全部楼层
最近正在用WebKit,可是突然要在没有图形界面的情况下解析HTML。。。
也就是说只用WebKit里面解析HTML的模块的功能。。。
看了几天代码,眼都花了,那位大侠能帮帮忙指点一下这里WebKit解析HTML的主要结构,最好是API。。。
网上四处找了,没有API。。。
万分感谢!~~~

论坛徽章:
0
发表于 2008-07-11 11:06 |显示全部楼层
感觉只要得到Dcoument对象就好了,但是这个对象好难得到。。。
可是以前用的KHTML解析的,很简单,用KHTMLPart对象,通过QString就可以了。。
下面是代码:
                                KHTMLPart *khtmlpart = NULL;
                               
                                khtmlpart = new KHTMLPart();

                                QString pstStr= my_html;
       这里的“my_html”是从HTML文件中读到的一个string。。。

                                    khtmlpart->begin();
                                    khtmlpart->write(pstStr);
       这里就完成了解析等功能的。。。
                                    khtmlpart->end();

                                DOM::  Document document = khtmlpart->document();
       得到Document了,很简单的。。。

       但是WebKit里面是不是也有类似的对象呢???

论坛徽章:
0
发表于 2008-07-11 22:12 |显示全部楼层
搞了半天了。。。痛苦的快要放弃了。。。
现在准备搞Gecko解析。。。至少有一点test代码可以借鉴。。。。
:em11: :em11: :em11:

论坛徽章:
0
发表于 2008-07-12 08:09 |显示全部楼层
1. Gtk的例子
./WebKitTools/GtkLauncher
的create_browser ()

2. KHTML
其实KHTML只是没有像branche项目webkit那样受到资助,LZ的KHTML例子很好

3. GtkHTML
https://svn.lcuc.org.cn/public/s ... k/src/gui/gtk/test/
其实,也够用

如果gtk-directfb能够编译通过,在cross-dev的帮助下,也就能够不用X了

论坛徽章:
0
发表于 2008-07-12 10:24 |显示全部楼层
恩。。。谢谢了。。。现在正在弄Gecko里面的,不过没有什么文档说明,很头疼呢。。。
等实在弄不下去再去看看。。。。呵呵

论坛徽章:
0
发表于 2008-07-12 16:00 |显示全部楼层
搞了半天。。。连Parser/htmlparser/tests/heml....里面的TestParser.cpp都没有跑起来。。
说是什么"Unable to create a sink"????
当参数传的两个文件有特殊的规定吗?
我用了两个空的.txt传了过去。。。
有谁玩过这个的??求助啊!!~~~

论坛徽章:
0
发表于 2008-07-12 18:22 |显示全部楼层
http://www.ohloh.net/projects/6110

风博士的Kazehakase

./module/embed/gecko/kz-gecko-embed.cpp

我(由于祖籍是辽宁鞍山)对Trac不是C based的clearsliver,而用Genshi发表过异议;

但是,在ISCAS的短短2个月,长辈们让我看到了更多日本人在开源社区做出的贡献

论坛徽章:
0
发表于 2008-07-14 11:17 |显示全部楼层
在网上查了很多的代码。。也看到了你给的那个。。。
现在还是一个问题,不知道那个sink到底怎么产生?
看官方的文档上说是必须要的,但是我解析本地的HTML文件。。呵呵。。
迷惑中啊!~~~

论坛徽章:
0
发表于 2008-07-16 19:47 |显示全部楼层
还是放弃了使用Gecko,现在在用Webkit,至少自己的测试代码可以编译通过了,
但是要实现解析HTML还是很难啊。
也是我太菜了

现在就是没有现成的例子或者官方的测试代码参考啊。。。
:em11: :em11: :em11: :em11: :em11:

论坛徽章:
0
发表于 2008-09-05 15:37 |显示全部楼层

:P

在qt4.4.1版本里面已经将webkit集成了,作为demo/browser,只要你将qt在某个平台上安装,跟踪调试下,即可解决你当前的问题
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP