c 抓取网页内容

如果在C程序想抓取网页内容

如果在C程序想抓取网页内容，比如百度方法1. 执行System("wget http：//www.baidu.com -q -O baidu.html")，然后再分析baidu.html。方法2. 直接写socket程序获取http://www.baidu.com的内容存入buffer中。那种方法好呢？如果方法2好，有没有现成的代码给小弟参考一下。因为方法1 ，我担心因为system是在子进程中执行wget,可能wget还没有下载完网页，后面的程序已经开始分析baidu.html了，可能会造成意外。另外有没有其他的...

by thinmonkey - C/C++ - 2008-08-19 20:23:50 阅读（8133）回复（12）

其他文章推荐

QQ空间新浪微博腾讯微博人人网开心网豆瓣网百度空间更多

抓取网页内容类

// 需要得到数据的网址 var $URL; // 需要分析的开始标记 var $startFlag; //需要分析的结束标记 var $endFlag; // 存储图片的路径 var $saveImagePath; //访问图片的路径 var $imageURL; // 列表内容 var $ListContent; //需要获得的图片路径 var $ImageList; //存储的图片名称 var $FileName; /** * 得到页面内容 * @return String 列表页面内容 */ function getPageConte...

by mosquito_2006 - php文档中心 - 2006-12-16 23:32:02 阅读（711）回复（0）

如何抓取网页内容，请各位指教

比如中国天气网 www.www.weather.com.cn 能够实现：自动输入某城市（比如杭州），然后Perl抓取天气内容。我想应该可以实现，请教各位。

by gaochong - Perl - 2008-12-09 18:13:31 阅读（2374）回复（8）

[求助]抓取网页内容时被禁要怎么办

[code] 1 #!/usr/bin/perl -w 2 use LWP; 3 use Encode qw/from_to decode encode/; 4 use strict; 5 6 my $ua = LWP::UserAgent->new; 7 $ua->cookie_jar({-file=>"./cookie"}); 8 $ua->proxy(['http'],'http://10.71.115.253:3128'); 9 my $url = 'http://news.google.cn/news?hl=zh-CN&ned=ccn&ie=UTF-8&q=%E7%94%9F%E7%89%A9&as_drrb=q&as_qdr=h'; 10 my $page = $ua->get($url); 11 12 13 print $page->...

by chenxiam - Perl - 2008-03-15 22:42:06 阅读（2652）回复（3）

如何自动输入查询并抓取网页内容

如何自动输入查询并抓取网页内容 ?

by mysqlshell - Perl - 2007-05-09 08:13:36 阅读（2860）回复（4）

如何用正则抓取网页中的内容

如题希望附加例子

by kgong - PHP - 2006-11-16 15:38:28 阅读（2233）回复（5）

我要抓取这个网页的内容该怎么做?

http://www.1872.com.cn/saishizhuanqu/ShowArticle.asp?ArticleID=15077 要抓取里面的标题和内容,该用哪几个函数?正则用哪些才能分出标题和内容?

by zjstandup - PHP - 2006-08-31 13:12:24 阅读（1022）回复（1）

网页抓取问题

打开这个网址 http://xin.cz3.nus.edu.sg/group/cjttd/ttd.asp 在Target Name中输入phosphatase然后submit链接到 http://xin.cz3.nus.edu.sg/group/cjttd/List.asp?SetQuery=Y 用程序抓取这个网页，却得不到东西。我认为是SetQuery=Y的原因，请各位高手指点指点，谢谢了！

by libiqing77 - Perl - 2009-04-02 09:56:25 阅读（1819）回复（4）

抓取网页的问题

抓取网页，先发送head,返回的信息只有expires,无last modifed. 如何根据http头返回的expires判断网页是否更新比如返回的是 expires=Saturday, 20-Aug-11 02:11:46 GMT 是把这个时间和系统的时间比较看expires比系统时间（假设系统时间是正确的当前时间）迟还是早，迟就不用更新即重新抓网页，早就重新抓网页吗？还是有其他方法呢？

by greatho1507 - C/C++ - 2008-08-20 13:55:50 阅读（3487）回复（13）

使用XSLT抓取网站内容抽取网页数据的技巧

网站内容抓取和网页数据抽取几乎是每一个网站建设者都要使用的技术，网站的网页都是HTML或者XHTML文档，数据抽取/信息提取方法分成两类： 1，通过正则表达式提取内容，(X)HTML文件就是一个文本文件，直接使用正则表达式在指定地方提取内容即可，"指定地方"不一定是绝对定位，例如，可以参照HTML的标签定位，更准确 2，利用DOM、XML、XPath、XSLT提取内容，(X)HTML文件先转成DOM数据结构，再使用XPath遍历这个结构提取内容或者使用X...

by geo898 - Java文档中心 - 2009-09-07 15:00:19 阅读（2622）回复（0）

【求教】perl可以抓取多页的asp动态网页内容吗？

【求教】perl可以抓取多页的asp动态网页内容吗？想抓取一个网站的网页内容，网站是用asp写的，里面嵌了javascript的函数来取其他页面。有没有办法可以把每一页的内容都抓下来哈？ ulmer tx提供的方法非常简便，具体方法如下：通过在lwp的UserAgent中设置相应的页参数'me_page' => $me_page,实现了抓取相应的页面！！代码如下： use LWP 5.64; use HTTP::Request::Common qw(POST); use LWP::UserAgent; my $browser = L...

by oldv - Perl - 2008-09-21 19:14:58 阅读（6104）回复（12）

盛拓传媒：

IT168 | 泡泡网 | 汽车之家 | 二手车之家 | 渠道168 | ITPUB | IXPUB | ChinaUnix | 安卓之家 | 苹果园 | 家商城 | 苹果论坛

c 抓取网页内容

如果在C程序想抓取网页内容

对象的定义

openssl的des加密与php、c#加密结果不一致的问题

c/c++程序员

little endian OR big endian?

GBK->UTF8

字符串转化数组?

C++ 继承

C/C++中的extern

新手请教C下HTTP协议问题

C++中能在初始化列表中对数组初始化么?