免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 6855 | 回复: 6
打印 上一主题 下一主题

[C] Socket编程无法获取网页内容 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-07-07 14:57 |只看该作者 |倒序浏览
小弟近日在看《GNU/Linux编程指南》,里面有web_server.c和web_client.c的源码,实际测试了很久都无法成功,在这里发帖求助。

在我的本机上有Apache服务器,端口为10088,在htdocs目录下有一个abc.html文件,使用浏览器访问http://localhost:10088/abc.html或者http://127.0.0.1:10088/abc.html都成功。

我直接测试的是web_client.c,连接的是Apache服务。

web_client.c代码如下:
  1. #include <stdio.h>
  2. #include <stdlib.h>
  3. #include <string.h>
  4. #include <sys/socket.h>
  5. #include <sys/types.h>
  6. #include <sys/wait.h>
  7. #include <netinet/in.h>
  8. #include <arpa/inet.h>
  9. #include <netdb.h>
  10. #include <error.h>

  11. char * host_name = "127.0.0.1";
  12. int port = 10088;

  13. int main(int argc, char *argv[])
  14. {
  15.         char buf[8192];
  16.         char message[256];
  17.         int sd;
  18.         struct sockaddr_in pin;
  19.         struct hostent *nlp_host;

  20.         if ((nlp_host = gethostbyname(host_name)) == 0)
  21.         {
  22.                 printf("Error resolving local host\n");
  23.                 exit(1);
  24.         }

  25.         bzero(&pin, sizeof(pin));
  26.         pin.sin_family = AF_INET;
  27.         pin.sin_addr.s_addr = htonl(INADDR_ANY);
  28.         pin.sin_addr.s_addr = ((struct in_addr *)(nlp_host->h_addr))->s_addr;
  29.         pin.sin_port = htons(port);

  30.         if ((sd = socket(AF_INET, SOCK_STREAM, 0)) == -1)
  31.         {
  32.                 printf("Error opening socket\n");
  33.                 exit(1);
  34.         }

  35.         if (connect(sd, (void *)&pin, sizeof(pin)) == -1)
  36.         {
  37.                 printf("Error connecting to socket\n");
  38.                 exit(1);
  39.         }

  40.         sprintf(message, "GET /abc.html HTTP/1.1\n");
  41.         printf("Sending message %s to web_server...\n", message);

  42.         if (send(sd, message, strlen(message), 0) == -1)
  43.         {
  44.                 printf("Error in send\n");
  45.                 exit(1);
  46.         }

  47.         printf(".. sent message.. wait for response...\n");

  48.         if (recv(sd, buf, 8192, 0) == -1)
  49.         {
  50.                 printf("Error in receiving response from HTTPServer\n");
  51.                 exit(1);
  52.         }

  53.         printf("\nResponse from HTTPServer:\n\n%s\n", buf);

  54.         close(sd);
  55.         exit(0);
  56. }
复制代码
每次执行到recv的时候代码就停下来,前面的都正常。

盼望高手能指点迷津!

论坛徽章:
0
2 [报告]
发表于 2011-07-07 17:17 |只看该作者
sprintf(message, "GET /abc.html HTTP/1.1\n");
是不是应该
sprintf(message, "GET /abc.html HTTP/1.1\r\n\r\n");

论坛徽章:
0
3 [报告]
发表于 2011-07-07 17:18 |只看该作者
sprintf(message, "GET /abc.html HTTP/1.1\n");
是不是应该
sprintf(message, "GET /abc.html HTTP/1.1\r\n\r\n");

论坛徽章:
0
4 [报告]
发表于 2011-07-07 17:19 |只看该作者
回复 3# mulh0117

怎么发了2遍。。

论坛徽章:
0
5 [报告]
发表于 2011-07-07 17:39 |只看该作者
看了两篇文章,确实应该在GET后面再插入一空行。
http://www.cqinc.com.tw/coopermaa/932-DC/practice/WWWIntro.htm
http://grachel1986.blog.163.com/ ... 932009212104539235/

修改成sprintf(message, "GET /abc.html HTTP/1.1\r\n\r\n");以后,代码顺利执行,但是返回的是400 BAD REQUEST。这是为什么?

论坛徽章:
0
6 [报告]
发表于 2011-07-08 14:58 |只看该作者
按照 http 协议的要求, 还要包含 HOST 头, 一般 webserver 的都会检测这个字段.
如访问 google 的 HTTP 头部:
  1. GET / HTTP/1.1
  2. Accept: */*
  3. Accept-Language: zh-cn,zh; q=0.5
  4. User-Agent: EasyAgent/1.2.0
  5. Connection: close
  6. Host: www.google.com

复制代码
这是一段 DUMP http 请求及应答的例子:
  1. C:\Documents and Settings\jli5>hc -F stdout "http://www.google.com"
  2. GET / HTTP/1.1
  3. Accept: */*
  4. Accept-Language: zh-cn,zh; q=0.5
  5. User-Agent: EasyAgent/1.2.0
  6. Connection: close
  7. Host: www.google.com

  8. HTTP/1.1 302 Found
  9. Location: http://www.google.com.hk/url?sa=p&hl=zh-CN&pref=hkredirect&pval=yes&q=http://www.google.com.hk/&ust=1310107866
  10. 189790&usg=AFQjCNFMhWleVFm86qWbu0JoFYcqA4LYmg
  11. Cache-Control: private
  12. Content-Type: text/html; charset=UTF-8
  13. Set-Cookie: PREF=ID=73a6c22d3bdba59f:FF=0:NW=1:TM=1310107836:LM=1310107836:S=0Bq0eYnCnmJMCuLK; expires=Sun, 07-Jul-2013
  14. 06:50:36 GMT; path=/; domain=.google.com
  15. Date: Fri, 08 Jul 2011 06:50:36 GMT
  16. Server: gws
  17. X-XSS-Protection: 1; mode=block
  18. Content-Length: 376
  19. Via: 1.1 cnsha-ironweb.tellabs.fi:80 (IronPort-WSA/7.1.0-307)
  20. Connection: close

  21. <HTML><HEAD><meta http-equiv="content-type" content="text/html;charset=utf-8">
  22. <TITLE>302 Moved</TITLE></HEAD><BODY>
  23. <H1>302 Moved</H1>
  24. The document has moved
  25. <A HREF="http://www.google.com.hk/url?sa=p&amp;hl=zh-CN&amp;pref=hkredirect&amp;pval=yes&amp;q=http://www.google.com.hk/
  26. &amp;ust=1310107866189790&amp;usg=AFQjCNFMhWleVFm86qWbu0JoFYcqA4LYmg">here</A>.
  27. </BODY></HTML>

  28. Server Protocol         : http
  29. Server Hostname         : www.google.com
  30. Server Port             : 80
  31. Document Path           :
  32. Concurrency Level       : 1
  33. Complete requests       : 1
  34. Failed requests         : 0
  35. Time taken for tests    : 0.109 [sec] (mean)
  36. Requests per second     : 9.14 [#/sec] (mean)
复制代码

论坛徽章:
0
7 [报告]
发表于 2011-07-12 12:24 |只看该作者
每个HTTP属性设置后加"\r\n",最后还要以"\r\n"表示请求头结束,而且你发送请求后最好用while(recv)模式接收,我在CSDN上有个例子你可以参考一下(http://download.csdn.net/source/3419419),如果你还想详细了解最好找份HTTP协议看看.
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP