Chinaunix

标题: 想学HTTP,请问怎么入手呢? [打印本页]

作者: lxyscls    时间: 2015-07-02 10:13
标题: 想学HTTP,请问怎么入手呢?
《HTTP权威指南》扫了一遍,想要做起来(最好是类C语言的)

缓存代理、爬虫、服务器、客户端

了解了一下爬虫,发现JAVA实现的多,暂不考虑了

缓存代理,不知道现在流行得是哪些,squid?这个是C++实现的

请问各位高手,HTTP这货怎么入手比较好呢?

作者: ctrigger    时间: 2015-07-02 21:56
HTTP权威指南 绝对经典,只是扫一遍,呵呵~~~
作者: xphh2008    时间: 2015-07-02 22:31
没工作经验看10遍书都没用
作者: lxyscls    时间: 2015-07-06 10:01
这个问题黑有难度?

还是抱本nginx or apache的书看起来?

squid好像太冷门了
作者: linux_c_py_php    时间: 2015-07-08 12:23
了解HTTP难道不应该从PHP开始吗。
作者: ctrigger    时间: 2015-07-08 12:28
本帖最后由 ctrigger 于 2015-07-08 12:31 编辑
linux_c_py_php 发表于 2015-07-08 12:23
了解HTTP难道不应该从PHP开始吗。


你说的HTTP,非楼主的HTTP~
楼主的HTTP == RFC 2616~~
楼主说的是造车子,你说的是开车子~~~
作者: lxyscls    时间: 2015-07-08 15:39
回复 6# ctrigger


    ☞条明路哇,看书看十遍,不如边做边看
作者: bandaotidejia    时间: 2015-07-08 17:36
网络抓包,网络协议这个高大上的东西以后也就不值钱了。毕竟是死的东西。
作者: ctrigger    时间: 2015-07-09 10:04
bandaotidejia 发表于 2015-07-08 17:36
网络抓包,网络协议这个高大上的东西以后也就不值钱了。毕竟是死的东西。


不值钱也得学啊。网络编程要抓包,测试也得抓包嘛。。
作者: bandaotidejia    时间: 2015-07-09 11:26
抓吧,用wireshark,http有个状态机之类的东西,也是死的,背下来就行了。
作者: nameofhsw    时间: 2015-07-09 16:06
HTTP只是个固定协议格式,看一次就够了。
还要什么其他高大上的东西?
作者: lxyscls    时间: 2015-07-10 09:51
回复 11# nameofhsw


    我是想学学构建一个可用的HTTP模块:譬如代理什么的,反过来也掌握一下协议本身
作者: nameofhsw    时间: 2015-07-10 15:22
代理的配置是和socket相关的,其实和http本身没有什么关系。
可以找一些开源的HTTP爬虫
作者: lxyscls    时间: 2015-07-13 10:07
nameofhsw 发表于 2015-07-10 15:22
代理的配置是和socket相关的,其实和http本身没有什么关系。
可以找一些开源的HTTP爬虫


嗯,您说得对,不过我找到的爬虫基本都是Java base的
作者: nameofhsw    时间: 2015-07-15 10:42
回复 14# lxyscls
HTTP爬虫本质上来说就是高效率访问多个网址。所以实际上用到的可能就是:
1.并发(异步IO,多进程,多线程都可以)
2.发送HTTP请求,获取响应(socket直接建立tcp通信)
3.解析HTTP响应,head和body

所以,我觉得HTTP本身并不是难点所在。按照协议构造请求包,以及按照协议分析响应包就好。
我仅仅知道几个脚本语言写的开源软件,所以这方面也帮不上忙了。



   




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2