1 ... 14 15 16 171819 20 21 22 ... 28 / 28 页下一页

源码阅读第一期:axel和wget [复制链接]

论坛徽章:: 0

171楼 [报告]

发表于 2011-10-12 14:18 |只看该作者

回复 duanjigang

再问一下,如果第一行返回的不是"整数字符串"返回的头两行如下
drwxr-xr-x 12 504 ...
seufy88 发表于 2011-10-12 12:43

是的，这种情况的话,axel是不能拿到结果的。
根据现在的代码判断，它只能解析这种带返回码的FTP信息，对于实际的数据是不能解析的.
而且遇到第一个 “整数字符串” 就会返回。而且它返回的是一个status值，因此处理多个status是不太可能的。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

duanjigang

版主

论坛徽章:: 0

172楼 [报告]

发表于 2011-10-12 14:24 |只看该作者

回复 duanjigang
对函数search_getspeeds的实现有一个问题。作者通过while循环来判断是否所有的线程已经 ...
瀚海书香发表于 2011-10-12 13:25

不能这样的，所有的线程退出并不能保证所有连接的速度都获取完成了，因为
conn_set
conn_init
conn_info都可能失败
这时线程退出，循环并不应该退出，而是应该重新创建一个线程，再次尝试获取速度。

只有 done 这个值才能反映多少连接完成测速了。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

瀚海书香

版主

论坛徽章:: 6

173楼 [报告]

发表于 2011-10-12 14:37 |只看该作者

回复 172# duanjigang
的确是有这样的问题，但是本身每个thread的工作就是测试每个url的速度的，我觉得这些链接失败的处理等问题，应该在各自的线程中实现，而不应该再嵌套一层代码来处理异常。
这样可以减少代码的耦合度。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

duanjigang

版主

论坛徽章:: 0

174楼 [报告]

发表于 2011-10-12 14:47 |只看该作者

回复 duanjigang
的确是有这样的问题，但是本身每个thread的工作就是测试每个url的速度的，我觉得这些链 ...
瀚海书香发表于 2011-10-12 14:37

嗯，呵呵，但是重启线程这些工作还是需要外部来做的。
我也觉的axel现在的代码有整理的空间，有些乱。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

瀚海书香

版主

论坛徽章:: 6

175楼 [报告]

发表于 2011-10-12 14:50 |只看该作者

回复 174# duanjigang
我的想法是，每个线程只启动一次，每个线程的工作就是测试指定url的speed，在这个过程中出现的任何问题，都在线程内部解决。

期待版主整理后的代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

seufy88

家境小康

论坛徽章:: 1

176楼 [报告]

发表于 2011-10-12 15:12 |只看该作者

回复 171# duanjigang

ftp_wait()好像只处理服务器返回的第一行并且这一行要是"整数字符串" ,如果第一行不是这种方式的话就"一定"拿不到服务器返回的状态码了.既然这样,那为什么还要do-while循环读入多行呢
并且读入的多行又是append在一个message[]里的,导致j能拿到后面行中的潜在的227,但coon->status却拿不到这个227. 所以这个就没搞明白.并且我也问了,按ftp_wait的代码,好像退不出do-while的,只有conn->fd数据读完后,由read返回-1,导致read没成功,ftp_wait返回-1.我觉得这个函数是不是应该简化一下,只读入第一行,查整数,赋给status,并返回status.如果失败就返回-1.

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

duanjigang

版主

论坛徽章:: 0

177楼 [报告]

发表于 2011-10-12 16:44 |只看该作者

回复 duanjigang
我的想法是，每个线程只启动一次，每个线程的工作就是测试指定url的speed，在这个过程中 ...
瀚海书香发表于 2011-10-12 14:50

嗯，你说这个可行，但我理解作者这么写的意义在于，在线程内部做的事情尽量少，牵扯的数据结构尽量少，这边避免多线程冲突。。
而用外面的主线程同一操作数据结构。
但是有说回来，数据结构设计合理的话，完全可以按照你说的方式搞

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

duanjigang

版主

论坛徽章:: 0

178楼 [报告]

发表于 2011-10-12 16:45 |只看该作者

回复 duanjigang

ftp_wait()好像只处理服务器返回的第一行并且这一行要是"整数字符串" ,如果第 ...
seufy88 发表于 2011-10-12 15:12

嗯，这个函数可以扩大一点做个通用的，或者简化下，只做个适用于axel本身的。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

janock

白手起家

论坛徽章:: 0

179楼 [报告]

发表于 2011-10-12 16:46 |只看该作者

第一遍
我都是先看程序主题流程，然后知道主要函数都是干啥的。
接着着重看一下函数中的关键代 ...
duanjigang 发表于 2011-10-10 20:33

学习。觉得这样符合认知。我也是初学者。以前搞抵挡MCU汇编。30转行做交换机。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

wangzhen11aaa

小富即安

论坛徽章:: 0

180楼 [报告]

发表于 2011-10-12 17:28 |只看该作者

本帖最后由 wangzhen11aaa 于 2011-10-12 18:12 编辑

1225 url = alloca_array (char *, nurl + 1);/*alloca有多少个url地址，就分配几个指针*/
1226 for (i = 0; i < nurl; i++, optind++)
1227 {
1228 char *rewritten = rewrite_shorthand_url (argv[optind]);
1229 if (rewritten)
1230 url[i] = rewritten;
1231 else
1232 url[i] = xstrdup (argv[optind]);
1233 }
1234 url[i] = NULL;
/*这里返回后，url指向的就是实际意义上的http://www.google.com 或者 ftp://xxx.xxx.xxx:23端口，这里函数的作用是判断哪一种协议。*/

复制代码

1237 log_init (opt.lfilename, append_to_log); /*打开设定的日志文件，准备写*/

复制代码

opt.output_document /*有输出打印到的文件*/

复制代码

1330 for (t = url; *t; t++)
1331 {
1332 char *filename = NULL, *redirected_URL = NULL;
1333 int dt, url_err;
1337 struct iri *iri = iri_new (); /*这个数据结构储存检查要获取编码格式，文件编码格式，是否这url是用utf8编码，这里是分配一个新的1、_______--------->*/
1338 struct url *url_parsed;
1339
1340 set_uri_encoding (iri, opt.locale, true);
1341 url_parsed = url_parse (*t, &url_err, iri, true); 2、________----------->
1、________--------------->
302 struct iri *
303 iri_new (void)
304 {
305 struct iri *i = xmalloc (sizeof *i); /*分配一个空间*/
306 i->uri_encoding = opt.encoding_remote ? xstrdup (opt.encoding_remote) : NULL; /*是否有远程编码格式没有就初始化为NULL*/
307 i->content_encoding = NULL; /*内容编码为NULL*/
308 i->orig_url = NULL; /*url也是0*/
309 i->utf8_encode = opt.enable_iri; /*
310 return i;
311 }
<------------_______________

复制代码

1340 set_uri_encoding (iri, opt.locale, true); /*检查是否被设置编码，如果没有，就有本地编码进行初始化*/

复制代码

2、______________---------->
[code]
/*url 解析*/
1341 url_parsed = url_parse (*t, &url_err, iri, true); /*t为 url, &url_err (int*类型)，iri储存编码格式.bool 常量 ture*/
函数作用是解析一个url地址，返回一个新的url地址如果成功。否则就返回NULL或者error。
此函数中调用了url_scheme()又一次判断，地址类型，这里略去不分析*/
698 if (iri && iri->utf8_encode)
699 {
700 iri->utf8_encode = remote_to_utf8 (iri, iri->orig_url ? iri->orig_url : url, (co nst char **) &new_url); /*new_url 强制转化为 const char **类型 *这个函数作用是：如果发现远处的编码格式不是utf-8格式，那么就将其转化成utf-8格式 *new中保存这个转化后的地址。调用的外部函数/
701 if (!iri->utf8_encode)
702 new_url = NULL;
703 else
704 iri->orig_url = xstrdup (url); /*将源地址同化*/
705 }

复制代码

src/url.c*/
708 if (percent_encode)
709 url_encoded = reencode_escapes (new_url ? new_url : url); /*用utf-8格式将url进行格式化*/
713 p = url_encoded;
718 p += strlen (supported_schemes[scheme].leading_string); /*计算http://的长度*/
719 uname_b = p; /*算出真正url的地址，是转化后的*/
720 p = url_skip_credentials (p); /*去掉不规则的结束符比如 @ # 等。
721 uname_e = p; /*指向结束地址*/
scheme://host[:port][/path][;params][?query][#fragment]
格式
731 path_b = path_e = NULL;
732 params_b = params_e = NULL;
733 query_b = query_e = NULL;
734 fragment_b = fragment_e = NULL;
739 seps = init_seps (scheme); /*加入分隔字符,比如ftp 有参数，http和https有请求字符和片段 2、__________------------>*/
741 host_b = p;

复制代码

2、__-------------->
620 static const char *
621 init_seps (enum url_scheme scheme)
622 {
623 static char seps[8] = ":/"; /*固定的开始是:/字符
624 char *p = seps + 2;
625 int flags = supported_schemes[scheme].flags; /这里看这个scheme支持的格式*/
626
627 if (flags & scm_has_params) 判断*/
628 *p++ = ';';
629 if (flags & scm_has_query)
630 *p++ = '?';
631 if (flags & scm_has_fragment)
632 *p++ = '#';
633 *p = '\0';
634 return seps; /*返回格式*/
635 }

复制代码

<--------------____________
src/url.c*/
741 host_b = p; /*
742
743 if (*p == '[')
744 {
745 /* Handle IPv6 address inside square brackets. Ideally we'd
746 just look for the terminating ']', but rfc2732 mandates
747 rejecting invalid IPv6 addresses. */
748
749 /* The address begins after '['. */
750 host_b = p + 1;
751 host_e = strchr (host_b, ']'); /*ipv6格式*/
752
753 if (!host_e)
754 {
755 error_code = PE_UNTERMINATED_IPV6_ADDRESS;
756 goto error;
757 }
/*不说ipv6先*/
/*后面的一些判断很简单*/
798 port = scheme_default_port (scheme); /*根据scheme的default_prot来初始化port*/
799 if (*p == ':') /*来确定端口，并赋给port_b和port_e；
800 {
801 const char *port_b, *port_e, *pp;
802
803 /* scheme://host:port/tralala */
804 /* ^ */
805 ++p;
806 port_b = p;
807 p = strpbrk_or_eos (p, seps);
808 port_e = p;
/*比较简单*/
/*获得含有第一个字符串的指针返回，过程中还有赋值操作，这是按照顺序依次来赋值的*/
837 #define GET_URL_PART(sepchar, var) do { \
838 if (*p == sepchar) \
839 var##_b = ++p, var##_e = p = strpbrk_or_eos (p, seps); \
840 ++seps; \
841 } while (0)
843 GET_URL_PART ('/', path);
844 if (supported_schemes[scheme].flags & scm_has_params)
845 GET_URL_PART (';', params);
846 if (supported_schemes[scheme].flags & scm_has_query)
866 u = xnew0 (struct url);
867 u->scheme = scheme;
868 u->host = strdupdelim (host_b, host_e);
869 u->port = port;
870 u->user = user;
871 u->passwd = passwd;
873 u->path = strdupdelim (path_b, path_e);
874 path_modified = path_simplify (scheme, u->path); /*矫正后的path*/
875 split_path (u->path, &u->dir, &u->file); /*将路径和文件分别存储，并且用格式化编码*/
876
877 host_modified = lowercase_str (u->host); /*将主机名称格式化成小写*/
/*将url结构对应初始化*/
847 GET_URL_PART ('?', query);
848 if (supported_schemes[scheme].flags & scm_has_fragment)
849 GET_URL_PART ('#', fragment);
883 if (strchr (u->host, '%')) /*将主机名也格式化*/
884 {
885 url_unescape (u->host);
886 host_modified = true;
887
888 /* Apply IDNA regardless of iri->utf8_encode status */
889 if (opt.enable_iri && iri)
890 {
891 char *new = idn_encode (iri, u->host);/*参有IDNAN格式格式化，如果没有采用utf-8格式，那么就用ascii码格式*/
892 if (new)
893 {
894 xfree (u->host);
895 u->host = new;
896 host_modified = true;
897 }
898 }
899 }
剩下就是其他的格式化*/
return u;
这是我最想看到的*/

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

1 ... 14 15 16 171819 20 21 22 ... 28 / 28 页下一页

返回列表

Chinaunix › 论坛 › 程序设计 › 架构设计 › 源码阅读第一期:axel和wget

源码阅读第一期:axel和wget [复制链接]

浏览过的版块