1 ... 20 21 22 232425 26 27 28 / 28 页下一页

源码阅读第一期:axel和wget [复制链接]

goingstudy

小富即安

论坛徽章:: 1

231楼 [报告]

发表于 2011-10-19 23:49 |只看该作者

回复 52# wangzhen11aaa

你用的calltree命令是怎么安的，是那个系统的，弄了很久都没有安上

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

wangzhen11aaa

小富即安

论坛徽章:: 0

232楼 [报告]

发表于 2011-10-20 07:42 |只看该作者

本帖最后由 wangzhen11aaa 于 2011-10-20 07:44 编辑

回复 231# goingstudy
centos 5.6
uname -r
2.6.39.1
具体的安装，当时我也费了功夫，我有帖子。
http://bbs.chinaunix.net/thread-3598298-1-1.html

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

duanjigang

版主

论坛徽章:: 0

233楼 [报告]

发表于 2011-10-20 09:48 |只看该作者

回复 duanjigang

想问一下在axel中。针对ftp部分，会多次用到ftp_wait函数，用来寻找返回状态码 ...
seufy88 发表于 2011-10-19 16:17

ftp_wait只是取狀態的，獲取完狀態後，一般做法都是獲取完狀態後關閉連接了。
因此後一次的ftp_wait和前一次的ftp_wait得到的數據是兩碼事。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

duanjigang

版主

论坛徽章:: 0

234楼 [报告]

发表于 2011-10-20 09:52 |只看该作者

回复 230# humd2001

這個原因比較簡單，因為 message_t 這個結構體是一個表示鏈狀結構的通用數據結構。
而 url 和 if 都能夠被這個結構體來表示。比如多個 URL 和多個網卡，都可以用鏈表來表示，因此 typedef 是有道理的

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

humd2001

白手起家

论坛徽章:: 0

235楼 [报告]

发表于 2011-10-20 11:22 |只看该作者

回复 234# duanjigang

你的意思是有点函数重载的思想了，我只是使用其中的某些东西，而又不是全部使用通用结构体，谢谢版主！

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

seufy88

家境小康

论坛徽章:: 1

236楼 [报告]

发表于 2011-10-25 14:08 |只看该作者

本帖最后由 seufy88 于 2011-10-26 15:49 编辑

回复 234# duanjigang

http_addheader中，request中的每一条信息是以"\r\n"分开的，而不是以"\n"

void http_addheader( http_t *conn, char *format, ... )
{
char s[MAX_STRING];
va_list params;
va_start( params, format );
vsnprintf( s, MAX_STRING - 3, format, params );
strcat( s, "\r\n" );
va_end( params );
strncat( conn->request, s, MAX_QUERY - strlen(conn->request) - 1);
}

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

linggang_2011

白手起家

论坛徽章:: 0

237楼 [报告]

发表于 2011-10-25 17:44 |只看该作者

谢啦，正打算怎么看linux的源码呢，正好跟着老牛们一块走

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

向前走直到永远

白手起家

论坛徽章:: 0

238楼 [报告]

发表于 2011-10-29 21:46 |只看该作者

回复 232# wangzhen11aaa

以下是wget的hash.c中的函数hash_table_remove的部分代码，有点迷糊,给解释一下：

c = NEXT_CELL (c, cells, size);
FOREACH_OCCUPIED_ADJACENT (c, cells, size)
{
const void *key2 = c->key;
struct cell *c_new;
/* Find the new location for the key. */
c_new = cells + HASH_POSITION (key2, hasher, size);
FOREACH_OCCUPIED_ADJACENT (c_new, cells, size)
if (key2 == c_new->key)
/* The cell C (key2) is already where we want it (in
C_NEW's "chain" of keys.) */
goto next_rehash;
*c_new = *c;
CLEAR_CELL (c);
next_rehash:
;
}

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

wangzhen11aaa

小富即安

论坛徽章:: 0

239楼 [报告]

发表于 2011-10-30 07:23 |只看该作者

本帖最后由 wangzhen11aaa 于 2011-10-30 07:33 编辑

这是个比较初级的hash，因为一个cell只能存储一个key.如果是个链表就能存储相同的。。。。

c = NEXT_CELL (c, cells, size);
FOREACH_OCCUPIED_ADJACENT (c, cells, size)
{
const void *key2 = c->key;
struct cell *c_new;
/* Find the new location for the key. */
c_new = cells + HASH_POSITION (key2, hasher, size);
FOREACH_OCCUPIED_ADJACENT (c_new, cells, size)
if (key2 == c_new->key)
/* The cell C (key2) is already where we want it (in
C_NEW's "chain" of keys.) */
goto next_rehash;
*c_new = *c;
CLEAR_CELL (c);
next_rehash:
;
}

复制代码

首先，这个hashtable 的构造是
156 struct hash_table {
157 hashfun_t hash_function;
158 testfun_t test_function;
159
160 struct cell *cells; /*这个指针，用来分配一些空间来连续存储 value和key.(key就是要被hashfunction处理的那个值，value是要存储的那个地址*/
161 int size; /*这个size一开始被初始化为1 + items / HASH_MAX_FULLNESS；*/
162
163 int count; /*这个是计算这些数组中被占据的单元个数*/
164 int resize_threshold; /*如果占据的个数和总个数的比超过0.75，为了保证命中就grow或者resize hashtable*/
166 int prime_offset; /*这个是根据需要来扩展hash 中的cell数目，具体见prime_size()函数和里面的那个数组是写死的，用来扩展数组。*/
168 };

复制代码

还有在首次创建hast_table中的hash_table_new()函数中。空项被设置为：
299 memset (ht->cells, INVALID_PTR_CHAR, size * sizeof (struct cell)); /*将所有的空项都设置成了0xff。*/
原因是key 值为0时可用，为-1表示为空。297 /* Mark cells as empty. We use 0xff rather than 0 to mark empty
298 keys because it allows us to use NULL/0 as keys. */

复制代码

199 #define FOREACH_OCCUPIED_ADJACENT(c, cells, size) \
/*这里的意思是，它认为如果遇到空项(0xfffffffff)就代表后面没有可用的cell了，
后面所做的调整也是这个意思，就是如果从“中间”的某个位置删去了一个cell->key，那么得从新hash后面的值，原因如上。. */
200 for (; CELL_OCCUPIED (c); c = NEXT_CELL (c, cells, size)) /*这是一个for循环的头部*/
195 #define NEXT_CELL(c, cells, size) (c != cells + (size - 1) ? c + 1 : cells)
/*这个定义，就是说，如果搜寻到最后仍然没有要找的那个cell,就接着从头开始找，你认为这里可能有个bug，就是如果满的话：这里没有可能的，如果你插入的话，就会检查那个
在hash_table_put()中，会更新这个array的值。
439 if (ht->count >= ht->resize_threshold)
440 {
441 grow_hash_table (ht);
442 c = find_cell (ht, key);
443 }
。
*/