论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2011-03-07 16:27 |只看该作者 |倒序浏览

本帖最后由 osmanthusgfy 于 2011-03-07 16:28 编辑

leader/followers模式怎样高效地避免竞争状态的出现?

比如一个follower线程在某个sockfd上接收数据,需要很常时间(如传输文件),
这时leader线程调用reactor,得到可读的sockfd正是follower线程正在操作的sockfd,
这时就出现了竞争状态.

所以,一般使用leader/followers模式时要避免竞争状态的出现.
我想到一种方式:就是一个老外在多线程情况下使用libevent提出的一种思路:
使用socketpair创建一个unix域套接字.然后将这个套接字注册到reactor(比如epoll,select).

我仿照这种思路,可以在reactor中封装一个当前活动的sockfd的队列,这个队列中装的是当前被follower线程
操作的sockfd,每当leader线程调用reactor分离事件时,先在这个活动队列中查找这个sockfd,如果能找到,
则说明有某个follower线程正在操作这个sockfd,我们应该重新调用reactor,重新得到一个就绪的sockfd.
如果follower线程处理完毕,然后通过先前创建好的unix域套接字发送消息,请求将操作完毕sockfd从当前活动队列中
删除,这样就避免竞争状态的出现.

客户端连接达到很大数量后,我这种思路就出现性能低效的问题:
首先是每次leader->follower转变前,都必须在当前活动队列中查找一边;
其次,follower->leader转变前,又得将sockfd从当前活动队列中删除.
连接很多时,以上两步还是挺费时的,特别是查找.

有没有更好的解决方案了,希望大家赐教,谢谢!!!

服务器开发, 免竞争状态, 服务器开发, 免竞争状态

文库|博客

yulihua49

巨富豪门

论坛徽章:: 15

2楼 [报告]

发表于 2011-03-07 17:19 |只看该作者

本帖最后由 yulihua49 于 2011-03-07 17:22 编辑

leader/followers模式怎样高效地避免竞争状态的出现?

比如一个follower线程在某个sockfd上接收数据,需要 ...
osmanthusgfy 发表于 2011-03-07 16:27

完全没必要这么做。
在加入epoll时用EPOLLONESHOT标志。当正在进行操作的socket是不会被激活的。

一个socket具备了IO条件只被激活一次，然后被一个线程拿去它直接变成work线程。它可以任意处理这个socket，在重新EPOLL_CTL_MOD之前，是不会再一次激活的。
即，不会有另外的线程同时处理这个socket。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

osmanthusgfy

丰衣足食

论坛徽章:: 0

3楼 [报告]

发表于 2011-03-07 17:24 |只看该作者

我试试,之后报告测试结果

先感谢yulihua49大哥了!

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

bittertea

稍有积蓄

论坛徽章:: 0

4楼 [报告]

发表于 2011-03-07 18:16 |只看该作者

leader只accept ，
然后将accept的fd依次round 投递到各个followers线程里，通知followers，
各follows线程负责各自的fd 读写事件

不行么？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

yovnchine

白手起家

论坛徽章:: 0

5楼 [报告]

发表于 2011-03-08 16:43 |只看该作者

leader只accept ，
然后将accept的fd依次round 投递到各个followers线程里，通知followers，
各follows线 ...
bittertea 发表于 2011-03-07 18:16

这样就不是leader-follow模式了，每个follow都有可能成为leader的，你的模式follow永远是follow。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

osmanthusgfy

丰衣足食

论坛徽章:: 0

6楼 [报告]

发表于 2011-03-09 10:24 |只看该作者

报告测试结果:

yulihua49大哥的说法完全正确.如果是服务器的话,得注意区分服务器监听的sockfd,服务器与客户端连接的sockfd,使用epoll的时候,服务器与客户端连接的sockfd,可以使用EPOLLONESHOT标志(事件激活之后,处理完毕,再次注册即可);服务器监听的sockfd不要使用EPOLLONESHOT标志,因为使用这个标志,则导致服务器只能响应一个客户端的连接,这恐怕非我们所愿.
那服务器框架底层怎样分别对待这两种情况了?我是借鉴libevent的做法,服务器监听的sockfd在注册事件时,可以加上EV_PERSIST类似的标志,其他的情况,reactor默认只通知一次.

关于4楼提出的:leader/follower模式最重要的一点是:每个线程都应有公平的
leader->follower,follower->leader角色的转换,yovnchine大哥说的很正确.

再次yulihua49大哥!!!

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

yulihua49

巨富豪门

论坛徽章:: 15

7楼 [报告]

发表于 2011-03-09 12:45 |只看该作者

本帖最后由 yulihua49 于 2011-03-09 13:19 编辑

leader只accept ，
然后将accept的fd依次round 投递到各个followers线程里，通知followers，
各follows线 ...
bittertea 发表于 2011-03-07 18:16

LF的要点是L一旦取得资源，立即变成W，不进行任何线程切换，从而提高效率。你那样做导致一次任务在线程间的切换，违背了LF的初衷。
这个我有体会，我原来的交易中间件就是和你差不多，有一个调度线程，接到事件后丢到就绪队列，交给线程池处理。后来取消了调度线程，得到事件自己直接处理，效率提高了好多。

LF的缺点是一旦L离开，新的L到来之前，客户的请求被延迟。

后来我采用多个L，所有线程同时等待epoll，激活谁谁干活。没事的都去epoll_wait.实测性能很高。似乎没有发现无序竞争现象。

这样是否比LF好？

另外，监听口不在epoll处理，还是由select处理（select只处理这一个fd），激活后建立任务提交epoll。

结果，所有的F都成了L。
但是，在交易中间件里，不是所有的事件都是IO事件。有些非IO事件，例如取得连接事件，需要一个就绪队列，这个就绪队列需要一个线程守护，在这里采用了LF模式。
所有工作线程，留一个守候就绪队列，称为L，其他都去epoll，称为F。L可以直接变成W，F也可以。W们完成任务回来后，看一看有没有L，如果没有，留下来做L，其余都变成F。
代码片段：

while(1) {
//从就绪队列取一个任务
// if(rpool.flg==0) {
pthread_mutex_lock(&rpool.mut);
do {
task=rdy_get();
if(!task) {
if(rpool.flg) break;
rpool.flg=1;
ret=pthread_cond_wait(&rpool.cond,&rpool.mut); //没有任务，等待
rpool.flg=0;
}
} while(!task);
pthread_mutex_unlock(&rpool.mut);
// } else task=NULL;
if(!task) {
fds = epoll_wait(g_epoll_fd, &event, 1 , -1);
if(fds < 0){
ShowLog(1,"%s:epoll_wait err=%d,%s",__FUNCTION__,errno,strerror(errno));
sleep(30);
continue;
}
task = (TCB *)event.data.ptr;
task->events=event.events;
if(!task->call_back && !(event.events&EPOLLIN)) {
do_epoll(task,EPOLL_CTL_DEL);
client_del(task);
continue;
}
}
// rs->timestamp=
task->timestamp=now_usec();
ret=do_work(task);
}

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

osmanthusgfy

丰衣足食

论坛徽章:: 0

8楼 [报告]

发表于 2011-03-09 14:09 |只看该作者

yulihua49大哥这种思路真的有优化作用吗?
在这种模式至少有需要两个线程,一个线程select,用于accept新客户端的连接,另外的线程epoll或处理具体的事务.不知道select的线程,accept新客户端的连接之后是怎么处理的?是将这个新的clienfd注册到epoll,还是通过某种方式传递给另外那部分等待epoll的线程?
如果是第二种方式,那也会出现延时的显现.

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

yulihua49

巨富豪门

论坛徽章:: 15

9楼 [报告]

发表于 2011-03-09 15:42 |只看该作者

本帖最后由 yulihua49 于 2011-03-09 15:52 编辑

yulihua49大哥这种思路真的有优化作用吗?
在这种模式至少有需要两个线程,一个线程select,用于accept新客户 ...
osmanthusgfy 发表于 2011-03-09 14:09

select - accept是主线程干的。
select起超时作用，主线程除了负责客户的初始接入，还要在超时时处理服务器内的资源维护工作。
因此，本中间件是免维护的。

如果不是需要自动维护资源，主线程也可以不用select，直接accept即可。
accept之后，生成task，将task推给epoll。

代码：

while(1) {
do {
FD_ZERO(&efds);
FD_SET(sock, &efds);
//健康检查周期
tm.tv_sec=30;
tm.tv_usec=0;
ret=select(sock+1,&efds,NULL,&efds,&tm);
if(ret==-1) {
ShowLog(1,"select error %s",strerror(errno));
close(sock);
quit(3);
}
if(ret==0) {
if(poolchk) poolchk();
check_TCB_timeout();
}
} while(ret<=0);
i=event_no();
s=accept(sock,(struct sockaddr *)&cin,&leng);
if(s<0) {
ShowLog(1,"%s:accept err=%d,%s",__FUNCTION__,errno,strerror(errno));
switch(errno) {
case EMFILE: //fd用完了,其他线程还要继续工作，主线程休息一下。
case ENFILE:
sleep(30);
continue;
default:break;
}
sleep(15);
if(++repeat < 20) continue;
ShowLog(1,"%s:network fail! err=%s",__FUNCTION__,strerror(errno));
close(sock);
quit(5);
}
repeat=0;
client_q.pool[i].fd=s;
client_q.pool[i].conn.Socket=s;
client_q.pool[i].conn.timeout=120;
client_q.pool[i].status=-1;
client_q.pool[i].conn.only_do=(int (*)())conn_init;
ret=do_epoll(&client_q.pool[i],EPOLL_CTL_ADD);
}

复制代码

这个方法已经在16core的SUSE11上实现了14万服务/秒的吞吐量。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

osmanthusgfy

丰衣足食

论坛徽章:: 0

10楼 [报告]

发表于 2011-03-10 17:58 |只看该作者

有时间试一下,实践出真理.

再次感谢yulihua49大哥!!!

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

12 / 2 页下一页

返回列表

Chinaunix › 论坛 › 程序设计 › C/C++ › leader/followers模式怎样高效地避免竞争状态的出现?

[算法] leader/followers模式怎样高效地避免竞争状态的出现? [复制链接]