免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 63213 | 回复: 28
打印 上一主题 下一主题

线程性能到达瓶颈,并发还是并行? [复制链接]

论坛徽章:
15
2015七夕节徽章
日期:2015-08-21 11:06:172017金鸡报晓
日期:2017-01-10 15:19:56极客徽章
日期:2016-12-07 14:07:30shanzhi
日期:2016-06-17 17:59:3115-16赛季CBA联赛之四川
日期:2016-04-13 14:36:562016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-01-28 06:20:0015-16赛季CBA联赛之新疆
日期:2016-01-25 14:01:34IT运维版块每周发帖之星
日期:2016-01-07 23:04:26数据库技术版块每日发帖之星
日期:2016-01-03 06:20:00数据库技术版块每日发帖之星
日期:2015-12-01 06:20:00IT运维版块每日发帖之星
日期:2015-11-10 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-12-04 14:50 |只看该作者 |正序浏览
获奖详情:http://bbs.chinaunix.net/thread-4241378-1-1.html

首先,跟大家分享个陈年趣事:
几年前,我去某软公司应聘,电话面试中与面试官有如下一番对话。 面试官:你了解多线程并发吗?
我:不了解,我之前做业务系统,多线程很大程度上都是委托给容器的……
面试官:我理解了。你不太熟悉并发是吗?
我:是的。
面试官:那我们还是来聊一聊并发吧。
祝大家线程安全。

案列介绍:
      最初是一个单线程程序性能到达瓶颈后,通过将整个作业切成一个个小任务,每一个任务执行一个线程,运行结果发现居然和之前差不多,通过调试发现其中一个任务执行时间过长,再动态调节该任务的线程数,当发现队列过多时启动新线程来同时进行,结果性能上升不大,再定位发现多个线程竞争需要同步访问同一个资源,修改为静态线程池,再由上游哈希将数据放置不同的线程队列中。
      进一步的性能提升发现怎么增大线程数性能都是这样了,再检查发现之前下游任务需要等待上游线程全部完成才能进一步操作,通过查阅资料找到一个算法只要上游有数据就可以开始进行计算,这样到上游全部陆续完成时该步骤也只需要计算少量的数据就可以了。针对此问题您有什么更好的解决方法?


讨论话题:(可任选一个或几个)
1. 阐述一下你设计过的最满意的并发/并行软件架构。
2. 详细描述一下在多线程/进程/协程方式下遇到过的最难解决的问题以及如何解决的
3. 详细讲述一下曾经使用过的最好的并发/并行组件
4. 对并行/并发的某一个理论进行详细的说明


讨论时间:2015年12月15日—2016年1月15日


奖励设置:
活动结束后,我们将选取5位讨论精彩的同学,各送技术图书《七周七并发模型》一本。



作者: (美)Paul Butcher   
译者: 黄炎
丛书名: 图灵程序设计丛书
出版社:人民邮电出版社
ISBN:9787115386069
上架时间:2015-3-13
出版日期:2015 年4月
开本:16开
页码:234
版次:1-1

内容简介:并发编程近年逐渐热起来,Go等并发语言也对并发编程提供了良好的支持,使得并发这个话题受到越来越多人的关注。本书延续了《七周七语言》的写作风格,通过以下七个精选的模型帮助读者了解并发领域的轮廓:线程与锁,函数式编程,Clojure,actor,通信顺序进程,数据级并行,Lambda架构。书中每一章都设计成三天的阅读量。每天阅读结束都会有相关练习,巩固并扩展当天的知识。每一章均有复习,用于概括本章模型的优点和缺陷。


样章试读: 第1章 概述.pdf (1.11 MB, 下载次数: 49)

---------------------------------------------------------分割线---------------------------------------------------------------------
其实案例我想描述的更清楚一些,因为当时没有时间,现在补充如下:
软件功能描述,通过libpcap抓取Mysql的包,并按照Mysql协议分解后将数据发送到Kafka供后续的分析实现,软件架构如下:
pcapThread---->TcpProcThread----->MysqlProcThread----->KafkaSendThread
各线程作用比较清晰,pcap线程调用libpcap的接口获取抓包,并根据配置排除掉不属于本机或黑名单中的抓包,并将TCP/IP头域将解开有用的放到一个数据结构中
TcpProc线程负责TCP的排序,包括乱序重传等处理,将有效的消息发送到Mysql线程处理,MySQL线程根据MySQL协议提取SQL语句和结果元数据信息组成json格式并调用rdkafka库发送
之前开发为简便实现,各线程之间通信采用出入队列方式,同步采用互斥锁,在QPS比较小的机器上测试正常,但上线到QPS比较大机器上,pcapThread出现丢包且比较严重
同时CPU飚的很高,直接占据单个核的100%,当前通过一些手段,如锁改为条件变量、使用无锁队列等,CPU下降到30%,丢包从30%以上下降到10%以下,但优化还未完成,如果大家有兴趣也可以直接根据这个现实的案例来思考发散。


论坛徽章:
13
程序设计版块每日发帖之星
日期:2016-06-29 06:20:00每日论坛发贴之星
日期:2016-08-14 06:20:00操作系统版块每日发帖之星
日期:2016-08-14 06:20:00每日论坛发贴之星
日期:2016-08-13 06:20:00数据库技术版块每日发帖之星
日期:2016-08-13 06:20:00程序设计版块每日发帖之星
日期:2016-08-13 06:20:00IT运维版块每日发帖之星
日期:2016-08-13 06:20:00每日论坛发贴之星
日期:2016-08-12 06:20:00数据库技术版块每日发帖之星
日期:2016-08-12 06:20:00程序设计版块每日发帖之星
日期:2016-08-12 06:20:00操作系统版块每日发帖之星
日期:2016-08-12 06:20:00综合交流区版块每日发帖之星
日期:2016-08-09 06:20:00
29 [报告]
发表于 2016-08-10 10:59 |只看该作者
不懂帮顶~~

论坛徽章:
9
程序设计版块每日发帖之星
日期:2016-02-13 06:20:00数据库技术版块每日发帖之星
日期:2016-06-15 06:20:00数据库技术版块每日发帖之星
日期:2016-06-16 06:20:00数据库技术版块每日发帖之星
日期:2016-06-18 06:20:00程序设计版块每日发帖之星
日期:2016-06-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-09 06:20:00IT运维版块每日发帖之星
日期:2016-07-15 06:20:00IT运维版块每日发帖之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-08-18 06:20:00
28 [报告]
发表于 2016-06-23 09:11 |只看该作者
heguangwu 发表于 2015-12-17 13:52
其实案例我想描述的更清楚一些,因为当时没有时间,现在补充如下:
软件功能描述,通过libpcap抓取Mysql的 ...


你为什么要搞这么多线程,是什么目的?有什么好处?
如果是多核多vcpu的话,一个vcpu一到两个线程就够了,最好是一个线程,如果不需要并发的话

论坛徽章:
146
2015年亚洲杯之日本
日期:2015-04-28 13:32:012015年亚洲杯之朝鲜
日期:2015-05-06 10:16:442015年亚洲杯之日本
日期:2015-05-06 10:21:342015年亚洲杯纪念徽章
日期:2015-05-13 17:16:442015亚冠之北京国安
日期:2015-05-13 17:18:292015亚冠之鹿岛鹿角
日期:2015-05-13 17:19:062015亚冠之德黑兰石油
日期:2015-05-27 16:47:402015亚冠之塔什干棉农
日期:2015-05-28 15:24:122015亚冠之卡尔希纳萨夫
日期:2015-06-01 13:52:392015亚冠之柏斯波利斯
日期:2015-06-04 17:37:292015亚冠之阿尔纳斯尔
日期:2015-06-16 11:31:202015亚冠之塔什干火车头
日期:2015-06-23 10:12:33
27 [报告]
发表于 2015-12-29 17:55 |只看该作者

论坛徽章:
4
水瓶座
日期:2013-09-06 12:27:30摩羯座
日期:2013-09-28 14:07:46处女座
日期:2013-10-24 14:25:01酉鸡
日期:2014-04-07 11:54:15
26 [报告]
发表于 2015-12-29 13:50 |只看该作者
这个就是C/C++服务很正常设计。

程序内部按模块划分,通过接口交换数据。

有的模块内部是线程池并发,通过对数据哈希或者轮转的方式分发到多个线程里计算。 而且为了降低锁带来的性能瓶颈,一般尽量避免多线程争夺相同的资源,尽量通过大拆小的思路提高并发计算能力。

论坛徽章:
0
25 [报告]
发表于 2015-12-26 04:04 |只看该作者
并发和并行有各自的适用环境.
并发基于系统事件,开销比较小,回调甚至不需要进入事件循环.所以处理读写密集型任务非常出色.
并行有多种方案.
多进程,由于系统内部的隔离机制,稳定性更好,但是进程间通信效率不高.
多线程,由于拥有共享内存,线程间通信的效能不错,但是由此带来的同步问题也很复杂.
由于多线程的开销不小,线程池是必要的.并行的主要目的还是处理计算密集型任务.

至于楼主的案例,建一个线程池,主线程接受消息并往线程池丢数据,池中的工作线程处理任务是很常见的方案.

论坛徽章:
1
综合交流区版块每日发帖之星
日期:2015-09-23 06:20:00
24 [报告]
发表于 2015-12-24 23:00 |只看该作者
新人正学习中的

论坛徽章:
1
综合交流区版块每日发帖之星
日期:2015-09-23 06:20:00
23 [报告]
发表于 2015-12-24 22:59 |只看该作者
新人正学习中的

论坛徽章:
15
2015七夕节徽章
日期:2015-08-21 11:06:172017金鸡报晓
日期:2017-01-10 15:19:56极客徽章
日期:2016-12-07 14:07:30shanzhi
日期:2016-06-17 17:59:3115-16赛季CBA联赛之四川
日期:2016-04-13 14:36:562016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-01-28 06:20:0015-16赛季CBA联赛之新疆
日期:2016-01-25 14:01:34IT运维版块每周发帖之星
日期:2016-01-07 23:04:26数据库技术版块每日发帖之星
日期:2016-01-03 06:20:00数据库技术版块每日发帖之星
日期:2015-12-01 06:20:00IT运维版块每日发帖之星
日期:2015-11-10 06:20:00
22 [报告]
发表于 2015-12-23 10:34 |只看该作者
能详细说说线程池+多个FIFO队列的要点吗,另外TBB是一个很大的并行库,能挑出一到两个来具体说明吗
回复 19# demilich


   

论坛徽章:
15
2015七夕节徽章
日期:2015-08-21 11:06:172017金鸡报晓
日期:2017-01-10 15:19:56极客徽章
日期:2016-12-07 14:07:30shanzhi
日期:2016-06-17 17:59:3115-16赛季CBA联赛之四川
日期:2016-04-13 14:36:562016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-01-28 06:20:0015-16赛季CBA联赛之新疆
日期:2016-01-25 14:01:34IT运维版块每周发帖之星
日期:2016-01-07 23:04:26数据库技术版块每日发帖之星
日期:2016-01-03 06:20:00数据库技术版块每日发帖之星
日期:2015-12-01 06:20:00IT运维版块每日发帖之星
日期:2015-11-10 06:20:00
21 [报告]
发表于 2015-12-23 10:32 |只看该作者
回复 20# hellioncu
你说的很对,rdkafka本身并不需要一个线程,只是当时考虑是为了控制发送流量避免影响在线应用而做的


   
  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP