论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2011-12-21 11:58 |只看该作者 |倒序浏览

               Linux下多线程和多进程的优劣我就不讲了，那些都是老生常谈的东西，最近项目做一个流数据统计引擎（有点类似数据库的统计count(*)等）。项目是用多线程实现的。
具体的场景是这样的，一组线程从socket接受流数据，经过简单处理把数据送到处理线程，让处理线程对流数据进行处理（我们项目把每一类流数据具体为一类event），然后等到一定的时间把统计结果写文件。

               处理的场景如下：所有的处理单元用无锁的环形缓冲区串在一起，形成一条流水线，每一个处理单元是一个线程，这样的好处是流数据是所有处理单元共享的，可以节约内存，然后流数据的指针在不同的处理单元串行流动（这样可以避免用到锁）。

            这是一个典型的场景，数据的指针在流动，然后每个线程查看数据（不会修改），然后更新统计结果，所有的程序没有用到锁，按照道理来说，这样的模型是比较好的。但是实际情况是一个处理单元的处理能力是3W个Event/s,10个处理单元形成流水线以后，处理能力只能达到3000个Event/s。这样的结果让我大跌眼镜。

            尝试过的解决方案：一开始以为操作系统的内存数据结构同步会影响流水线的并行性，后面尝试在每个线程上面加一个线程池，这样每个线程的内存分配和释放都是线程自己管理，甚至连STL也没有使用，内存完全是自己控制的，但是没有丝毫效果。
                                    后面尝试用多进程，每个处理单元都是一个进程，进程间用管道串起来，数据在管道间传输，这样的话，速度能够基本上保持线性增加（2U 4C 超线程的服务器）1个处理单元式3W 10个处理单元大概有2.5W/处理单元也就是总共25W的吞吐。

               这里我看出多线程还有些什么地方有问题，访存得问题还是缓存命中的问题，现在也不得而知，不知道这种模型能不能够改进，毕竟多线程能够共享数据，所以可以共享原始的流数据，可以节约很多内存，如果改进线程模型可以增加线性不知道又没有高手能够解答一下。

            我在网上找了很多资料，版主 johnbull 曾今说过这个问题，他说多线程共享数据，会造成太多的缓冲会写（wirte-back),所以导致内存子系统的串行化访问，我感觉我的程序问题就在这里，不过我不懂的是，多线程共享数据，但是这个数据是只读的（没有线程回去修改），所以我的理解是数据如果不是dirty的那么不用wirte-back吧。。。。。。。。

            不知道大家有没有关注访存密集型应用，特别是SMP的架构下，内存的访问是最大的瓶颈吧。期待大家的解答。。

文库|博客

zylthinking

大富大贵

论坛徽章:: 11

2楼 [报告]

发表于 2011-12-21 12:07 |只看该作者

没彻底搞清楚到底怎么个模型，可否帖个大概代码出来？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

JohnBull

版主

论坛徽章:: 0

3楼 [报告]

发表于 2011-12-21 12:25 |只看该作者

不能确定是我提到的原因。
我怀疑是你使用“无锁”算法造成的，无锁虽然避免了互斥开销，但你可能因此而不得不采用忙等方式操作，搞不好得不偿失。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

drangon

小富即安

论坛徽章:: 0

4楼 [报告]

发表于 2011-12-21 12:35 |只看该作者

oprofile ，先找问题原因吧，

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

hy036630

白手起家

论坛徽章:: 0

5楼 [报告]

发表于 2011-12-21 14:26 |只看该作者

代码太多，真帖不了

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

hy036630

白手起家

论坛徽章:: 0

6楼 [报告]

发表于 2011-12-21 14:28 |只看该作者

确实是用了忙等，不过一个线程也是忙等。多个线程一起忙等，对程序有影响么，而且机器的线程数是32线程的，10个线程应该可以同时运行吧。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

hy036630

白手起家

论坛徽章:: 0

7楼 [报告]

发表于 2011-12-21 14:32 |只看该作者

确实正在用oprofile分析不过那个工具网上介绍都比较浅,正在摸索

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

JohnBull

版主

论坛徽章:: 0

8楼 [报告]

发表于 2011-12-21 14:36 |只看该作者

hy036630 发表于 2011-12-21 14:28
确实是用了忙等，不过一个线程也是忙等。多个线程一起忙等，对程序有影响么，而且机器的线程数是32线程的， ...

忙等就是空转，空转就是 “誓把时间片吃尽，我不干事别人也别想干”...
性能还能好？老老实实加上锁再试试

google下“老板-雇员”算法。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

hy036630

白手起家

论坛徽章:: 0

9楼 [报告]

发表于 2011-12-21 14:58 |只看该作者

不好意思可能我上面没有说清楚
我用的是下面这个环形队列无锁的实现一个进程读，一个进程写，没有牵涉到其他线程。
这样的方式把10个线程串成一条流水线，主线程把指针push到第一个线程的环形队列，第一个线程从环形队列里面pop出来一个数据(指针)，然后处理（不会修改这个指针指向的值），然后把这个指针插入到下一个线程的队列，下一个线程也从自己的队列里面pop一个数据，然后处理，再push到下下个线程的队列。
所以只有一个线程的队列满了，push不进去会循环的push，知道能够push进去，或者是队列空了，pop出来的数据null，会继续pop，这两种情况下会忙等，不然是不会忙等的，而这两种情况在测试的时候很少发生，对性能影响应该很小。

template<class T>
class RingQueue {
public:
RingQueue() {
cout << "RingQueue::ctor" << endl;
};
virtual ~RingQueue() {
cout << "RingQueue::destory" << endl;
};
void InitQueue() {
Push_Count = 0;
Push_Index = 0;
Pop_Count = 0;
Pop_Index = 0;
memset(List, 0, sizeof (List));
}
bool Push(const T& AData) {
if (Push_Count - Pop_Count < Max_Count) {
List[Push_Index] = AData;
Push_Count++;
if (Push_Index == High_Index)
Push_Index = 0;
else
Push_Index++;
return true;
} else
return false;
}
T Pop() {
T result = NULL;
if (Push_Count != Pop_Count) {
result = List[Pop_Index];
Pop_Count++;
if (Pop_Index == High_Index)
Pop_Index = 0;
else
Pop_Index++;
}
return result;
}
long size() {
return this->Push_Count - this->Pop_Count;
}
private:
RingQueue(const RingQueue& orig);
T List[524288 * 2]; //2^19 4M�ռ�
const static unsigned long Max_Count = 524288 * 2;
const static unsigned long High_Index = 524288 * 2 - 1;
unsigned long Push_Count;
unsigned long Push_Index;
unsigned long Pop_Count;
unsigned long Pop_Index;
};

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

hy036630

白手起家

论坛徽章:: 0

10楼 [报告]

发表于 2011-12-21 15:02 |只看该作者

还有 google 老板-雇员找不到{:3_199:}

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

12 3 4 5 6 7 8 9 / 9 页下一页

返回列表

Chinaunix › 论坛 › 程序设计 › C/C++ › 多线程OR多进程-访存密集型应用

多线程OR多进程-访存密集型应用 [复制链接]

浏览过的版块