- 论坛徽章:
- 0
|
Cache缓存与一些程序性能优化的小方法:
由于CPU运算速度的增长远远大于内存速度的增长,同时由于程序运行的局部性原理,所以现代计算机体系结构中引入了cache。
其实系统的存储器本身就是一个层次结构,从寄存器->高速缓存->主存->本地磁盘->颁布式文件系统。
在下面的贴子中的一个文档对cache方面讲解得非常不错,可以看看:
http://bbs.chinaunix.net/viewthr ... mp;highlight=scutan
高速缓存的性能主要有以下几个方面:
1. 高速缓存的大小:
当CPU接收到指令后,它会最先向CPU中的一级缓存去寻找相关的数据,如果未命中,则继续向下一级的二级缓存中寻找。所以高速缓存越大,命中的机率也就越高。
2. 块大小的影响
大的块有利有弊,一方面,较大的块能利用程序中可能存在的空间局部性,帮助提高命中率。不过,对于给定的高速缓存的大小,块越大就意味着缓存行数越小,这会损害时间局部性比空间局部性更好的程序中的命中率。同时,因为块越大,传达时间也就越长。
3. 相联度的影响
较高的相联度的优点的降低了高速缓存由于冲突不命中出现抖动的可能性。不过,较高的相联度会造成较高的成本。
4. 前端总线的影响
现在的CPU技术发展很快,运算速度提高很大,而足够大的前端总线可以保障有足够的数据供给CPU,较低的前端总线将无法供给足够的数据给CPU,限制了CPU性能的发挥。
最后谈谈程序性能优化的相关内容。
对于程序性能的优化,首先应该考虑的架构以及算法这两方面的优化,最后再来考虑下面所讲述的这些优化。
消除连续的函数调用
消除不必要的存储器引用
通过展开循环降低循环开销
提高并行性
重新排列循环以提高空间局部性
让最常运行部分运行得更快
参考资料:
[1]. John L. Hennessy, David A. Patterson. 计算机体系结构:量化研究方法. 第4版
[2]. Shameem Akhter, Jason Roberts. 多核程序设计技术—通过软件多线程提升性能
[3]. Randal E. Bryant, David O’Hallaron. 深入理解计算机系统
[4]. Daniel P.Bovet, Marco Cesati. 深入理解Linux内核 第3版 |
|