免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: benjiam
打印 上一主题 下一主题

[FreeBSD] 如何提高程序的性能? [复制链接]

论坛徽章:
2
亥猪
日期:2014-03-19 16:36:35午马
日期:2014-11-23 23:48:46
31 [报告]
发表于 2008-05-06 17:25 |只看该作者
  %   cumulative   self              self     total           
time   seconds   seconds    calls  ms/call  ms/call  name   
26.7       0.79     0.79     5003     0.16     0.16  __sys_munmap [7]
24.8       1.52     0.73  2520003     0.00     0.00  memset [8]
16.6       2.01     0.49   175001     0.00     0.00  arena_run_alloc [10]
15.1       2.46     0.45        0  100.00%           .mcount (6
  8.9       2.73     0.26     5000     0.05     0.06  draw [13]
  3.9       2.84     0.12  2510001     0.00     0.00  arena_malloc [9]
  1.5       2.88     0.04        0    3.11%           calloc [1]


费时在memset。
freebsd 的memset在/usr/src/lib/libc/string/memset.S
linux的memset在glibc/string/memset.c
我没有看出freebsd的memset比较linux的效率差在哪里。

第二个耗时的:arena_run_alloc
freebsd7.0使用了新的malloc算法,不知是否是这个影响。

freebsd:
cc -pg -lgd -L/usr/local/lib -I/usr/local/include dd.c   // 没有I/O操作的后面的代码。
./a.out
gprof a.out > dd.txt

linux下类似。
我没有环境查看freebsd6.0和linux的分析状况(我的linux里面gprof有问题)。如果你有环境测试,不妨贴上来分析一下。我个人很想知道是什么原因导致你们的测试结果会那样悬殊。

[ 本帖最后由 gvim 于 2008-5-6 17:33 编辑 ]

el.JPG (17.87 KB, 下载次数: 73)

el.JPG

fb.JPG (17.7 KB, 下载次数: 66)

fb.JPG

论坛徽章:
0
32 [报告]
发表于 2008-05-06 18:12 |只看该作者
---

[ 本帖最后由 geel 于 2008-5-6 21:10 编辑 ]

论坛徽章:
0
33 [报告]
发表于 2008-05-06 20:02 |只看该作者
FreeBSD 6.2 i386
Celeron(R) CPU 2.53GHz
768 M memory

有IO的代码如下:
Tue May  6 19:39:50 2008
Tue May  6 19:44:47 2008
take 297


无IO的代码如下:
Tue May  6 19:52:04 2008
Tue May  6 19:57:07 2008
take 303

无IO的gprof  %   cumulative   self              self     total           
time   seconds   seconds    calls  ms/call  ms/call  name   
99.9       2.08     2.08     5000     0.42     0.42  draw [3]
  0.1       2.08     0.00        1     1.50  2079.58  main [1]


难道6.2 和 7.0 的差别那么大? 是由于malloc算法的改进引起的性能提升?

再请教我的pgrof结果为什么没有日尼 禾尔兄的详细?

论坛徽章:
0
34 [报告]
发表于 2008-05-07 00:08 |只看该作者
gprof ./a.out
BFD: ./a.out(.rel.plt): relocation 0 has invalid symbol index 1
BFD: ./a.out(.rel.plt): relocation 1 has invalid symbol index 2
BFD: ./a.out(.rel.plt): relocation 2 has invalid symbol index 3
BFD: ./a.out(.rel.plt): relocation 3 has invalid symbol index 4
BFD: ./a.out(.rel.plt): relocation 4 has invalid symbol index 5
BFD: ./a.out(.rel.plt): relocation 5 has invalid symbol index 7
BFD: ./a.out(.rel.plt): relocation 6 has invalid symbol index 8
BFD: ./a.out(.rel.plt): relocation 7 has invalid symbol index 9
BFD: ./a.out(.rel.plt): relocation 8 has invalid symbol index 11
BFD: ./a.out(.rel.plt): relocation 9 has invalid symbol index 12
BFD: ./a.out(.rel.plt): relocation 10 has invalid symbol index 13
BFD: ./a.out(.rel.plt): relocation 11 has invalid symbol index 15
BFD: ./a.out(.rel.plt): relocation 12 has invalid symbol index 18
BFD: ./a.out(.rel.plt): relocation 13 has invalid symbol index 20
BFD: ./a.out(.rel.plt): relocation 14 has invalid symbol index 21
Flat profile:

Each sample counts as 0.01 seconds.
  %   cumulative   self              self     total           
time   seconds   seconds    calls  ms/call  ms/call  name   
99.69     19.20    19.20     5000     3.84     3.84  draw
  0.31     19.26     0.06                             main

%         the percentage of the total running time of the
time       program used by this function.

cumulative a running sum of the number of seconds accounted
seconds   for by this function and those listed above it.

self      the number of seconds accounted for by this
seconds    function alone.  This is the major sort for this
           listing.

calls      the number of times this function was invoked, if
           this function is profiled, else blank.

self      the average number of milliseconds spent in this
ms/call    function per call, if this function is profiled,
           else blank.

total     the average number of milliseconds spent in this
ms/call    function and its descendents per call, if this
           function is profiled, else blank.

name       the name of the function.  This is the minor sort
           for this listing. The index shows the location of
           the function in the gprof listing. If the index is
           in parenthesis it shows where it would appear in
           the gprof listing if it were to be printed.


                     Call graph (explanation follows)


granularity: each sample hit covers 4 byte(s) for 0.05% of 19.26 seconds

index % time    self  children    called     name
                                                 <spontaneous>
[1]    100.0    0.06   19.20                 main [1]
               19.20    0.00    5000/5000        draw [2]
-----------------------------------------------
               19.20    0.00    5000/5000        main [1]
[2]     99.7   19.20    0.00    5000         draw [2]


我的也有问题, 也无法显示出系统接口的调用

加了-lc_p 就无法编译通过

linux

论坛徽章:
2
亥猪
日期:2014-03-19 16:36:35午马
日期:2014-11-23 23:48:46
35 [报告]
发表于 2008-05-07 10:29 |只看该作者
我也没有完整的linux环境,所以没办法进行比较。

论坛徽章:
0
36 [报告]
发表于 2008-05-07 10:42 |只看该作者
当时我怀疑这是gd库的问题,现在仍然怀疑

论坛徽章:
0
37 [报告]
发表于 2008-05-07 10:53 |只看该作者
gprof ./a.out
BFD: ./a.out(.rel.plt): relocation 0 has invalid symbol index 1
BFD: ./a.out(.rel.plt): relocation 1 has invalid symbol index 2
BFD: ./a.out(.rel.plt): relocation 2 has invalid symbol index 3
BFD: ./a.out(.rel.plt): relocation 3 has invalid symbol index 4
BFD: ./a.out(.rel.plt): relocation 4 has invalid symbol index 5
BFD: ./a.out(.rel.plt): relocation 5 has invalid symbol index 7
BFD: ./a.out(.rel.plt): relocation 6 has invalid symbol index 8
BFD: ./a.out(.rel.plt): relocation 7 has invalid symbol index 9
BFD: ./a.out(.rel.plt): relocation 8 has invalid symbol index 11
BFD: ./a.out(.rel.plt): relocation 9 has invalid symbol index 12
BFD: ./a.out(.rel.plt): relocation 10 has invalid symbol index 13
BFD: ./a.out(.rel.plt): relocation 11 has invalid symbol index 15
BFD: ./a.out(.rel.plt): relocation 12 has invalid symbol index 18
BFD: ./a.out(.rel.plt): relocation 13 has invalid symbol index 20
BFD: ./a.out(.rel.plt): relocation 14 has invalid symbol index 21

这个如何解决呢?

我重新升级了 程序也是这样的结果。

google 里面也没找到什么文章。



gd库 如果在2个平台性能差距这么大,  只能说linux版里面,优化得特别好?
但是在bsd7.0里面性能又如此之好,就又推翻了你的假设。  没有调查就没有发言权,一起都是猜测。

论坛徽章:
0
38 [报告]
发表于 2008-05-07 10:55 |只看该作者
用fb7.0吧或者等7.1

论坛徽章:
2
亥猪
日期:2014-03-19 16:36:35午马
日期:2014-11-23 23:48:46
39 [报告]
发表于 2008-05-07 10:56 |只看该作者
原帖由 im2web 于 2008-5-7 10:53 发表
gprof ./a.out
BFD: ./a.out(.rel.plt): relocation 0 has invalid symbol index 1
BFD: ./a.out(.rel.plt): relocation 1 has invalid symbol index 2
BFD: ./a.out(.rel.plt): relocation 2 has invalid  ...



一个老大正在比较6.x的malloc和7.0的malloc
应该会得出一个关于内存分配差异的结论。

论坛徽章:
0
40 [报告]
发表于 2008-05-07 11:08 |只看该作者
原帖由 im2web 于 2008-5-7 10:53 发表
gd库 如果在2个平台性能差距这么大,  只能说linux版里面,优化得特别好?
但是在bsd7.0里面性能又如此之好,就又推翻了你的假设。  没有调查就没有发言权,一起都是猜测。

不同的系统,因为体系结构和实现的不同,在不同的方面性能可能会有很大差别。比如有的系统管道性能非常好,但共享内存性能很差,而有的系统共享内存性能很好而管道性能很差。但程序只一般会用一种进程间通讯的方法,所以如果程序用的是共享内存,那在前一个系统上就不可能跑的很好。但这并不能说明前一个系统不如后一个,只能说前一个系统不适合某些应用。如果前一个系统改进了共享内存的性能,就可以让所有使用共享内存的应用获得性能上的提升。

所以如果gd是你的主要应用,你就应该考虑选择一个gd性能好的系统。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP