免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 988 | 回复: 0
打印 上一主题 下一主题

性能监测工具 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-05-13 15:02 |只看该作者 |倒序浏览
Linux系统出现问题时,我们不仅需要查看系统日志信息,而且还要使用大量的性能监测工具来判断究竟是哪一部分(内存、CPU、硬盘……)出
了问题。在Linux系统中,所有的运行参数保存在虚拟目录/proc中,换句话说,我们使用的性能监控工具取到的数据值实际上就是源自于这个目录,当涉
及到系统高估时,我们就可以修改/proc目录中的相关参数了,当然有些是不能乱改的。下面就让我们了解一下这些常用的性能监控工具。      工具 功能描述uptime系统平均负载率dmesg硬件/系统信息top进程进行状态iostatCPU和磁盘平均使用率vmstat系统运行状态sar实时收集系统使用状态KDE System Guard图形监控工具free内存使用率traffic-vis网络监控(只有SUSE有)pmap进程内存占用率strace追踪程序运行状态ulimit系统资源使用限制mpstat多处理器使用率1uptimeuptime命令用于查看服务器运行了多长时间以及有多少个用户登录,快速获知服务器的负荷情况。
  uptime的输出包含一项内容是load average,显示了最近1,5,15分钟的负荷情况。它的值代表等待CPU处理的进程数,如果CPU没有时间处理这些进程,load average值会升高;反之则会降低。
  load average的最佳值是1,说明每个进程都可以马上处理并且没有CPU cycles被丢失。对于单CPU的机器,1或者2是可以接受的值;对于多路CPU的机器,load  average值可能在8到10之间。
  也可以使用uptime命令来判断网络性能。例如,某个网络应用性能很低,通过运行uptime查看服务器的负荷是否很高,如果不是,那么问题应该是网络方面造成的。
  以下是uptime的运行实例:
  9:24am  up   19:06,  1 user,  load average: 0.00, 0.00, 0.00
  也可以查看/proc/loadavg和/proc/uptime两个文件,注意不能编辑/proc中的文件,要用cat等命令来查看,如:
  liyawei:~ # cat  /proc/loadavg
  0.00 0.00 0.00  1/55 5505
  
  2
dmesg  dmesg命令主要用来显示内核信息。使用dmesg可以有效诊断机器硬件故障或者添加硬件出现的问题。
  另外,使用dmesg可以确定您的服务器安装了那些硬件。每次系统重启,系统都会检查所有硬件并将信息记录下来。执行/bin/dmesg命令可以查看该记录。
  dmesg输入实例:
  ReiserFS: hda6:  checking transaction log (hda6)
  ReiserFS: hda6:  Using r5 hash to sort names
  Adding 1044184k  swap on /dev/hda5.  Priority:-1 extents:1  across:1044184k
  parport_pc: VIA 686A/8231 detected
  parport_pc:  probing current configuration
  parport_pc:  Current parallel port base: 0x378
  parport0:  PC-style at 0x378 (0x778), irq 7, using FIFO [PCSPP,TRISTATE,COMPAT,ECP]
  parport_pc: VIA  parallel port: io=0x378, irq=7
  lp0: using  parport0 (interrupt-driven).
  e100: Intel(R)  PRO/100 Network Driver, 3.5.10-k2-NAPI
  e100:  Copyright(c) 1999-2005 Intel Corporation
  ACPI: PCI  Interrupt 0000:00:0d.0[A] -> GSI 17 (level, low) -> IRQ 169
  e100: eth0: e100_probe: addr 0xd8042000, irq 169, MAC addr  00:02:55:1E:35:91
  usbcore:  registered new driver usbfs
  usbcore:  registered new driver hub
  hdc: ATAPI 48X  CD-ROM drive, 128kB Cache, UDMA(33)
  Uniform CD-ROM  driver Revision: 3.20
  USB Universal  Host Controller Interface driver v2.3
  
  3
top  top命令显示处理器的活动状况。缺省情况下,显示占用CPU最多的任务,并且每隔5秒钟做一次刷新。
Processpriority的数值决定了CPU处理进程的顺序。LIUNX内核会根据需要调整该数值的大小。nicevalue局限于
priority。priority的值不能低于nice value(nicevalue值越低,优先级越高)。您不可以直接修改Process
priority的值,但是可以通过调整nicelevel值来间接地改变Process
priority值,然而这一方法并不是所有时候都可用。如果某个进程运行异常的慢,可以通过降低nicelevel为该进程分配更多的CPU。
  Linux 支持的 nice levels 由19 (优先级低)到-20 (优先级高),缺省值为0。
  执行/bin/ps命令可以查看到当前进程的情况。
  
  4
iostat  iostat由Red Hat Enterprise Linux AS发布。同时iostat也是Sysstat的一部分,可以下载到,网址是
http://perso.wanadoo.fr/sebastien.godard/
  执行iostat命令可以从系统启动之后的CPU平均时间,类似于uptime。除此之外,iostat还对创建一个服务器磁盘子系统的活动报告。该报告包含两部分:CPU使用情况和磁盘使用情况。
  iostat显示实例:
  avg-cpu:  %user    %nice %system %iowait  %steal   %idle
  0.16    0.01     0.03    0.10    0.00    99.71  Device:            tps   Blk_read/s    Blk_wrtn/s   Blk_read   Blk_wrtn
  hda               0.31         4.65         4.12     327796      290832  avg-cpu:  %user    %nice %system %iowait  %steal   %idle
  1.00    0.00     0.00    0.00    0.00   100.00  Device:            tps   Blk_read/s    Blk_wrtn/s   Blk_read   Blk_wrtn
  hda               0.00         0.00         0.00          0          0  avg-cpu:  %user    %nice %system %iowait  %steal   %idle
  0.00    0.00     0.00    0.00    0.00    99.01  Device:            tps   Blk_read/s    Blk_wrtn/s   Blk_read   Blk_wrtn
  hda               0.00         0.00         0.00          0          0
  CPU占用情况包括四块内容
  %user:显示user level (applications)时,CPU的占用情况。
  %nice:显示user level在nice priority时,CPU的占用情况。
  %sys:显示system level (kernel)时,CPU的占用情况。
%idle: 显示CPU空闲时间所占比例。磁盘使用报告分成以下几个部分:
  Device: 块设备的名字
  tps: 该设备每秒I/O传输的次数。多个I/O请求可以组合为一个,每个I/O请求传输的字节数不同,因此可以将多个I/O请求合并为一个。
  Blk_read/s, Blk_wrtn/s: 表示从该设备每秒读写的数据块数量。块的大小可以不同,如1024,  2048 或 4048字节,这取决于partition的大小。例如,执行下列命令获得设备/dev/sda1  的数据块大小:
  dumpe2fs -h /dev/sda1 |grep -F "Block  size"输出结果如下
  dumpe2fs 1.34 (25-Jul-2003)
  Block size: 1024Blk_read, Blk_wrtn: 指示自从系统启动之后数据块读/写的合计数。
  也可以查看这几个文件/proc/stat,/proc/partitions,/proc/diskstats的内容。
  
  5
vmstat  vmstat提供了processes, memory, paging, block  I/O, traps和CPU的活动状况
  procs -----------memory----------  ---swap-- -----io---- -system-- -----cpu------
  r   b   swpd   free    buff  cache   si    so    bi    bo    in   cs us sy id wa st
  1   0      0 513072  52324 162404    0     0     2     2   261   32  0  0  100  0   0
  0   0      0 513072  52324 162404    0     0     0     0   271   43  0  0  100  0   0
  0   0      0 513072  52324 162404    0     0     0     0   255   27  0  0  100  0   0
  0   0      0 513072  52324 162404    0     0     0    28   275   51  0  0  97  3   0
  0   0      0 513072  52324 162404    0     0     0     0   255   21  0  0  100  0   0
  各输出列的含义:
  Process
  – r: The number of processes waiting for runtime.
  – b: The number of processes in uninterruptable sleep.
  Memory
  – swpd: The amount of virtual memory used (KB).
  – free: The amount of idle memory (KB).
  – buff: The amount of memory used as buffers (KB).
  Swap
  – si: Amount of memory swapped from the disk (KBps).
  – so: Amount of memory swapped to the disk (KBps).
  IO
  – bi: Blocks sent to a block device (blocks/s).
  – bo: Blocks received from a block device (blocks/s).
  System
  – in: The number of interrupts per second, including the clock.
  – cs: The number of context switches per second.
  CPU (these are percentages of total CPU time)
  - us: Time spent running non-kernel code (user time, including nice time).
  – sy: Time spent running kernel code (system time).
  – id: Time spent idle. Prior to Linux 2.5.41,  this included IO-wait time.
  – wa: Time spent waiting for IO. Prior to Linux 2.5.41, this appeared as zero.
  
  6
sar  sar是Red Hat Enterprise Linux AS发行的一个工具,同时也是Sysstat工具集的命令之一,可以从以下网址下载:
http://perso.wanadoo.fr/sebastien.godard/
  sar用于收集、报告或者保存系统活动信息。sar由三个应用组成:sar显示数据、sar1和sar2用于收集和保存数据。
  使用sar1和sar2,系统能够配置成自动抓取信息和日志,以备分析使用。配置举例:在/etc/crontab中添加如下几行内容
  同样的,你也可以在命令行方式下使用sar运行实时报告。如图所示:
  从收集的信息中,可以得到详细的CPU使用情况(%user, %nice,  %system, %idle)、内存页面调度、网络I/O、进程活动、块设备活动、以及interrupts/second
  liyawei:~ # sar  -u 3 10
  Linux 2.6.16.21-0.8-default  (liyawei)   05/31/07  10:17:16          CPU     %user      %nice   %system   %iowait      %idle
  10:17:19          all      0.00       0.00      0.00      0.00     100.00
  10:17:22          all      0.00       0.00      0.00      0.33      99.67
  10:17:25          all      0.00       0.00      0.00      0.00     100.00
  10:17:28          all      0.00       0.00      0.00      0.00     100.00
  10:17:31          all       0.00      0.00      0.00       0.00    100.00
  10:17:34          all      0.00       0.00      0.00      0.00     100.00
  
  7
KDE System Guard  KDE System Guard  (KSysguard) 是KDE图形方式的任务管理和性能监视工具。监视本地及远程客户端/服务器架构体系的中的主机。
  
  8
free  /bin/free命令显示所有空闲的和使用的内存数量,包括swap。同时也包含内核使用的缓存。
  total       used       free      shared    buffers     cached
  Mem:        776492     263480      513012          0      52332      162504
  -/+  buffers/cache:      48644     727848
  Swap:      1044184          0     1044184
  
  9
Traffic-vis  Traffic-vis是一套测定哪些主机在IP网进行通信、通信的目标主机以及传输的数据量。并输出纯文本、HTML或者GIF格式的报告。注:Traffic-vis仅仅适用于SUSE LINUX ENTERPRISE SERVER。如下命令用来收集网口eth0的信息:
  traffic-collector  -i eth0 -s /root/output_traffic-collector
  可以使用killall命令来控制该进程。如果要将报告写入磁盘,可使用如下命令:
  killall -9  traffic-collector
  要停止对信息的收集,执行如下命令:killall -9 traffic-collector注意,不要忘记执行最后一条命令,否则会因为内存占用而影响性能。可以根据packets, bytes, TCP连接数对输出进行排序,根据每项的总数或者收/发的数量进行。
  例如根据主机上packets的收/发数量排序,执行命令:
  traffic-sort -i  output_traffic-collector -o output_traffic-sort -Hp如要生成HTML格式的报告,显示传输的字节数,packets的记录、全部TCP连接请求和网络中每台服务器的信息,请运行命令:
  traffic-tohtml  -i output_traffic-sort -o output_traffic-tohtml.html
  如要生成GIF格式(600X600)的报告,请运行命令:
  traffic-togif -i  output_traffic-sort -o output_traffic-togif.gif -x 600 -y 600GIF
格式的报告可以方便地发现网络广播,查看哪台主机在TCP网络中使用IPX/SPX协议并隔离网络,需要记住的是,IPX是基于广播包的协议。如果我们需
要查明例如网卡故障或重复IP的问题,需要使用特殊的工具。例如SUSE LINUX EnterpriseServer自带的Ethereal。
  技巧和提示:使用管道,可以只需执行一条命令来产生报告。如生成HTML的报告,执行命令:
  cat  output_traffic-collector | traffic-sort -Hp | traffic-tohtml -o  output_traffic-tohtml.html
  如要生成GIF文件,执行命令:
  cat  output_traffic-collector | traffic-sort -Hp | traffic-togif -o  output_traffic-togif.gif -x 600 -y 600
  
  10
pmap  pmap可以报告某个或多个进程的内存使用情况。使用pmap判断主机中哪个进程因占用过多内存导致内存瓶颈。
  pmap liyawei:~
#
pmap 1                                                                                                                                                      
  1: init
  START       SIZE      RSS   DIRTY PERM MAPPING
  08048000    484K    244K       0K r-xp /sbin/init
  080c1000       4K      4K      4K rw-p /sbin/init
  080c2000    144K      24K     24K rw-p [heap]
  bfb5b000     84K      12K     12K rw-p [stack]
  ffffe000      4K       0K      0K ---p [vdso]
  Total:      720K     284K     40K  232K  writable-private, 488K readonly-private, and 0K shared
  
  11
strace  strace截取和记录系统进程调用,以及进程收到的信号。是一个非常有效的检测、指导和调试工具。系统管理员可以通过该命令容易地解决程序问题。
  使用该命令需要指明进程的ID(PID),例如:
  strace -p
  # strace –p 2582
  rt_sigprocmask(SIG_SETMASK,  [], NULL, 8) = 0
  read(7,  "\"\\\"\\\\\\\"\\\\\\\\\\\\\\\"\\\\\\\\\\\\\\\\\\\\\\\\"...,  16384) = 321
  write(3, "}H\331q\37\275$\271\t\311M\304$\317~)R9\330Oj\304\257\327"..., 360) =  360
  select(8, [3 4  7], [3], NULL, NULL)     = 2 (in [7], out  [3])
  rt_sigprocmask(SIG_BLOCK,  [CHLD], [], 8) = 0
  rt_sigprocmask(SIG_SETMASK,  [], NULL, 8) = 0
  read(7,  "\"\\\"\\\\\\\"\\\\\\\\\\\\\\\"\\\\\\\\\\\\\\\\\\\\\\\\"...,  16384) = 323
  write(3,  "\204\303\27$\35\206\\\306VL\370\5R\200\226\2\320^\253\253"..., 360)  = 360
  select(8, [3 4  7], [3], NULL, NULL)     = 2 (in [7], out  [3])
  rt_sigprocmask(SIG_BLOCK,  [CHLD], [], 8) = 0
  rt_sigprocmask(SIG_SETMASK,  [], NULL, 8) = 0
  read(7,  "\"\\\"\\\\\\\"\\\\\\\\\\\\\\\"\\\\\\\\\\\\\\\\\\\\\\\\"...,  16384) = 323
  write(3,  "\243\207\204\277Cw\0162\2ju=\205\'L\352?0J\256I\376\32"..., 360) =  360
  select(8, [3 4  7], [3], NULL, NULL)     = 2 (in [7], out  [3])
  rt_sigprocmask(SIG_BLOCK,  [CHLD], [], 8) = 0
  rt_sigprocmask(SIG_SETMASK,  [], NULL, 8) = 0
  read(7,  "\"\\\"\\\\\\\"\\\\\\\\\\\\\\\"\\\\\\\\\\\\\\\\\\\\\\\\"...,  16384) = 320
  write(3,  "6\270S\3i\310\334\301\253!ys\324\'\234%\356\305\26\233"..., 360) =  360
  select(8, [3 4  7], [3], NULL, NULL)     = 2 (in [7], out  [3])
  rt_sigprocmask(SIG_BLOCK,  [CHLD], [], 8) = 0
  rt_sigprocmask(SIG_SETMASK,  [], NULL, 8) = 0
  
  12
ulimit  ulimit内置在bash shell中,用来提供对shell和进程可用资源的控制
  liyawei:~ #  ulimit -a
  core file  size          (blocks, -c) 0
  data seg  size           (kbytes, -d) unlimited
  file size               (blocks, -f) unlimited
  pending signals                 (-i) 6143
  max locked  memory       (kbytes, -l) 32
  max memory  size         (kbytes, -m) unlimited
  open files                      (-n) 1024
  pipe size            (512 bytes, -p) 8
  POSIX message  queues     (bytes, -q) 819200
  stack size              (kbytes, -s) 8192
  cpu time               (seconds, -t) unlimited
  max user  processes              (-u) 6143
  virtual  memory          (kbytes, -v) unlimited
  file locks                      (-x) unlimited
  -H和-S选项指明所给资源的软硬限制。如果超过了软限制,系统管理员会收到警告信息。硬限制指在用户收到超过文件句炳限制的错误信息之前,可以达到的最大值。
  例如可以设置对文件句炳的硬限制:ulimit -Hn 4096
  例如可以设置对文件句炳的软限制:ulimit -Sn 1024
  查看软硬值,执行如下命令:
  ulimit -Hn
  ulimit -Sn
  例如限制Oracle用户. 在/etc/security/limits.conf输入以下行:
  soft nofile 4096
  hard nofile  10240
  对于Red Hat  Enterprise Linux AS,确定文件/etc/pam.d/system-auth包含如下行
  session required  /lib/security/$ISA/pam_limits.so
  对于SUSE LINUX Enterprise Server,确定文件/etc/pam.d/login 和/etc/pam.d/sshd包含如下行:
  session required  pam_limits.so
  这一行使这些限制生效。
  
  13
mpstat  mpstat是Sysstat工具集的一部分,下载地址是
http://perso.wanadoo.fr/sebastien.godard/
  mpstat用于报告多路CPU主机的每颗CPU活动情况,以及整个主机的CPU情况。
  例如,下边的命令可以隔2秒报告一次处理器的活动情况,执行3次
  mpstat 2 3
  liyawei:~ #  mpstat 2 3
  Linux 2.6.16.21-0.8-default  (liyawei)   05/31/07  10:23:03     CPU    %user   %nice    %sys %iowait    %irq    %soft  %steal   %idle     intr/s
  10:23:05     all     0.50    0.00    0.00     1.99    0.00    0.00     0.00   97.51    271.64
  10:23:07     all     0.00    0.00    0.00     0.00    0.00    0.00     0.00  100.00    261.00
  10:23:09     all     0.00    0.00    0.00     0.00    0.00    0.00     0.00  100.00    261.50
  Average:     all     0.17    0.00    0.00     0.67    0.00    0.00     0.00   99.17    264.73
  如下命令每隔1秒显示一次多路CPU主机的处理器活动情况,执行3次
  mpstat -P ALL 1 3
  liyawei:~ #  mpstat -P ALL 1 10
  Linux 2.6.16.21-0.8-default  (liyawei)   05/31/07  10:23:31     CPU    %user   %nice    %sys %iowait    %irq    %soft  %steal   %idle     intr/s
  10:23:32     all     0.00    0.00    0.00     0.00    0.00    0.00     0.00  100.00    273.00
  10:23:32       0     0.00    0.00    0.00     0.00    0.00    0.00     0.00  100.00    272.00
  10:23:33     all     0.00    0.00    0.00     0.00    0.00    0.00     0.00  100.00    254.00
  10:23:33       0     0.00    0.00    0.00     0.00    0.00    0.00     0.00  100.00    254.00
  10:23:34     all     0.00    0.00    0.00     0.00    0.00    0.00     0.00  100.00    271.00
  10:23:34       0     0.00    0.00    0.00     0.00    0.00    0.00     0.00  100.00    271.00
  10:23:35     all     0.00    0.00    0.00     1.98    0.00    0.00     0.00   98.02    254.46
10:23:35       0     0.00    0.00    0.00     1.98    0.00    0.00     0.00  
98.02    254.46
http://www.powersite.cn/?q=node/19
               
               
               

本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u3/96497/showart_1926945.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP