免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1165 | 回复: 0
打印 上一主题 下一主题

[RAID与磁盘阵列] 用Oracle存储来分析Unix系统的性能 (3) [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-06-16 20:30 |只看该作者 |倒序浏览

6. 创建crontab作业,定时执行run_vmstat.ksh脚本
该作业每半小时运行一次。
$ crontab –l > oracle.cron
$ echo ’00,30 * * * * /export/home/oracle/vmstat/run_vmstat.ksh
>> /export/home/oracle/vmstat/run.lst 2>&1’ >> oracle.cron
$ crontab oracle.cron
7. 分析数据
至此已经完成了定时运行vmstat和在数据库中存储vmstat结果的步骤。自然,仅仅是搜集了统计信息是远远不够的,下面我们要分析搜集来的信息,产生操作系统的性能报告。
将报告分为以下几类,分别用脚本实现。
异常报告:显示超过了门限值的时间段(vmstat_alert.ksh + vmstat_alert.sql)。
每小时趋势报告:显示一天内每小时的系统平均利用情况(rpt_vmstat_hr.sql)。
周趋势报告:显示每天的系统平均利用情况(rpt_vmstat_dy.sql)。
1) 异常报告
# vmstat_alert.sql
REM ----------------------------------------
REM 该SQL用于报告Oracle环境中每个服务器的异常情况。
REM 根据get_vmstat.ksh脚本得到的信息,报告每个小时的平均值。
REM DBA发现异常时间段,则可以深入检查每5分钟的详细数据。
REM 在这个脚本中接受一个参数,表示需要报告的时间跨度。
REM 对于runing queue的门限值应该设置为CPU数,
REM 表示如果出现大量等待执行的任务就报警,这通常表示CPU负载过重。
REM 对于page scan(sr)的门限值设置为1,
REM 表示只要出现page daemon扫描页就报警,这通常表示内存不足。
REM 对于CPU利用率,设置为70,表示超过70%以上的利用率才报警。
REM 比如运行vmstat_alert 7
REM 表示输出当前日期之前7天之内的执行队列大于4,
REM sr大于1,CPU利用率超过70%的按照小时统计的报告。
REM ----------------------------------------
set lines 80;
set pages 999;
set feedback off;
set verify off;
column my_date heading 'date hour' format a20
column c2 heading waitq format 9999
column c3 heading pg_in format 9999
column c4 heading pg_ot format 9999
column c5 heading usr format 9999
column c6 heading sys format 9999
column c7 heading idl format 9999
column c8 heading wt format 9999
ttitle 'run queue > CPUs|May indicate an overloaded CPU|
When runqueue exceeds the number of CPUs| on the server,
tasks are waiting for service.';
select
server_name,
to_char(start_date,'YY/MM/DD HH24') my_date,
avg(running_queue) c2,
avg(kbytes_page_in) c3,
avg(kbytes_page_out) c4,
avg(user_cpu) c5,
avg(system_cpu) c6,
avg(idle_cpu) c7
from
perfstat.stats$vmstat
WHERE
running_queue > 4
and start_date > sysdate-&1
group by
server_name,
to_char(start_date,'YY/MM/DD HH24')
ORDER BY
server_name,
to_char(start_date,'YY/MM/DD HH24')
;
ttitle 'page_scan > 1|May indicate overloaded memory|
Whenever Unix performs a page-in, the RAM memory |
on the server has been exhausted and swap pages are being used.';
select
server_name,
to_char(start_date,'YY/MM/DD HH24') my_date,
avg(running_queue) c2,
avg(kbytes_page_in) c3,
avg(kbytes_page_out) c4,
avg(user_cpu) c5,
avg(system_cpu) c6,
avg(idle_cpu) c7
from
perfstat.stats$vmstat
WHERE
page_scan > 1
and start_date > sysdate-&1
group by
server_name,
to_char(start_date,'YY/MM/DD HH24')
ORDER BY
server_name,
to_char(start_date,'YY/MM/DD HH24')
;
ttitle 'user+system CPU > 70%|Indicates periods
with a fully-loaded CPU subssystem.|Periods of
100% utilization are only a | concern when runqueue
values exceeds the number of CPs on the server.';
select
server_name,
to_char(start_date,'YY/MM/DD HH24') my_date,
avg(running_queue) c2,
avg(kbytes_page_in) c3,
avg(kbytes_page_out) c4,
avg(user_cpu) c5,
avg(system_cpu) c6,
avg(idle_cpu) c7
from
perfstat.stats$vmstat
WHERE
(user_cpu + system_cpu) > 70
and start_date > sysdate-&1
group by
server_name,
to_char(start_date,'YY/MM/DD HH24')
ORDER BY
server_name,
to_char(start_date,'YY/MM/DD HH24')
;
# vmstat_alert.ksh
#----------------------------------------
# 可以将此shell加入cron中,每天7点运行
#----------------------------------------
#!/bin/ksh
#----------------------------------------
# 首先设定环境变量,根据实际环境修改. . . .
# 接受一个参数输入,表示当前要报告的数据库SID
#----------------------------------------
ORACLE_SID=$1
export ORACLE_SID
ORACLE_HOME=`cat /var/opt/oracle/oratab|grep $ORACLE_SID:|cut -f2 -d':'`
export ORACLE_HOME
PATH=$ORACLE_HOME/bin:$PATH
export PATH
SCRIPT_PATH=`echo ~oracle/vmstat`
export SCRIPT_PATH
sqlplus perfstat/perfstat @/export/home/oracle/vmstat/vmstat_alert 7
# SQL> spool off;
# 如果超过3行则表示有异常值,那么直接邮件给DBA
#----------------------------------------
check_stat=`cat /tmp/vmstat_$ORACLE_SID.lst|wc -l`;
oracle_num=`expr $check_stat`
if [ $oracle_num -gt 3 ]
then
cat /tmp/vmstat_$ORACLE_SID.lst|mailx -s
"System vmstat alert" kamus@itpub.net
some_other_dba@mail.address.net
fi
1. 创建crontab作业,每天7点定时执行vmstat_alert.ksh脚本
$ crontab –l > oracle.cron
$ echo ’00 7 * * * /export/home/oracle/vmstat/vmstat_alert.ksh kamusdb
>> /export/home/oracle/vmstat/runalert.lst 2>&1’ >> oracle.cron
$ crontab oracle.cron
2) 每小时趋势报告
# rpt_vmstat_hr.sql
REM ----------------------------------------
REM 该SQL用于报告Oracle环境中每个服务器一天内小时平均的CPU使用率
REM 接受一个参数,用于指定需要报告的日期,格式为YYYYMMDD
REM ----------------------------------------
connect perfstat/perfstat;
set pages 9999;
set feedback off;
set verify off;

column server_name heading 'server' format a10
column my_hour heading 'hour' format a10
column c2 heading runq format 9999
column c3 heading pg_in format 9999
column c4 heading pg_ot format 9999
column c5 heading usr format 9999
column c6 heading sys format 9999
column c7 heading idl format 9999
column c8 heading wt format 9999
select server_name,
to_char(start_date, 'HH24') my_hour,
avg(runing_queue) c2,
avg(kbytes_page_in) c3,
avg(kbytes_page_out) c4,
avg(user_cpu + system_cpu) c5,
avg(system_cpu) c6,
avg(idle_cpu) c7
from stats$vmstat
where trunc(start_date) = to_date(&1,'yyyymmdd')
group BY server_name,to_char(start_date, 'HH24')
order by server_name,to_char(start_date, 'HH24');
3) 周趋势报告
# rpt_vmstat_dy.sql
REM ----------------------------------------
REM 该SQL用于报告本周内Oracle环境中每个服务器的日平均CPU使用率
REM ----------------------------------------
connect perfstat/perfstat;
set pages 9999;
set feedback off;
set verify off;

column server_name heading 'server' format a10
column my_day heading 'day' format a20
column c2 heading runq format 9999
column c3 heading pg_in format 9999
column c4 heading pg_ot format 9999
column c5 heading usr format 9999
column c6 heading sys format 9999
column c7 heading idl format 9999
column c8 heading wt format 9999
select server_name,
to_char(start_date, 'day') my_day,
avg(runing_queue) c2,
avg(kbytes_page_in) c3,
avg(kbytes_page_out) c4,
avg(user_cpu + system_cpu) c5,
avg(idle_cpu) c7
from stats$vmstat
where trunc(start_date) >= trunc(next_day(sysdate, 'MONDAY')) - 7
and trunc(start_date)
好了,有了这些报告。我们就只需要编写一些脚本就可以实现自动的后台监控,当有问题的时候再自动发送邮件给DBA。


本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u2/71105/showart_1003292.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP