免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: powerwillfree
打印 上一主题 下一主题

[Hadoop&HBase] 盛大游戏招hadoop运维工程师 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2012-03-13 15:38 |只看该作者
呵呵,职业水民,
所有收到的简历,都会仔细考虑的,所以请放心投。
另外,盛大对学历有制度上的要求,本科。

论坛徽章:
0
12 [报告]
发表于 2012-03-19 10:02 |只看该作者
通过观察发现,TUXEDO服务积压严重,表现在GWTDOMAIN服务,可以断定大部分业务压力来自前台营业系统通过DOMAIN访问我们的TUXEDO服务。

(联动北方技术论坛 - Powered by Landingbj) [网际游航]
对UBBCONFIG文件做了以下调整:
(联动北方技术论坛 - Powered by Landingbj) [网际游航]1、MAXWSCLIENTS由845调整为2000(这个值最好大于LICENSE数量);
(联动北方技术论坛 - Powered by Landingbj) [网际游航]2、增大服务数量:
(联动北方技术论坛 - Powered by Landingbj) [网际游航]s2001MARKINFO  SRVGRP=USER_SDCRM SRVID=18001 MIN=8 MAX=15
(联动北方技术论坛 - Powered by Landingbj) [网际游航]               CLOPT="-A -r -o /crm/inter/run/log/s2001MARKINFO.log"
(联动北方技术论坛 - Powered by Landingbj) [网际游航]s2001MARKINFO2  SRVGRP=USER_SDCRM SRVID=19101 MIN=8 MAX=15
(联动北方技术论坛 - Powered by Landingbj) [网际游航]               CLOPT="-A -r -o /crm/inter/run/log/s2001MARKINFO2.log"
(联动北方技术论坛 - Powered by Landingbj) [网际游航]s2014CUSTINFO  SRVGRP=USER_SDCRM SRVID=18701 RESTART=Y MIN=20 MAX=20
(联动北方技术论坛 - Powered by Landingbj) [网际游航]               CLOPT="-A -r -o /crm/inter/run/log/s2014CUSTINFO.log"
(联动北方技术论坛 - Powered by Landingbj) [网际游航]JSL             SRVGRP=JSLGRP_SDCRM SRVID=8000 RESTART=Y GRACE=0 MAXGEN=10
(联动北方技术论坛 - Powered by Landingbj) [网际游航]               CLOPT= "-A -r -- -n //130.17.0.231:7800 -d /dev/tcp -m10 -M50 -x10"
(联动北方技术论坛 - Powered by Landingbj) [网际游航]WSL             SRVGRP=WSLGRP_SDCRM SRVID=8100 RESTART=Y MAXGEN=10
(联动北方技术论坛 - Powered by Landingbj) [网际游航]               CLOPT= "-A -r -- -n //130.17.0.231:7700  -d /dev/tcp -m15 -M50 -x10 -K both -c 10240"
(联动北方技术论坛 - Powered by Landingbj) [网际游航]3、所有服务增加-o参数:CLOPT="-A -r -o

(联动北方技术论坛 - Powered by Landingbj) [网际游航]
存在主要的问题:
(联动北方技术论坛 - Powered by Landingbj) [网际游航]1、服务配置数量不合理:访问量很大的服务s2014CUSTINFO、2001MARKINFO、s2001MARKINFO2进程原来配置只启动了2个,导致业务积压;其他服务访问量都非常小,建议观察服务执行次数,调整所有服务合理的进程数量;
(联动北方技术论坛 - Powered by Landingbj) [网际游航]2、JSH/WSH启动数量不够;
(联动北方技术论坛 - Powered by Landingbj) [网际游航]3、JSL的端口和GWTDOMAIN端口相差太近(7800,7811),如果JSH配置较多(超过10个),将会导致GWTDOAMIN启动不了,建议修改二者中的一个;
(联动北方技术论坛 - Powered by Landingbj) [网际游航]4、访问量较大的服务s2001MARKINFO为短连接,建议修改;
(联动北方技术论坛 - Powered by Landingbj) [网际游航]5、怀疑通过WEBLOGIC访问JOLT的客户端没有关闭连接,导致连接不停的增长,比如tmadmin中pclt看到的部分内容:
(联动北方技术论坛 - Powered by Landingbj) [网际游航]SDCRM           User.497@7800   webuser          0:10:26 IDLE/W  0/0/0
(联动北方技术论坛 - Powered by Landingbj) [网际游航]SDCRM           User.498@7800   webuser          0:10:25 IDLE/W  0/0/0
(联动北方技术论坛 - Powered by Landingbj) [网际游航]如果此问题不解决,TUXEDO LICENSE不够和WEBLOGIC无法登陆的问题将仍然存在;

(联动北方技术论坛 - Powered by Landingbj) [网际游航]
日常维护建议:
(联动北方技术论坛 - Powered by Landingbj) [网际游航]1、观察中间件队列情况:利用脚本231:/crm/inter/run/bin/psr.sh;
(联动北方技术论坛 - Powered by Landingbj) [网际游航]2、查看服务执行效率报告:txrpt -d 07/21 -s 8:00 -e 16:00 <stderr|grep s2001MARKINFO报告文件名;建议stderr文件每日凌晨清空,否则将会很大;
(联动北方技术论坛 - Powered by Landingbj) [网际游航]txrpt -d 07/21 -s 14 -e 16 < stderr
(联动北方技术论坛 - Powered by Landingbj) [网际游航]txrpt -d 07/21 -s 8:00 -e 16:00 <stderr|grep s2001MARKINFO
(联动北方技术论坛 - Powered by Landingbj) [网际游航]我观察中发现,s2014CUSTINFO的调用量相当大,并发量每秒能达到20~30笔(下午4点左右),快赶上吉林移动1860的并发量了,此系统已经是一个实时性要求高,并发量大的OLTP系统了

(联动北方技术论坛 - Powered by Landingbj) [网际游航]

论坛徽章:
0
13 [报告]
发表于 2012-03-19 10:04 |只看该作者
通过观察发现,TUXEDO服务积压严重,表现在GWTDOMAIN服务,可以断定大部分业务压力来自前台营业系统通过DOMAIN访问我们的TUXEDO服务。


对UBBCONFIG文件做了以下调整:
1、MAXWSCLIENTS由845调整为2000(这个值最好大于LICENSE数量);
2、增大服务数量:
s2001MARKINFO  SRVGRP=USER_SDCRM SRVID=18001 MIN=8 MAX=15
               CLOPT="-A -r -o /crm/inter/run/log/s2001MARKINFO.log"
s2001MARKINFO2  SRVGRP=USER_SDCRM SRVID=19101 MIN=8 MAX=15
               CLOPT="-A -r -o /crm/inter/run/log/s2001MARKINFO2.log"
s2014CUSTINFO  SRVGRP=USER_SDCRM SRVID=18701 RESTART=Y MIN=20 MAX=20
               CLOPT="-A -r -o /crm/inter/run/log/s2014CUSTINFO.log"
JSL             SRVGRP=JSLGRP_SDCRM SRVID=8000 RESTART=Y GRACE=0 MAXGEN=10
               CLOPT= "-A -r -- -n //130.17.0.231:7800 -d /dev/tcp -m10 -M50 -x10"
WSL             SRVGRP=WSLGRP_SDCRM SRVID=8100 RESTART=Y MAXGEN=10
               CLOPT= "-A -r -- -n //130.17.0.231:7700  -d /dev/tcp -m15 -M50 -x10 -K both -c 10240"
3、所有服务增加-o参数:CLOPT="-A -r -o


存在主要的问题:
1、服务配置数量不合理:访问量很大的服务s2014CUSTINFO、2001MARKINFO、s2001MARKINFO2进程原来配置只启动了2个,导致业务积压;其他服务访问量都非常小,建议观察服务执行次数,调整所有服务合理的进程数量;
2、JSH/WSH启动数量不够;
3、JSL的端口和GWTDOMAIN端口相差太近(7800,7811),如果JSH配置较多(超过10个),将会导致GWTDOAMIN启动不了,建议修改二者中的一个;
4、访问量较大的服务s2001MARKINFO为短连接,建议修改;
5、怀疑通过WEBLOGIC访问JOLT的客户端没有关闭连接,导致连接不停的增长,比如tmadmin中pclt看到的部分内容:
SDCRM           User.497@7800   webuser          0:10:26 IDLE/W  0/0/0
SDCRM           User.498@7800   webuser          0:10:25 IDLE/W  0/0/0
如果此问题不解决,TUXEDO LICENSE不够和WEBLOGIC无法登陆的问题将仍然存在;


日常维护建议:
1、观察中间件队列情况:利用脚本231:/crm/inter/run/bin/psr.sh;
2、查看服务执行效率报告:txrpt -d 07/21 -s 8:00 -e 16:00 <stderr|grep s2001MARKINFO报告文件名;建议stderr文件每日凌晨清空,否则将会很大;
txrpt -d 07/21 -s 14 -e 16 < stderr
txrpt -d 07/21 -s 8:00 -e 16:00 <stderr|grep s2001MARKINFO
我观察中发现,s2014CUSTINFO的调用量相当大,并发量每秒能达到20~30笔(下午4点左右),快赶上吉林移动1860的并发量了,此系统已经是一个实时性要求高,并发量大的OLTP系统了

论坛徽章:
0
14 [报告]
发表于 2012-03-19 15:49 |只看该作者
通过观察发现,TUXEDO服务积压严重,表现在GWTDOMAIN服务,可以断定大部分业务压力来自前台营业系统通过DOMAIN访问我们的TUXEDO服务
对UBBCONFIG文件做了以下调整:
1、MAXWSCLIENTS由845调整为2000(这个值最好大于LICENSE数量);
2、增大服务数量:
s2001MARKINFO  SRVGRP=USER_SDCRM SRVID=18001 MIN=8 MAX=15
               CLOPT="-A -r -o /crm/inter/run/log/s2001MARKINFO.log"
s2001MARKINFO2  SRVGRP=USER_SDCRM SRVID=19101 MIN=8 MAX=15
               CLOPT="-A -r -o /crm/inter/run/log/s2001MARKINFO2.log"
s2014CUSTINFO  SRVGRP=USER_SDCRM SRVID=18701 RESTART=Y MIN=20 MAX=20
               CLOPT="-A -r -o /crm/inter/run/log/s2014CUSTINFO.log"
JSL             SRVGRP=JSLGRP_SDCRM SRVID=8000 RESTART=Y GRACE=0 MAXGEN=10
               CLOPT= "-A -r -- -n //130.17.0.231:7800 -d /dev/tcp -m10 -M50 -x10"
WSL             SRVGRP=WSLGRP_SDCRM SRVID=8100 RESTART=Y MAXGEN=10
               CLOPT= "-A -r -- -n //130.17.0.231:7700  -d /dev/tcp -m15 -M50 -x10 -K both -c 10240"
3、所有服务增加-o参数:CLOPT="-A -r -o
存在主要的问题:
1、服务配置数量不合理:访问量很大的服务s2014CUSTINFO、2001MARKINFO、s2001MARKINFO2进程原来配置只启动了2个,导致业务积压;其他服务访问量都非常小,建议观察服务执行次数,调整所有服务合理的进程数量;
2、JSH/WSH启动数量不够;
3、JSL的端口和GWTDOMAIN端口相差太近(7800,7811),如果JSH配置较多(超过10个),将会导致GWTDOAMIN启动不了,建议修改二者中的一个;
4、访问量较大的服务s2001MARKINFO为短连接,建议修改;
5、怀疑通过WEBLOGIC访问JOLT的客户端没有关闭连接,导致连接不停的增长,比如tmadmin中pclt看到的部分内容:
SDCRM           User.497@7800   webuser          0:10:26 IDLE/W  0/0/0
SDCRM           User.498@7800   webuser          0:10:25 IDLE/W  0/0/0
如果此问题不解决,TUXEDO LICENSE不够和WEBLOGIC无法登陆的问题将仍然存在;

论坛徽章:
0
15 [报告]
发表于 2012-03-19 20:55 |只看该作者
楼主的水平相当之高  去了跟着学习下都值得啊
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP