免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: chenyx
打印 上一主题 下一主题

linux系统TroubleShooting经验共享 活动结束 获奖名单公布 [复制链接]

论坛徽章:
6
金牛座
日期:2013-10-08 10:19:10技术图书徽章
日期:2013-10-14 16:24:09CU十二周年纪念徽章
日期:2013-10-24 15:41:34狮子座
日期:2013-11-24 19:26:19未羊
日期:2014-01-23 15:50:002015年亚洲杯之阿联酋
日期:2015-05-09 14:36:15
51 [报告]
发表于 2011-12-30 15:13 |只看该作者
本帖最后由 瀚海书香 于 2011-12-30 15:55 编辑

3.系统排错应该养成的习惯
写完了上一个才发现,这两个问题应该可以合并为一个。
有了原则,那么按照原则办事,慢慢的就成了习惯了

论坛徽章:
6
金牛座
日期:2013-10-08 10:19:10技术图书徽章
日期:2013-10-14 16:24:09CU十二周年纪念徽章
日期:2013-10-24 15:41:34狮子座
日期:2013-11-24 19:26:19未羊
日期:2014-01-23 15:50:002015年亚洲杯之阿联酋
日期:2015-05-09 14:36:15
52 [报告]
发表于 2011-12-30 15:14 |只看该作者
本帖最后由 瀚海书香 于 2011-12-30 16:10 编辑

4.实际案例分享
2年前的时候,那时候还是一只菜鸟。有一台服务器的规格设计是支持40万并发连接(这在现在看来太简单了 )。当时在实验室环境中测试通过,然后到用户那测试。结果上午的时候没问题,一到中午流量大的时候就出现了系统反应慢的问题。
当时我就被派去到现场调试,大家都知道机房的环境跟开发环境是没法比的,那个噪音啊。。。;到那后,也不知道怎么调试,于是就是简单的看看参数,抓抓包,修改一下策略,连续在那边调了3天后,没有发现一点问题的原因,开始急躁了
于是只能没病乱投医,就跟公司申请,给服务器加CPU,加内存,结果还是没有解决问题,就这样又过了2天。。。
最后大家应该猜到了,当时的老大亲自过去了。老大的排错方法跟我完全不一样, 把研发的设备和调试工具全部带到机房,然后开始从策略、性能各个方面测试,测试后发现自由操作系统和软件应该没有问题,于是开始排错网卡,结果最后问题发现了,是intel网卡在处理大包的一个bug。

想想自己刚开始测试的时候,就有一个定式思维,问题一定是我们操作系统或者软件的问题,习惯性的认为intel的网卡不会有bug。。。

所以排错最重要的就是,去掉定式思维,淡定的心态

评分

参与人数 1可用积分 +6 收起 理由
chenyx + 6 赞一个!

查看全部评分

论坛徽章:
6
金牛座
日期:2013-10-08 10:19:10技术图书徽章
日期:2013-10-14 16:24:09CU十二周年纪念徽章
日期:2013-10-24 15:41:34狮子座
日期:2013-11-24 19:26:19未羊
日期:2014-01-23 15:50:002015年亚洲杯之阿联酋
日期:2015-05-09 14:36:15
53 [报告]
发表于 2011-12-30 15:44 |只看该作者
回复 41# 小版主杀手
其实真正适合做这个行业的是linux系统研发的架构师
   

论坛徽章:
6
金牛座
日期:2013-10-08 10:19:10技术图书徽章
日期:2013-10-14 16:24:09CU十二周年纪念徽章
日期:2013-10-24 15:41:34狮子座
日期:2013-11-24 19:26:19未羊
日期:2014-01-23 15:50:002015年亚洲杯之阿联酋
日期:2015-05-09 14:36:15
54 [报告]
发表于 2011-12-30 16:18 |只看该作者
回复 11# yuhongchun
在机房改root密码时也应该如此,改了复杂的root密码后,应该进另一终端进行验证,确认无语后再离开机房,不要发生忘记root密码的杯具事件哈。

为了安全,不建议使用root账号。最后是使用一个跟root权限相同的非root账号。

   

论坛徽章:
381
CU十二周年纪念徽章
日期:2014-01-04 22:46:58CU大牛徽章
日期:2013-03-13 15:32:35CU大牛徽章
日期:2013-03-13 15:38:15CU大牛徽章
日期:2013-03-13 15:38:52CU大牛徽章
日期:2013-03-14 14:08:55CU大牛徽章
日期:2013-04-17 11:17:19CU大牛徽章
日期:2013-04-17 11:17:32CU大牛徽章
日期:2013-04-17 11:17:37CU大牛徽章
日期:2013-04-17 11:17:42CU大牛徽章
日期:2013-04-17 11:17:47CU大牛徽章
日期:2013-04-17 11:17:52CU大牛徽章
日期:2013-04-17 11:17:56
55 [报告]
发表于 2011-12-30 17:07 |只看该作者
瀚海书香 发表于 2011-12-30 15:14
4.实际案例分享
2年前的时候,那时候还是一只菜鸟。有一台服务器的规格设计是支持40万并发连接(这在现在看 ...



网卡的问题我也遇到过,做一个nat的服务器,结果,流量一大网卡就挂了.后来换个Intel的才解决

论坛徽章:
0
56 [报告]
发表于 2011-12-30 19:28 |只看该作者

论坛徽章:
6
金牛座
日期:2013-10-08 10:19:10技术图书徽章
日期:2013-10-14 16:24:09CU十二周年纪念徽章
日期:2013-10-24 15:41:34狮子座
日期:2013-11-24 19:26:19未羊
日期:2014-01-23 15:50:002015年亚洲杯之阿联酋
日期:2015-05-09 14:36:15
57 [报告]
发表于 2011-12-31 08:05 |只看该作者
回复 18# xinglu1983
的确是这样的。很多时候一些基本的问题搞php的还是需要懂的。这有利于系统整体的架构和数据库设计的工作。
如果搞php的只是了解php,对自己的工作平台(linux)不熟悉,你很难相信他会实现出一个高效的代码出来。。。

   

论坛徽章:
0
58 [报告]
发表于 2012-01-01 23:38 |只看该作者
本帖最后由 GangLin_Lan 于 2012-01-01 23:42 编辑

某开发环境,一个程序执行的特别慢,查看IO、负载,CPU使用率、内存使用率都很低,用sar -P ALL查看发现某颗CPU使用率100%,判断此程序为单线程执行,某颗CPU使用率已经100%了,导致IO等待CPU;由于程序计算主要是整数运算,所以程序执行在AMD服务器上速度特别慢,AMDCPU善于浮点运算,Interl CPU善于整数运算,经过测试,在intel及AMDCPU服务器上跑相同程序,时间差3倍。

论坛徽章:
0
59 [报告]
发表于 2012-01-02 09:40 |只看该作者
回复 55# chenyx



  dell 服务器自带的网卡问题那叫一个多,这样的事情吃亏好几次,最后默认不使用dell服务器自带的网卡,直接上inter网卡

   

论坛徽章:
0
60 [报告]
发表于 2012-01-02 09:41 |只看该作者
瀚海书香 发表于 2011-12-30 16:18
回复 11# yuhongchun

为了安全,不建议使用root账号。最后是使用一个跟root权限相同的非root账号。



   使用sudo


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP