看完这个晒Power稳定运行天数的热帖,你还敢来盖楼吗?

-回复 -浏览
楼主 2018-06-26 10:06:41
举报 只看此人 收藏本贴 楼主

本文转自AIX专家俱乐部

我运维的服务器已经稳定运行1300多天了,你的呢?



一些系统管理员纷纷表示,1300天算什么?我有更长的稳定运行记录!更有人晒出了自己运维的秘诀。看来,系统管理员和他们的服务器绝对是一对感情深厚、坚守岗位的好搭档。

原帖看得出,他发贴时是有多么欢喜

sunshinebao 阳光保险系统运维工程师

系统管理员朋友们:我运维的服务器已经稳定运行1300多天了,你的呢?
AIX 系统管理员的最大职责是保障Power服务器稳定运行,看到Power稳定运行的天数持续增长,是 AIX系统管理员最开心的事儿。不用经常因为服务器宕机,半夜赶到公司处理故障以及加班、熬夜。我们系统上线差不多有四年了,而且是核心业务。有天我心血 来潮想看看家里Power 750究竟运行多少天了,一看,1300多天了,心中窃喜,哥们儿真给力。

大伙做运维的,都希望自己负责运维的小型机,能稳定运行,别出啥岔子。

借此,我想知道系统管理员们在运维Power的时候:

运维的小型机最长多久无故障,无宕机?

平时做哪些事情来保障Power系统稳定运行(比如用性能监控工具、每天巡检之类)?希望能给我们运维朋友们一些借鉴! 


跟帖却一个比一个厉害,楼主顿时有些小失落

Mr丶晓安 上海智能系统科技有限公司系统运维工程师
表示已运行2000多天

kcw294196204 系统工程师
1500多天

breenboy 某制造企业 系统运维工程师
我们已经稳定运行了2042天了!窃喜中

huibo 上海银行中心 系统工程师
我们的Power服务器都稳定运行了6年多了,至今还在服役。绝对是战斗机。


来看一个重量级的,估计楼主要献出膝盖了

黎绍永 某国企 系统工程师

9年多没重启的机器。



如何做到稳定运行?

看看大家分享的经验


硬件设计和质量要过关
wanggeng 宜宾市商业银行 系统运维工程师
最近听说,微软的Azure云宕机了,部分华东和华北用户在打开管理门户时出现问题。
相信每当听到这个消息的时候,最能引发关注或共鸣的就是系统管理员或运维人员。我不由自主的看了一下我的VIOS的uptime,结果显示1476days,心中窃喜一下。
作为开发测试环境是对系统稳定性要求不那么高的,但如果是生产系统,任何天灾人祸引起的系统故障或宕机都是事故,要向主管部门汇报。人祸相对好追责些,至于天灾嘛……要么是软件系统设计问题,要么是硬件的设计或质量问题。这点上,老实说对Power还是比较有信心的。不论System P本身的硬件设计还是AIX系统的稳定性,都比较过关。

搭建双活系统
arrnox 交通银行总行软件开发中心 系统架构师
同样P750服务器,依据IBM gdpc架构搭建的双活系统,从2012年12月上线至今未宕过机,还成功经历了多次双活切换演练,IBM P系列服务器和DB2 purescale还是很牢靠的

巡检要勤快
qb306 软件开发工程师
每日巡检,定期重启,是保障设备平稳运行的因素。

随时脑补,及时应对疑难杂症
LINE2008 北京北鹰吉成科技有限公司系统工程师
自己运维的服务器三年未停过机。顺便分享一下自己的经验,仅供参考。
时光飞逝,自己作为IT运维工程师已经有六七个年头了。下面分享一下自己的运维经验,如对大家有一定的帮助,吾心甚慰。一句IT届名言,痛入骨髓,“少壮不努力,长大搞IT”。然后自己就进入了这个行业。因为运维时的设备比较单一,就那几种机型,所以自己就经常看看这些红皮书。平日里,在系统没有什么变更或更换备件时就登录机器查看有没有什么指标不在合理范围内。如有不在就去查看引起这些问题的原因,比如看红皮书,toubleshooting,逛论坛等。这样慢慢自己的技术就有所提升,设备出现问题时就能第一时间解决,保证系统的稳定运行。


你超过这些记录了吗?


zd18681473394 蓝色曙光信心科技有限公司 系统运维工程师

1400天了


pomtch 北京交大科技有限公司 系统工程师

04:31PM   up 782 days,   4:07,  2 users,  load average: 10.92, 10.24, 10.36

看来我的服务器运行时间最短.


li6ye111 国电通 交互工程师

uptime  1000+


cnbj2046 4sea 技术支持

power 780 B mode,2012年8月至今。


zhonghanyuan 深圳市汇安科技 系统运维工程师

我维护的小机已经安全运行1000天!


Liu_mx 广州云宏 系统工程师

我的688天,貌似时间不长。


xifengke ZTE 系统工程师

IBM小机连续跑5年左右了,中间顶多是切换个HA什么的,还是很稳定的,能不能无故障连续运行这么久当然要看业务繁忙度和机房环境等。


徐东升 太极华青 数据库管理员

power570已经运行3年了,3年中没有一次停机。上面跑得还是Oracle10g


samsara 新晨科技 系统架构师

我做运维的时候最长是2年700多天


pomtch 北京交大科技 系统工程师

04:31PM   up 782 days,   4:07,  2 users,  load average: 10.92, 10.24, 10.36


ACDante, ZJSS 存储工程师

#uname -a

AIX  ********    1 6 00F77BD64C00

#uptime

03:44PM  up 499 days, 12:17,1  user,load average:1.07,1.12,1.16

499days


neilrule 系统运维工程师

我都不好意思晒了,我的193天,。O(∩_∩)O哈哈~


chenlii 移动 系统架构师

特意今天看看了,已经稳定运行1452天了。还是不错的,希望能继续稳定下去。


陈宇 招商银行深圳分行 系统架构师

uptime  1500+


whl系统工程师

不服?快去留言板晒一晒你的稳定运行天数




我要推荐
转发到