IDC机房工作总结
总结是在某一特定时间段对学习和工作生活或其完成情况,包括取得的成绩、存在的问题及得到的经验和教训加以回顾和分析的书面材料,通过它可以正确认识以往学习和工作中的优缺点,让我们一起认真地写一份总结吧。你所见过的总结应该是什么样的?下面是小编帮大家整理的IDC机房工作总结,仅供参考,欢迎大家阅读。
今年来,在公司各级领导及同事们的关心帮助下,数据中心坚持以企业精神塑造自我,以企业文化完善自我,以企业标准提高自我,以企业纪律约束自我,认真扎实地完成了本职作和上级赋予的各项任务,基本实现了技术立足自我、故障及时排除的工作目标。公司数字有线电视、宽带数据和固话三网核心业务系统和设备的维护工作在数据中心,数据中心要保持稳定的运行,需要的专业技术人员。一般承担重要业务的数据中心都是有人24小时值守,完全无人管理维护的数据中心几乎没有。所以数据中心日常维护工作烦琐,但又很重要。随着人们的工作生活对数据的完全依赖,承载数据计算、运行的数据中心正发挥着越来越重要的作用,这更突显出维护工作的重要。数据中心的维护工作可分为五大类:一是日常业务类、
二是日常检查类、三是应用变更、部署类;四是软、硬件升级类;五是突发故障处理类。下面就这五个方面的维护工作进行总结。
一、主要日常业务类工作
1、公司的宽带固话业务开通的流程是:营业厅受理-数据中心开通-片区维护员上门安装。由此可以看出,所有用户端onu业务是由数据中心开通,这就要求数据中心所有技术员都必须熟悉华为和烽火olt网管系统,仔细认真的开通onu,并配合片区维护员解决用户端故障;
2、vod点播系统片源编码上载,今年累计更新电影和电视剧共630集;
3、根据卫星电视节目调整和变更调整,调整卫星接收机的参数,尽快恢复有线电视节目;
经常联系和沟通兵团电视台、开发区电视台、石油电视台技术人员,保证互传电视节目的调整、变更和恢复尽快进行;目前给我公司共有158套电视节目;
二、日常监控检查类工作“千里之堤,溃于蚁穴”
任何的故障在出现之前都可能会有所表现,小的隐患不消除,可能导致重大的故障出现,所以数据中心日常的例行检查工作枯燥,但也很重要,可以及时发现一些运行中的隐患。
根据数据中心承载业务重要性的'不同,要对数据中心里的所有运行的设备进行例行检查。一些数据中心设备厂商提供了检查软件,比如网管软件,安全防护软件等。可以利用这些软件对数据中心网络进行检查,看日志是否有异常告警,网络是否出现过短时中断等。通过网络探测软件看网
络质量如何。检查服务器应用服务是否正常,cpu内存等利用率是否正常。这些检查每日都要重复检查,一旦有异常及时处理与消除。对数据中心的机房环境也要进行检查,环境的温度、湿度、灰尘是否合乎要求。空调、供电系统进行运行良好,设备运行是否过热,地板、消防、监控都是检查的部分。不合理的地方要及时进行整改。一个小故障可能因为不熟悉导致大故障,因此日常检查绝不能应付,虽然需要不断重复,在持续的检查过程中,将会对数据中心的理解越来越深,这样每次检查都会有新的发现,在检查中进行学习。
三、应用变更类工作
数据中心承载的业务不会是一成不变的,随着业务的多样化,经常要对业务进行调整,包括服务器和网络的设置。因此要对服务器和网络设备操作很熟悉,主要需要掌握服务器命令和网络协议。要根据应用的需要,做出变更。这时就对维护人员提出了更高的要求,不仅是对数据中心原有业务要非常熟悉,还要对新上的应用业务有正确的理解,这样才能在不影响原有业务的基础上做调整。这样的应用变更每个月可能都要做几次,是数据中心维护人员的必修课,突显了一个技术人员的基本技能水平。这时要对设备操作命令比较熟悉,懂得如何实现业务,要经常和设备厂商的技术人员打交道,通过交流尽快掌握设备操作方法。同时,由于设备厂商对应用业务缺乏了解,这就需要维护人员在应用业务和设备具体实现之间做好协调,处理。以最快的时间和最小的代价完成应用业务部署。如,去年公司只有联通宽带固话业务,新增加铁通和电信的宽带和固话业务,需要数据中心技术员联系厂家技术员如何对用户端onu升级才能开通业务,并教会片区维护员。随着用户增多,原有的数据网络规划已不能公司未来业务发展和网络安全需求,因此,今年公司请代维公司对公司数据网进行重新规划,核心网络合理化,安全性提高,实现每用户每vlan,符合未来业务发展和网络安全需求。
四、软硬件升级类工作数据中心的设备一般运行周期是五年
不断地有设备需要逐渐淘汰进行更换,如机房原有一台08年采购的空调已老化,不制冷,必须淘汰,今年7月采购一台机房专用精密空调机房未来5年发展的需要;一些08年采购卫星接收机不开机或无法锁定接收参数,更换为备用的接收机。也有一些设备因为存在软件缺陷需要升级,因此软硬件升级也是维护工作的一部分,尤其是软硬件出现故障时,就必须要进行更换。有时为了不影响业务,往往还需要设备厂商提供软件补丁来解决问题。如vod点播系统、烽火olt网管系统等今年都进行过升级,数据中心的设备很多,出现软硬件故障很正常,所以要不断地进行软硬件升级,这类工作往往都要在业务量最少的凌晨之后进行,维护人员通宵熬夜是常有的事。如今年核心设备更换调整、数据网扩容升级都是在深夜进行。
五、突发故障类工作
没有任何一个数据中心是不出故障的,在数据中心运行的过程中都会出现这样那样的问题。这时就显示出维护人员的高技能水平,维护人员的水平高低往往决定了一个数据中心运行的稳定程度。对于突发故障,高水平的维护人员可以静下心来冷静分析故障的触发原因,迅速找到解决的方法,如联通今年两次dns无法访问故障、一次千兆网变成百兆网故障,由数据中心技术员及时沟通联通数据中心,判断故障并解决故障;今年上半年十二师师部市电多次停电,需要联系十二师师部电工和电力局客服了解情况,情况不明就根据ups电池电量判断是否开启发电机发电,并按照应急突发流程汇报给领导。为保证核心网络设备硬件突发故障快速处理,公司专门为这些设备购买硬件维保,维保公司可以快速提供备机和备件更换。总的来说,这些工作看起来有些平常,其他部门看不到或不了解,但千万别小看它们。数据中心维护工作实际上非常重要,关乎着整个公司三网业务的正常运行。
文档为doc格式