商流企业运维标准化实施思路及方案

  • 来源: IT专家网 2019-03-18/09:55 访问量:
  •  

    作者:银川新华百货东桥电器有限公司 信息技术总监 何雷

    商流企业对信息化建设的需求越来越高,投入的运维成本有限,保障终端门店信息系统安全平稳运行又是信息化建设重中之重,针对零售门店的运维软件繁多、网络运行情况复杂、PC端陈旧及收付款类型日渐增多等应用的现状,开发设计并实现通过微信小程序的智能运维系统,解决网站平台无法实时发送信息的弊端,避免因开发IOS系统及Android端APP二种开发方式及过大的成本开销。根据公司实际运维凸显的问题,设计使用微信小程序实时推送、接收信息、图片及文档的原理,或针对集中突出问题,编写图文并茂的文档按部门群发或逐一推至个人手机中,可大幅提升公司运维的工作效率,利用后台数据可同时统计运维效率及运维工作量,并且让运维及开发人员随时随地掌握各类异常运维信息。

    ㈠运维标准化

    信息运维工作是信息技术中心管理的核心和重点内容,也是内容最多、最繁杂的部分。为了保障公司贝图系统、金蝶系统及其他相关系统的安全稳定, 确保各级网络安全高效运行,达到公司PC软件及操作系统运行安全平稳的目标。通过运维的标准化,中心将采用相关的方法、手段、技术、制度、流程和文档等,对公司现有的运行环境(如软硬件、网络、系统、数据库等)、业务系统和运维人员进行的综合管理。

    标准化运维是信息技术中心管理的核心和重点部分,也是内容最多、最繁杂的部分,公司在不断发展壮大的过程中,业务系统也随之不断成熟和完善。标准化运维的方式方法在不断变化中适应日趋庞大复杂的业务系统,运维的标准化、自动化、已成为一种趋势和发展的方向。2018年信息技术中心面临人力资源配置与不断扩充的运维工作量的矛盾问题。急需提升个人效能,来解决不断扩充的运维工作量问题,通过三步完成此项工作:

    1.运维标准化管理:

    随着信息化业务系统和网络高可靠性需求的不断增长,对于突发事件缺乏智能判断,无法做出迅速响应,不仅效率偏低,而且消耗大量人力成本,这就是所谓“救火式”运维。信息技术中心在企业内部充当服务部门,而并非盈利部门,而我们如何在有限成本内完成标准化流程是我们所要探讨的。运维的流程化管理需要把握三个原则:

    1.1设立IT运维关键流程:引入优先处理原则,设立IT运维关键流程,引入优先处理原则就是要定义出IT运维的每个关键流程,不仅仅是定义流程是什么,还包括要指出每个关键流程对企业有什么影响和意义。

    1.2建立规范的事件跟踪流程:强化运维执行力度结合本公司IT系统的情况,建立故障和事件处理跟踪流程,利用维修平台等工具来记录故障及其处理情况,以建立运维日志,并定期回顾从中辨识和发现问题的线索和根源。

    1.3专业化及标准化流程:在运维工作中,就是故障处理、系统升级、上线、安全加固等问题,问题如何及时发现、处理、反馈,系统升级、上线如何自动平滑的进行,安全加固如何稳妥规范的进行,这些都需要一个标准,有了标准才会自动和衔接。同时随着IT运维管理工作的复杂度和难度的大大增加,仅靠过去几个“运维英雄”或“技术大拿”来包打天下已经行不通了,企业需要运用专业化、标准化和流程化的手段,来实现运维工作的自动化管理。IT运维人员必须在指定时间内完成流程所规定的环节与工作,以提高IT运维响应问题的效率。事后按时间阶段性对事故类型进行统计和分类,分析故障发生的频率,以提供日后运维重点和决策的依据。

    2. 规范运维的建立:

    2.1 工作维度细化

    固化现有运维流程,细化工作维度,运用不同运维报表及处理结果,分析各类故障及异常情况,为日后提供强有力的历史数据及解决方案,将运维报表按不同类型进行归类,并描述处理异常方式及方法,并共享处理方式及方法。三部门梳理工作维度,针对运维工作进行分类,将报修平台内容进行整理,制定报表,编写异常处理方式及应对方法。针对服务器故障,网络或病毒等原因影响造成大面积影响的,建立应急措施,并按分类制定报表并分享。

    2.2 综合布线标准化

    综合布线是针对公司各办公区及门店网络、监控及音响系统的线路铺设的统称,经过几年的磨合期,综合布线的规范及施工标准已经非常明确,但无流程,无制度及验收标准。按现执行方式执行过程中,仍然存在调整后不明确,调整后返工等情况,为尽量规避类似事件发生,将此部分列入中心正常运维工作。

    ①IT支持部负责网线、监控及音响等综合布线施工或监工,按现有工作流程进行梳理,将绘制弱电图纸,选择施工单位,确定实施方案,竣工验收签字,设备组装及调试等工作进行文字梳理,形成相应规范,并做到有图可查,有据可寻。确保综合布线符合消防检查要求,符合门店开业要求。

    ②网络安全部负责协调运营商申请链路,设计汇聚点及机柜位置,设计运营商链路,协调联营部申请ITV网络,开通网络并联调网络设备,分配IP地址,形成相应规范,并做到有图可查,有据可寻。确保运营商链路铺设符合消防检查要求,满足门店对网络要求。

    3. 运维监控及诊断标准化

    提高信息资源的运行管理水平,通过运维体系的建设,结合构建集中式的微信程序维护平台、运维流程、系统监控和综合展示系统,通过系统联动,及时、准确、全面反映与掌握信息系统的运行状态,保障各业务系统的正常运行,使信息中心人员具备更高的工作效率,提高业务技术能力和解决实际问题的能力。从而提升个人效能,满足日趋增长的各项业务。运维监控及诊断标准化实施思路分为设计原则,设计架构及期望达到的目标:

    ⑴ 原则

    信息技术中心运维平台作为信息中心未来运维工作的核心支撑系统,需要系统本身具有高可靠、易扩展、易维护等特点,并且在系统功能应用上要具备一定的技术先进性和实用性。所以,本次项目的方案设计遵循以下设计原则:

    1.1 先进实用

    平台需注重先进性和实用性的统一,以实用为目的,合理选用各类成熟、先进技术。在体系结构、功能算法等诸多方面都采用先进计算机技术和理论,应用功能体现实用性。

    1.2 高可靠性

    在系统结构、设计方案、设备选择、技术服务等方面综合考虑,保证系统能够7*24安全无故障运行,系统有很好的容错功能;对IT资源的监测应保证不影响相关设备和系统的正常良好运行,并实现最好的响应效率及最小的资源占用。

    1.3 可扩展、易集成

    系统需具备很好的扩展性,能适应不断发展的业务需求。随着IT资源种类和数量的扩大,系统也应能适应新的系统的对信息技术中心运维管理的需求。系统具备高度集成性,可以和各类第三方产品进行集成,进行功能扩展。系统提供开发工具和接口,方便其他监控系统集成和统一管理。

    ⑵ 架构

    依据对信息技术中心运维管理体系的建设经验,我提出三位一体综合运维管理平台框架图如下:

    运维管理平台包括:“集中监控诊断、信息技术中心运维流程服务、统一运维展示平台”三个部分。底层基础平台主要实现对底层数据的采集、存储、分析等工作,为上层监控及流程系统提供基础数据;运行集中监控主要完成对基础设施故障、性能、配置等方面的全面监控管理,实现主动式的IT管理;运维流程服务主要根据中心业务梳理出了问题管理、关键流程管理、标准化运维管理等运维流程,实现对日常运维工作的流程化、规划范管理,提升信息技术中心服务的质量。

    2.1 以信息中心运行监控为“基础”

    这部分的功能主要是被监控运行的状态以及其配置资产信息进行统一监控、管理、分析,实现对各种故障和性能异常的及时报警,对系统运行性能进行实时监控,对系统运行的各种状态信息进行汇总、分析以及预测。除了实现网络告警、性能、配置几大基本功能以外,还应从运维的角度提供丰富的数据综合分析和运维工具,例如综合报表、综合监控、信息点管理等。

    2.2 以信息中心服务管理为“导向”

    这部分功能主要依据三位一体的架构进行建设,为信息系统的维护服务提供电子化的控制手段。运用系统通过不同模块进行配置完成问题管理、关键流程管理等功能,为维护人员提供以流程为基础的服务管理方式,规范管理模式,达到快速消除系统故障、解决潜在问题,减少不规范的系统变更引发的系统故障率和故障隐患等目的,实现对IT系统的主动式服务,提高服务水平。

    2.3 以统一运维平台为“体现”

    即是整个系统的对外界面,通过统一的权限管理和统一风格的B/S展现,为系统的操作使用人员提供统一的系统接口,做到一点接入,通观全局,能够以灵活的组织数据的展现方式,定义用户、角色、组织机构,并为每个不同角色提供不同的功能模块,为每个用户分配不同的展现内容,方便用户进行企业整体的运行维护管理。

    ⑶ 目标:

    1.1 强化主动监控,实现集中管理:

    以IT资源可用性监控为主线,构建统一集成的IT资源及应用服务监控平台,能够主动、及时地发现问题,并调度资源解决问题,形成IT运维管理主动服务的新局面。

    1.2 帮助定位故障,快速恢复系统运行:

    建立集中的告警分析及展现平台,提供灵活、自动化的事件处理能力。当故障产生时,可以进行故障的快速定位,发现故障原因,调度资源快速恢复系统服务,从而缩短故障解决时间,降低维护成本,提高系统整体可用性。

    1.3 规范运行管理,有序开展维护:

    对运维管理工作进行优化,对服务管理进行改善,将管理数据电子化,管理过程规范化。根据相关制度进行运行维护管理,对内完善流程,对外提高服务,加强管理,使流程更规范更合理,使技术人员具备更高的工作效率,提高业务技术能力和解决实际问题的能力。

    1.4 共享运维经验,完善知识库:

    把运维过程中产生的丰富经验进行积累和总结,形成有效的知识库,建立知识的共享机制,提供信息共享和交流的平台,提高运维人员的工作效率。

    以上目的是为了将各种类型的监控对象进行统一集中监控,并将其格式统一规范,并对其有效处理、分析,以直观的界面展现,直接提高运维人员能效水平,缓解因人均效能产生的日趋增长的内部矛盾。

    一、深化运维标准化

    19年将继续巩固今年工作成果,根据制度加强管理,对内完善流程,对外提高服务,使流程更规范更合理,严格执行流程节点,降低运维成本,使技术人员具备更高的工作效率,提高业务技术能力和解决实际问题的能力。出台应用程序维护及测试管理规范,形成有效的知识库,建立知识的共享机制,提供信息共享和交流的平台,全面提升系统整体可用性。以上目的是为了将各种类型的监控对象进行统一集中监控,将其格式统一规范,有效处理、分析,以直观的界面展现,直接提高中心人员能效水平,进一步提高应用开发成员开发效率,缓解因人均效能产生的日趋增长的内部矛盾。

    一、深化运维管理

    ㈠进一步完善制度及流程

    中心18年经过3至4个月同心协力建设完成了《综合布线管理办法》、《网络链路管理办法》、《门店巡检管理制度》、《视频会议系统》制度,修订《机房管理制度》和《机房应急预案》制度。其中《网络链路管理办法》、《门店巡检管理制度》和《机房应急预案》是新编写的制度及流程,各流程执行过程中存在部分执行难度大、节点问题多或流程不通等现象,需进一步加强中心部门执行能力并修订制度及完善流程。同时巩固现有运维流程及制度,加强制度管理并保障自主运维的机制。今年仍需要持续强化制度,进一步将流程执行到位,将运维业务做细做实,持续深化信息中心服务,为企业支撑起到作用。

    ㈡建设运维管理标准

    以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以闭环管理为提升途径,体现对运维服务全过程的体系化管理。

    1. 运维管理标准编制目的

    为了立足根本促发展,开拓运维新局面,保障运维管理更加高效、服务更加便捷。在公司战略调整时期,利用手机微信小程序,通过网络、桌面、系统等运维,促进公司信息技术支撑及稳定可持续性发展。运维管理制度适用信息技术中心全体人员,目的是为了加强运维管理举措,提升运维管理效率,量化运维难度及数量,制定符合公司实际情况 运维执行标准。

    2 运维管理标准建设方案

    基于中心存在的三个问题进行建设运维管理标准化:一是如何搭建有效的故障收集渠道?二是我们的标准服务操作流程是什么?三是如何搭建完善的服务技术平台?

    2.1 智能运维小程序

    2.1.1解决凸显问题

    现有IT运维平台无法满足三部门收集承载各类数据,无法满足因快速迭代改变的用户操作使用习惯,无法满足随着移动收银业务日益增长的快速脚步。急需搭建一个便于用户发布信息,可实现快速交互功能的前端。构建一个利用运维共享知识库模块,分类处理各类需求及故障,形成可分析数据源的后端,使用运维小程序工具,构建业务部门与信息技术中心互动的平台。通过智能小程序解决以下问题:

    ①解决用户发生请求后不知选择报修类型、不知选择谁的囧状;

    ②建立严格的服务流程解决各种报修故障,确保第一时间响应故障;

    ③通过用户互动针对服务流程进行有效监督,保障运维质量和效率;

    2.1.2 提升主动运维便捷性

    目前中心虽然形成运维标准化的机制,但核心机房运维工作的呈现、超融合下各服务器及应用程序的监控及维护仍使用EXCEL表单汇总来完成,各服务器系统、网络及应用程序之间关联的隐患问题无法呈现,现在日巡检的工作时长超过30分钟,无法满足日常标准化要求。实体服务器主动运维仍未涉及,需进一步通过开发智能运维小程序来辅助完成,提升主动运维效率。3. 建设需求反馈机制

    2.1.3 汇总分析需求并提报

    使用智能运维小程序需求反馈功能,可以收集公司所有用户对信息化建设的不同意见,凡是通过网络、计算机及运用应用程序促进公司各项业务发展,对公司信息化建设有想法的用户都可以通过此模块发声,我们挑选出大家共同提出的需求问题或具有建设性意见的需求,通过整理编写需求,以文档形式描述出开发利弊、开发难易程度、开发周期及开发费用向公司经营班子汇报或由蔡总通过月度经营分析会上汇报,并由各高管进行讨论确定是否成立需求项目。

    2.1.4 开发需求项目管理

    ①利用开源的项目管理软件,将公司不同需求进行分类,应用程序、报表、小程序等,并且将项目开发团队与测试者分开,结合两者分立,互相配合又相互制约的特点,通过需求、任务、BUG进行互动,最终完成需求项目建设。

    ②使用项目管理软件,专人专项将中心的开发进度、开发情况、需求文档编写等关键要素进行管理并录入至服务器中。需求提报部门根据相关网站一目了然查看开发状态及进度。

    ③实时推送研发进度至各需求提报部门。利用运维小程序的功能,专人专项完成需求开发,同时将开发过程涉及的任务、出现的BUG再次列入计划,并推送至各部门,实时反馈开发进度及报表需求。

    通过以上举措将开发人员工作量及难易程度开放给各位同事,撕去朦胧的面纱,建设更加开放包容的信息技术中心平台,为后期公司战略规划做储备。

    2.1.5应用程序内训

    随着外部环境信息技术的不断迭代升级,公司各业务系统持续更新升级,并且各部门成员的调整,原有老带新培训模式导致新员工很难适应现有的各业务系统,贝图系统庞大而复杂的设计初衷及逻辑更是让人很难理解。贝图系统是根据业务系统变化而调整的ERP进销存系统及相关业务系统,随着业务持续变化发展至今,系统调整时刻面临着“牵一发而动全身”状况。信息中心推广的频次很难满足业务快速发展的需求。19年贝图系统将全面革新,新系统是基于WEB前端+Spring Cloud后端开发完成。系统革新面临的将是公司使用者习惯的挑战及快速应用。下半年将全面展开新版本贝图程序测试培训工作,并建立长期微信小程序及视频系统构建长期系统内训的机制。

    2.1.6 建立知识库平台

    各部门运维工作积累了大量丰富经验,但都仅限于个人业务专长,工作讨论时分享经验,信息分享不充分,处理效率不高。当故障产生时,可以进行故障的快速定位,发现故障原因,调度资源快速恢复系统服务,从而缩短故障解决时间,降低维护成本,提高系统整体可用性。今年通过建立集中的告警分析及展现平台,提供灵活自动的搜索引擎分析能力。使用运维小程序获取报修类型数据源,结合帆软大数据分析平台,分析各类报修类型,针对反映较集中、较突出问题或特定普遍反映的问题,进行总结,并制定相关解决方案,编写图文并茂的文档推送至相关用户微信中,第一时间获取解决办法。

    2.2 大屏呈现网络、监控、运维数据

    2.2.1 利用公司已报废电视,将智能运维小程序收集报修类型数据源予以展现,并呈现出每人每天工作量及完成情况,倒逼个人提升工作效率;

    2.2.2利用监控系统融合技术,分屏呈现公司各门店款台、库房及机房的监控连接,实时监控门店款台操作、库房运行情况及网络运行情况。第一时间获取门店监控系统成像清晰度及各类异常状况,避免因设备老化、黑客入侵等导致监控出现录像丢失等现象。

    2.2.3 运用应用负载设备,将公司网络整体运行情况展示出来,实时查看链路负载运行情况及链路调度及故障迁移状况,随时检查网络波动及公司网络整体运行情况。

    此项工作目的是为提升大家对各自负责工作进一步延伸,加强各类管理业务的深度及敏感度。出现问题,快速反应、快速解决。

    4. 运维标准化建设最终目标

    企业的运维发展由起步到成熟,大致要经过三个大阶段:运维无序化、运维标准化和流程化、运维自动化。

    运维无序化:主要表现在运维工作无规范统一,更多是团队成员依赖自身技术各自为战,着重于眼前运维工作,过多处于被迫接受和疲惫应付工作的状态。运维无序阶段提升工作效率主要依赖加人和加班,而且此阶段运维工作效率低下,人为失误较多,故障排除难度较大。长时间的运维无序化,对内团队成员极度疲惫和不自信,对外主要表现为不再被各业务部门和其他IT兄弟团队所信任。一般创业初期的IT运维处于无序化较多,如何解决结束无序化的苦恼,解放生产力呢?答案更多被提及的是运维自动化。然而运维自动化平台,如何结合公司自身条件进行落地实现呢?答案很多,有购买商业产品(价格真的不便宜),有自主研发,结合自动运维书中了解,加上近5年的时间我推行运维自动化的实际经验告诉大家,不管哪种方式,运维标准化和流程化一定是首先要做的,否则运维自动化只能是空中楼阁,欲求不得。

    运维标准化和流程化:如果非要给出定义的话,那么我的定义是两个字:文档。运维的标准化和流程化首先要以文档的形式进行展示,并且能够指导日常运维工作。国有国法,家有家规,冰箱洗衣机都有说明书,运维标准化流程化就是运维工作的国法家规,运维工作如何进行的说明书。相比开发、测试等其他岗位,运维工作直面生产环境,每一步运维操作与生产系统能否正常运行息息相关,稍有不慎就易产生事故。并且运维自动化的落地实施也是要基于运维的标准化和流程化,所以作为运维管理的第一步,不可忽略。标准化和流程化的建设思路一般是包括三大部分:日常工作梳理、标准化和流程化制定、日常工作标准化和流程化执行。而我们今年需要建设完成的就是日常工作标准化和流程化的制定与执行。我们需要坚实的向着运维自动化前进,同时我们要完成更加开放、包容的共享信息化平台,满足企业快速发展脚步。

    ---------------------------------------------------------

    免责声明:

    1.本文援引自互联网,旨在传递更多网络信息,仅代表作者本人观点,与本网站无关。

    2.本文仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。


    赞(0)

    驱动号 更多