「互联网+」下的城商行智慧运维白皮书

-回复 -浏览
楼主 2020-11-20 15:29:03
举报 只看此人 收藏本贴 楼主
 


城市商业银行是中国银行业的重要组成,20世纪90年代中期,中央以城市信用社为基础,组建而成。当时的业务定位是:为中小企业提供金融支持,为地方经济搭桥铺路。目前各地城市商业银行蓬勃发展,其队伍成员已壮大到130多家。 


总体来看城市商业银行由于其地域限制,其资产规模总体不大,服务网点一般局限于各地方,IT 方面的投入相对少于国有和外资的商业银行。但麻雀虽小,五脏俱全,商业银行的业务系统也发展的较为完善。


互联网金融的改变


互联网金融依托网络支付、云计算、社交网络、搜索引擎等互联网工具,实现了资金融通、支付、授信等金融业务。互联网金融颠覆和重构了传统金融体系和商业模式。城商行的应用环境日趋复杂,有私有云、公有云,还有传统的系统环境,这对银行的架构管理与运维管理都提出了新的挑战。



国家政策导向


「十三五」期间,国务院关于积极推进「互联网+」行动的指导意见中提出:要构建银行业互联网金融生态,积极推进核心应用体系改造升级,助推银行业务转型升级。为此银监会在《中国银行业信息科技十三五指导意见》中要求:持续推进生产运维监控精细化、自动化、智能化建设,强化系统风险和故障的早预警、早定位和早处置。实现应用层面交易全流程、全节点监控全覆盖,结合应用系统交易特性及相关数据的分析对比,提升交易过程监控的智能化水平。


强化容量管理,做好相关资源的动态规划,预防非计划性、突发性的容量瓶颈问题发生。强化运维、开发、安全、风险管理的信息共享和一体化协作,提升多方联动能力。加强运维大数据分析,利用运维大数据加强业务风险防控,探索利用运维大数据推动业务流程优化并支持业务创新。


IT 运维管理需求


核心业务系统监控


在逻辑上,银行的生产系统本质上划分为两个基础部分,一块是大家熟知的核心业务系统(core-banking),主要包括客户信息管理、存款、贷款、支付结算、银行卡的日间操作等。凡一切关于存款、贷款账户的业务操作都是在核心业务系统中完成的。


另一个就是各种特色业务和中间业务,这部分往往称为合前置或者大前置。顾名思义前置是放在后台主机前面做一些预处理或一些主机不好做、不适合做的事情;前置大多是分散的,比如 ATMP,POSP,证券等等,这些中间业务可能都是各自一套,由不同厂商开发,不同程序语言,不同平台,后来逐渐整合到一起,成为综合前置:采用有一个体系架构,一种开发语言,甚至一个系统。


在架构上,前置系统往往是核心业务系统、特色业务等等银行生产系统的统一接入平台,柜面、电子银行、自助设备都是通过前置系统统一接入到后台,所以前置系统实际就像银行生产系统体系的一个统一发布界面,好似一个单位的门房传达室的门卫一样。


可列举通俗例子如;核心业务与前置业务的关系好比是火车头和车厢的关系:核心业务稳定,好比火车头的高效、高动力、稳定运行;前置变化多端,好比火车有餐车、货箱等多样化的组合为核心业务添砖加瓦。


而随着银行「互联网+」的不断深入,推陈出新的创新业务,所需要维护的业务系统越来越多。而数据中心的人员有限,除重点保障的系统外,其他系统健康度、临界状态,无法及时获知。就只能如同打田鼠一般出现问题再解决,这大大降低了客户的服务体验。



业务路径难以理清


业务系统往往结构复杂、节点繁多,各节点相互依赖,多点分布。一个环节上的问题往往由其它因素造成,没有完整的业务路径展示和分析图,管理人员无法准确判断问题原因,难以定位故障位置。


由于业务系统的复杂性,往往涉及到终端用户访问、第三方应用系统访问、网络数据传输、主机设备配置、业务系统性能、数据库关键指标、外联系统响应时间等,其中任何一个环节出现问题都会影响到整个业务系统服务质量下降。


为了解决业务系统故障,提高业务系统性能,管理人员需要花费大量的时间进行故障分析和排查,效率低下,很多偶发性问题往往由于找不到原因而无法解决。



业务洞察


随移动互联网发展,大众消费模式的悄然发生转变。银行需要面对春运、双十一等“秒杀”类交易洪流,对于 IT 基础架构的承载能力带来空前冲击。为了应对各种交易高峰的冲击,如何通过分析业务系统的性能指标(比如服务器的 CPU 利用率、内存利用率、磁盘利用率以及网络带宽)变化趋势,以及数据库指标、中间件指标等进行综合对比分析,找出其中的业务处理瓶颈与增长规律和趋势。



分支机构网络设备及链路监控


核心业务系统部署在总部,在地市会有较多的支行和营业网点,业务数据通讯通过 IP 网路来进行的。总行和分支机构之间一般会采用以太网透传、2M 专线、以太网专线来解决业务数据网络传输,各类链路故障的判断和实时的告警是管理的重点。另外部分 ATM 机的通讯广泛采用 CDMA/GPRS/3G 等相关技术,ATM 机的工作状态也是直接影响银行的用户口碑。


整体解决方案


全方位监控管理


对网络设备、服务器主机、存储设备、虚拟化、数据库、中间件等 IT 基础设施的主动式监控管理,同时从点到面集中 7×24 小时的管理整个 IT 系统,并且监控管理应具备很强的可扩展能力,方便进行功能扩展和规模扩展系统的易用性强,方便管理人员进行日常运维工作,有效减轻运维压力。


动态掌握 IT 资源


以往的数据中心管理中都是系统指标超过基线才开始打报告申请系统的扩容等工作,这样的模式难以发现系统短时间、间歇性、爆发性隐患,所以需要通过技术手段实时了解 IT 资源的使用情况。运维人员结合实时指标数据与基线进行比较,及时发现时点性业务响应瓶颈。根据需要从整体角度考虑资源的配置、调剂和使用,提高资源的有效利用率。


核心业务系统(core-banking)的基础架构监控


核心生产系统是商业银行最终要的生产系统,关系全行是否能正常开展银行的业务,其运行情况一直都是用户关心的重点。核心系统一个商业银行只有一套,技术架构一般采用小型机集群 + 数据库集群 + SAN 存储区域网的架构,常见的小型机型号以 IBM P5/6 系列 RS6000 系列为主、数据库以 OracleRAC、DB2 较为常见。一般来说市面上有一定技术基础的监控产品即可满足需求。 


前置系统的基础架构监控


由于像电话银行、网上银行、网上支付等这些银行常见应用都是通过其业务前置系统实现的,这些前置系统数量较多,支撑银行的其他非核心业务系统,这些系统一般有自己的数据库记录其业务数据,通过 Tuexdo、Cics 系统、Tongeasy 等交易中间件实现和银行核心业务系统的交互,同时有的前置系统通过 MQ、FMQ、Tonglink 等通讯中间件实现与人民银行的消息传输,包括上报其金融数据、转移支付等功能。


前置系统一般由 IA(Intel Architec-ture) 架构服务器组成,少数商业银行会采用小型机。操作系统一般为 Windows、linux 系统居多,根据其前置业务系统的重要程度,用户会决定是否采用双机模式。数据库一般为通用的关系性数据库。Oracle、DB2、Sybase、MSSQL 较为常见。同时该前置服务器会安装跟前置系统相关的业务支撑软件。


对于提供网上银行的用户,各类 J2EE 应用服务器较为常见,如 Weblogic、Websphere 等。一般来说具有多年积累的运维监控产品的监控指标才可满足需求。


业务服务视角


业务所依托的 IT 基础架构是确保业务持续性的关键,业务基础架构监控可采用图形化的建模方式,完整实现 IT 基础设施与其支持的业务服务之间的动态映射。


此部分需要寻找有一定技术实力的产品,图像化的定义业务服务的 IT 基础架构,直观展现业务系统之间的关联关系,并把业务服务关联的 IT 资源、影响的范围定义到视图中,有故障产生的时候,使用系统来追溯问题的根本故障点,查找根本原因,同时确定故障影响范围,这能大大节省运维人员的时间,让运维主管也能直接查看业务故障所影响范围,从而进行资源的协调或督促问题的解决。


主干链路状态实时监控


总行到每个支行关键链路的带宽占用情况是网络运维管理工作的核心部分。通过监控系统采集链路相关的性能指标进行分析比较,然后根据预先确定的线路性能级别确定线路的健康状况,不同的性能级别按照不同的颜色在拓扑视图的链路显示上加以区分,从而直观的反映网络中关键链路的流量情况;对关键链路的使用情况进行综合分析,发现对所提供的银行业务主干网络服务的异常使用情况。


一般的网络管理软件都可以完成从设备中读取连接线路的流量数据,并集中显示在链路流量趋势图上,方便运维人员进一步了解该链路的流量变化趋势以及多链路之间的流量变化相关性。


金盾软件 NOC 产品拥有完备的 IT 资源监控管理库,以及新一代的图像化展示功能,多方面、多角度角度反映系统的运行情况、性能情况。NOC 产品为城商行提供智慧运维的完整解决方案,为系统升级、改造、扩容提供更可靠的数据依据,使数据中心生产管理更科学化、数据化。




 
我要推荐
转发到

友情链接