蓝鲸 腾讯云(蓝鲸VIP)

深度解读腾讯云蓝鲸平台:运维效率提升10倍原来这么简单

编者按:游戏是腾讯一直以来的核心业务之一。从2003年腾讯发布首款QQ游戏至今,腾讯游戏已经运营了上千款游戏。无论独家代理还是自主研发,腾讯的端游、页游、手游都在使用同一体系进行运维管理,效率比之前提升了近十倍。这个神秘系统,就是被称为下一代游戏运维体系的——蓝鲸。目前,蓝鲸已通过腾讯云逐步对外开放,成为腾讯云面向游戏行业最有力的运维利器。

在腾讯的定义中,所描述的蓝鲸是依托SOA理念(Service-OrientedArchitecture面向服务架构)和云技术构建的运维模式,以原子服务集成和工具开放构建的方式,解决运维基础服务的无人值守以及运维增值服务的低成本实现。一句话简单概括,蓝鲸让游戏运维能够以低成本进行更高层次的服务。蓝鲸创始人、腾讯游戏运维支撑体系负责人党受辉对蓝鲸体系、功能做了详细分析,解读了蓝鲸的四大秘笈。

秘笈一:运维基础服务——无人值守

假设凌晨4点钟,运维系统某个环节出现故障,根据系统自己的逻辑,用时1分13秒时间查到问题、处理,随后直接重启。早上来上班,运维人员得到一个通知,告知半夜发生了什么事情,我(蓝鲸)帮你处理了。这就是蓝鲸的无人值守功能。

顾名思义,无人值守就是不用运维人员做任何人工操作,系统自身进行处理的功能,这是蓝鲸运维工作的基础服务。如果细分处理业务的性质,一部分是自助化发布变更、开区迁移、信息提取和数值调整,另外一部分则是自动化进行扩容缩容、开区迁移和故障处理。

进一步说,蓝鲸可以帮助运维人员将重复、繁琐且缺乏创新的运维工作打包,并制作成应用工具,在遇到同类情况时可以直接使用工具来代替人工操作,不仅将运维人员从各类重复工作中解放出来,还大大缩短了同类操作的时间花费,提高运维的工作效率。据透露,腾讯旗下《刀剑2》在使用蓝鲸的开区App之后,一次开区操作只需要花费5-7分钟,相比未使用App之前节省了近4个小时,效率提升数十倍。

在云时代,无人值守服务还可实现智能滚服,比如到达一定人数后,会自动实现开区功能。针对故障,还会即时故障自愈。目前,火影、天天炫斗通过蓝鲸开通自动开区功能,超级玛莉开通了故障自愈功能。

秘笈二:运维增值服务——云时代将占比90%

目前,包括基础运营工具建设、产品运营决策支持、用户游戏体验优化、业务异常定位规避以及游戏运营架构优化等在内的增值服务,在运维工作中已经占据约10%的比例。党受辉称,云时代增值服务会占据更高的比例,未来预计可以提高到90%。

自2008年起,腾讯运维体系即在游戏领域开始沉淀,历经脚本时代、作业时代到云时代,2013年之后在腾讯云的支撑下,构建了云时代的蓝鲸体系。

据党受辉介绍,游戏相互之间架构没有标准,操作没有标准,同一个游戏同一个场景,版本一变可能就变了,所以需要运维不断调整,如果没有工具运维,操作要不断修正。

事实上,运维的脚本和运维的配置的云化,能够最大化保证配置安全。党受辉提到,作业时代起到了规范操作目的,传统意义上一个人管多个业务,自己可以写多个脚本,如果换一个人,就有可能把上一个人运维脚本全部丢掉。基于这些方面,云时代对脚本进行规范化处理,实现了跨系统调度自动化。类似这样的运营增值服务,比例在云时代还将进一步扩容。

秘笈三:云工作台、快速构建、服务集成三位一体

蓝鲸体系是一套落地蓝鲸模式技术解决方案,由蓝鲸平台、运营系统、Iaas构成。关键的蓝鲸平台主要有三个部分,提供一个云工作台、一个快速构建平台,然后是服务集成。

党受辉介绍,蓝鲸平台不仅为游戏运营人员提供了丰富的工具SaaS服务,同时为开发者提供了PaaS服务。蓝鲸PaaS云平台提供了全流程的工具开发,调试和托管服务,降低了工具的开发门槛,普通运维经过简单培训就可以快速制作运营工具,上装到市场。同时,蓝鲸还对接了大量IaaS层和运营系统层的原子操作,在ESB平台内实现灵活调度,提供给PaaS平台使用,这样运维在构建调度自动化工具的时候,就不需要自己对接接口、硬编码调度逻辑了,这就进一步降低了工具开发门槛。

秘笈四:蓝鲸根本上是要武装运维而不是取代,助力运维转型

蓝鲸是腾讯游戏运维从实战中总结、提炼、构想、设计、建设出来的一套体系,设计初衷是武装运维,使其能提供更高维度的服务,而不是取代运维。

“运维在传统领域价值比较低,被替代成本也不高。开发一般来讲跟游戏绑定的,一般不会作为一个公共资源出现,如果两个游戏都要做精细化,让开发同时去做是不大合适的,是重复建设,而运维有能力做这个。蓝鲸要做的,就是运维强化和运维拉升维度。”党受辉这样解释蓝鲸的理念。

从必要性方面讲,党受辉称,游戏行业运维必须转型。现在游戏拼渠道和品质,产品拉回来的每一个流量都要想办法留在这里并沉淀下来。一方面,发布时间必须做得越来越短,或者变更自动扩容,不能等到已经满了,用户进不去了再进行扩容,要更智能化。还有一个故障问题,对于异常辨识、辅助决策,运维掌控着整个环境。此外,还有拉新回流,有多少玩家流失了,哪些玩家可以来得,运维要针对这些信息,提供有建设性的处理反馈。

腾讯开放环境下,云助推蓝鲸走上了游戏运维管理之巅,最大程度的降低运维门槛、提升运维效率。在2015ChinaJoy期间,腾讯云再次展示了自身在游戏云服务领域的领先优势,并表示会继续将腾讯内部多种秘密武器开放出来,独门能力覆盖开发、测试、运营、支付等环节,势必会为游戏行业带来更多价值、更多变化。

腾讯蓝鲸运维平台优缺点

蓝鲸智云,简称蓝鲸,是一套基于PaaS的技术解决方案;通过蓝鲸,可以实现很多功能,这就是他的优点,缺点就是有些功能比较鸡肋。

1、“运维基础服务”的无人值守;运维基础服务就是我们经常做的发布变更和故障处理,日常的运维操作。

2、“运维增值服务”的低成本实现;也就是说,在实行运维基础服务之后,实现IT运营转型;为相关关联的岗位提供快速、低成本的支撑工具,运营系统,推动企业企业内部的工具文化;并利用云和大数据技术为企业实现精细化的工作活动。

在腾讯内部,蓝鲸支撑着300多款业务,管理着20多万台服务器,完成着14万次发布变更操作,每天处理着变更和操作超过6万次。下面我们一起看蓝鲸的架构图。最底部是管控平台,他具体服务择比如说传输数据,传输文件。

执行脚本等;在管控平台上层,是常用的基础平台,如配置平台、作业平台、数据平台等,他们为上层的集成平台提供原子服务,从而为下面平台提供调度自动化,在集成平台的上层,承载着很多SAAS应用,如标准运维、监控系统。

故障自愈,移动平台等。目前蓝鲸2.0已经开放了这4个平台,管控平台、配置平台、作业平台、集成平台,最底层的管控平台,可以管理各种OS,如WINDOWS,LUNIX,小型机,dux等上面的作业平台可以是基础运维工作的自动化,如智能传输文件。

脚本、云化管理、脚本快速执行,海量主机的并发操作,跨云管理(无论阿里云、腾讯云、私有云等都可以统一管理)等等。

腾云忆想公司怎么样

成都腾云忆想科技有限公司,专注于为腾讯云旗下自研云产品提供技术支持,是腾讯在国内的重要服务合作伙伴。公司总部位于成都,设有北京、上海、深圳分部,为政府、电力、通信、警务、医疗、零售等行业交付重大项目超过200个,行业方案超过100个。

2018年,腾云忆想获得腾讯战略投资,全力投入华东、华北区域的项目销售、交付与运维等业务。公司秉持“智维服务凝聚未来AIOps To The Future”的理念,致力于提供全面、安全、可靠、负责、可信赖的云技术服务。腾云忆想强调协作团结、用心负责、永续学习,让客户数字化转型更加顺利高效。

2020年,面对疫情带来的挑战,腾云忆想实现逆势增长,整体营业额倍数级增长,潜力巨大。公司参与长三角G60科创走廊合作项目,助力区域企业政府智慧化转型,为长三角经济驱动、产业互联网发展做出贡献。公司在全国完成本地化布局,打磨华北、华东、华南、西部区域人才阵型、流程、平台,提供更贴身的服务。

公司制定了全新企业品牌Slogan:“智维服务凝聚未来AIOps To The Future”,明确企业发展的核心价值观:“协作团结,用心负责,永续学习”。全年内,公司内部完整培训体系制定并升级,北区东区持续吸纳新兴人才,人才储备不断壮大,高学历高职级人才占比80%以上。公司参与抗疫任务23个,参与“疫情防控小程序”部署上线任务,其中重点省市项目6个,协助解决国外华人归国健康码解决方案,打造适合疫情特殊时期的“交通事故零接触处理小程序”,落地“秦务云”政务一体化平台,解决网上办公、远程办公问题。

腾云忆想入选2020腾讯云启战略合作伙伴年度榜单,荣膺“年度协作奖”。公司背靠腾讯云,将以“腾讯蓝鲸”为基础,自主研发云原生服务框架,预计两年内构建能力,帮助战略客户基础设施云化,提升客户数字创新能力。公司完成重大项目交付,包括央视频APP、国庆阅兵、春晚播出、人大会议重点维保项目,永辉集团整体上云业务、蒙牛集团营销小程序任务、富士康云化转型项目等。公司收到客户授予的表彰共计87次,正直敬业、贴心服务、诚心交付是每一个腾云忆想员工秉持的职业素质。公司提供贴心服务,与客户共同进步,为客户提供全面、安全、可靠、负责、可信赖的云技术服务。

阅读剩余
THE END