腾讯云设计规范,腾讯云建站

深度解读腾讯云蓝鲸平台:运维效率提升10倍原来这么简单

编者按:游戏是腾讯一直以来的核心业务之一。从2003年腾讯发布首款QQ游戏至今,腾讯游戏已经运营了上千款游戏。无论独家代理还是自主研发,腾讯的端游、页游、手游都在使用同一体系进行运维管理,效率比之前提升了近十倍。这个神秘系统,就是被称为下一代游戏运维体系的——蓝鲸。目前,蓝鲸已通过腾讯云逐步对外开放,成为腾讯云面向游戏行业最有力的运维利器。

在腾讯的定义中,所描述的蓝鲸是依托SOA理念(Service-OrientedArchitecture面向服务架构)和云技术构建的运维模式,以原子服务集成和工具开放构建的方式,解决运维基础服务的无人值守以及运维增值服务的低成本实现。一句话简单概括,蓝鲸让游戏运维能够以低成本进行更高层次的服务。蓝鲸创始人、腾讯游戏运维支撑体系负责人党受辉对蓝鲸体系、功能做了详细分析,解读了蓝鲸的四大秘笈。

秘笈一:运维基础服务——无人值守

假设凌晨4点钟,运维系统某个环节出现故障,根据系统自己的逻辑,用时1分13秒时间查到问题、处理,随后直接重启。早上来上班,运维人员得到一个通知,告知半夜发生了什么事情,我(蓝鲸)帮你处理了。这就是蓝鲸的无人值守功能。

顾名思义,无人值守就是不用运维人员做任何人工操作,系统自身进行处理的功能,这是蓝鲸运维工作的基础服务。如果细分处理业务的性质,一部分是自助化发布变更、开区迁移、信息提取和数值调整,另外一部分则是自动化进行扩容缩容、开区迁移和故障处理。

进一步说,蓝鲸可以帮助运维人员将重复、繁琐且缺乏创新的运维工作打包,并制作成应用工具,在遇到同类情况时可以直接使用工具来代替人工操作,不仅将运维人员从各类重复工作中解放出来,还大大缩短了同类操作的时间花费,提高运维的工作效率。据透露,腾讯旗下《刀剑2》在使用蓝鲸的开区App之后,一次开区操作只需要花费5-7分钟,相比未使用App之前节省了近4个小时,效率提升数十倍。

在云时代,无人值守服务还可实现智能滚服,比如到达一定人数后,会自动实现开区功能。针对故障,还会即时故障自愈。目前,火影、天天炫斗通过蓝鲸开通自动开区功能,超级玛莉开通了故障自愈功能。

秘笈二:运维增值服务——云时代将占比90%

目前,包括基础运营工具建设、产品运营决策支持、用户游戏体验优化、业务异常定位规避以及游戏运营架构优化等在内的增值服务,在运维工作中已经占据约10%的比例。党受辉称,云时代增值服务会占据更高的比例,未来预计可以提高到90%。

自2008年起,腾讯运维体系即在游戏领域开始沉淀,历经脚本时代、作业时代到云时代,2013年之后在腾讯云的支撑下,构建了云时代的蓝鲸体系。

据党受辉介绍,游戏相互之间架构没有标准,操作没有标准,同一个游戏同一个场景,版本一变可能就变了,所以需要运维不断调整,如果没有工具运维,操作要不断修正。

事实上,运维的脚本和运维的配置的云化,能够最大化保证配置安全。党受辉提到,作业时代起到了规范操作目的,传统意义上一个人管多个业务,自己可以写多个脚本,如果换一个人,就有可能把上一个人运维脚本全部丢掉。基于这些方面,云时代对脚本进行规范化处理,实现了跨系统调度自动化。类似这样的运营增值服务,比例在云时代还将进一步扩容。

秘笈三:云工作台、快速构建、服务集成三位一体

蓝鲸体系是一套落地蓝鲸模式技术解决方案,由蓝鲸平台、运营系统、Iaas构成。关键的蓝鲸平台主要有三个部分,提供一个云工作台、一个快速构建平台,然后是服务集成。

党受辉介绍,蓝鲸平台不仅为游戏运营人员提供了丰富的工具SaaS服务,同时为开发者提供了PaaS服务。蓝鲸PaaS云平台提供了全流程的工具开发,调试和托管服务,降低了工具的开发门槛,普通运维经过简单培训就可以快速制作运营工具,上装到市场。同时,蓝鲸还对接了大量IaaS层和运营系统层的原子操作,在ESB平台内实现灵活调度,提供给PaaS平台使用,这样运维在构建调度自动化工具的时候,就不需要自己对接接口、硬编码调度逻辑了,这就进一步降低了工具开发门槛。

秘笈四:蓝鲸根本上是要武装运维而不是取代,助力运维转型

蓝鲸是腾讯游戏运维从实战中总结、提炼、构想、设计、建设出来的一套体系,设计初衷是武装运维,使其能提供更高维度的服务,而不是取代运维。

“运维在传统领域价值比较低,被替代成本也不高。开发一般来讲跟游戏绑定的,一般不会作为一个公共资源出现,如果两个游戏都要做精细化,让开发同时去做是不大合适的,是重复建设,而运维有能力做这个。蓝鲸要做的,就是运维强化和运维拉升维度。”党受辉这样解释蓝鲸的理念。

从必要性方面讲,党受辉称,游戏行业运维必须转型。现在游戏拼渠道和品质,产品拉回来的每一个流量都要想办法留在这里并沉淀下来。一方面,发布时间必须做得越来越短,或者变更自动扩容,不能等到已经满了,用户进不去了再进行扩容,要更智能化。还有一个故障问题,对于异常辨识、辅助决策,运维掌控着整个环境。此外,还有拉新回流,有多少玩家流失了,哪些玩家可以来得,运维要针对这些信息,提供有建设性的处理反馈。

腾讯开放环境下,云助推蓝鲸走上了游戏运维管理之巅,最大程度的降低运维门槛、提升运维效率。在2015ChinaJoy期间,腾讯云再次展示了自身在游戏云服务领域的领先优势,并表示会继续将腾讯内部多种秘密武器开放出来,独门能力覆盖开发、测试、运营、支付等环节,势必会为游戏行业带来更多价值、更多变化。

TDesign 正式开源发布,腾讯设计云布局重要能力拼图!

随着互联网的飞速发展,产品复杂性增强,传统设计研发模式面临挑战。腾讯为应对这一趋势,推出了腾讯设计云,旨在提升设计研发效率,实现更高效协同。近日,腾讯宣布将其企业级设计体系TDesign开源,将自身研发能力分享给更多企业,以助力业务发展和降本增效。

腾讯设计云源于腾讯内部丰富的产品实战,其工具平台包含腾讯问卷、智绘设计、云创多媒体引擎、CoDesign、ProWork、微搭低代码、CODING等产品,覆盖设计协作、素材制作、数据可视化、低代码开发等多个领域,旨在解决设计研发流程中的痛点,提供高效工具和版权资源。

腾讯设计云已经服务于QQ音乐、腾讯云等大型团队,以及数字广东、富途证券等企业,集成了成熟与内部优化的工具,旨在实现腾讯内部设计体系的标准化与统一。TDesign的开源,旨在解决内部重复造轮子的问题,通过组件库、设计语言和设计风格的统一,降低设计和研发成本,提升协同效率。

TDesign设计之初,即注重跨技术栈支持和用户体验一致性,提供了完整的组件库和设计资源,支持Axure、Sketch等设计工具。为了促进设计与开发的协同,TDesign包含色彩体系等设计元素,且在文档和API规范上寻求统一,通过学习开源社区的协作方式和自动化工具,不断优化迭代。

随着TDesign的开源,腾讯设计云的能力愈发完善,标志着腾讯在企业级设计协同上的重要布局。未来,设计云将继续深化内部设计解决方案的开源,并利用智能化工具降低开发门槛,推动行业的协同创新。

云计算未来将是怎样的发展趋势

2020年以后5种云计算发展趋势:

1.边缘计算

云边缘是由功能强大的服务器和快速存储组成的本地化数据中心或服务存在点。云提供商将应用程序和许多其他活动作业的负载抵消到云边缘状态。这引入了快速处理,低延迟和超快速的数据传输。

通过处理苛刻的终结点任务并将数据顺序传输回云,边缘几乎充当了云的缓存平台。边缘计算从云提供商的基础架构释放了大量处理能力-带宽使用量直线下降。

2.云自动化

从2020年及以后,将越来越依赖于人工智能和机器学习(AI/ML)来推动云自动化决策。AI/ML可以大规模地自动执行例行的,可重复的任务,与人工操作员相比,可以非常快速地完成。

具体的用例可能是广泛的日志分析。AI/ML例程吸收大量的日志信息,寻找趋势并分析结果。这可用于预测服务器组件故障或应用程序崩溃的原因。由于可以根据预测的基础架构需求做出准确的预测,因此容量规划可从云自动化中受益匪浅。

3.行业优化的云

全球各地的组织正在迅速迁移到云中。这推动了为特定行业提供量身定制的云服务产品的趋势。这通常适用于目标严格的行业,例如医疗保健,金融和法律部门。

一些云服务提供商拥有与行业相关的消耗性云平台,这些平台已符合美国相关法规。外包业务只需选择合适的提供商即可开始使用符合行业标准的服务。

4.混合云策略

2020年出现的另一个关键趋势是,所有CIO都希望成为一个乌托邦式的工作空间,成为技术中立的云消费者。理想情况下,企业应将核心业务服务分布在多个云提供商之间,以显着降低停机或长时间停机的风险。

5.容器化

2020年容器的普及对于云而言尤其重要。自2013年Docker和2014年发布Kubernetes以来,容器的使用量激增。许多云提供商现在拥有自己的容器应用引擎,这些引擎作为可消费的云服务出售。系统管理员不再需要担心构建虚拟机和底层基础结构。

阅读剩余
THE END