VIPKID亮相中国系统架构师大会 烽火台系统攻克故障监控与预警难题

  • 日期:01-08
  • 点击:(651)


最近,第十一届中国系统架构师大会在北京召开。来自互联网、金融、网络教育、电子商务等领域的100多名技术精英出席了会议,带来了最有价值的技术交流活动。网上教育企业VIPSKID基础设施部门基础平台负责人杨志强应邀出席并分享了VIPSKID信标系统在风险故障自动识别、根本原因分析和提前预测、监控数据过度收集路径创新解决方案等方面的实践经验。自

QQ截图20191105152541.png

VIPPKID基础设施部门的基础设施平台领导者杨志强

于2013年成立以来,VIPPKID平台用户的数量从0成倍增加到700,000,而VIPPKID的业务场景也经历了跨越式迭代。与其他教育平台不同,VIPKID具有全球化、多云、高度敏感、大规模和多模式业务场景的特点。此外,围绕VIPKID平台构建了一系列复杂的商业场景,如教材、信息技术测试、教师、家长、学生、LP、CC、客户服务等。也大大增加了VIPKID协作系统失败的可能性。

杨志强提出智能故障监控解决方案是对交通层、服务层和数据层的异常风险点进行全面的数据采集和智能监控。监控系统发出警报后,通过灯塔系统分发和传递警报,实时发现连续的大颗粒风险。同时,灯塔系统还将屏蔽报警大颗粒的风险,并将持续的风险报警升级为故障广播。此外,灯塔系统将通过分钟级故障广播、故障规则训练、智能分析和自动识别完成故障修复,生成自愈策略和自愈处理,生成系统故障质量报告,并通过运营周报通知所有研发同事,从而大大减少公司故障的发生。

QQ截图20191105152533.png

VIPPKID监控报警系统-天网系统

鉴于当前报警发现、处理、合作和跟踪中存在诸多问题,效率低下且无量化,杨志强认为报警的可预测性和针对性至关重要。目前,VIPKID信标预警广播实现了持续风险的三分钟预警、电话、短信、钉子、邮件等多终端广播。和高效的合作风险管理。其中,风险广播中心制定了手动广播、系统广播和R&D跟进三个阶段?脑擞呗裕蟠筇岣吡宋侍夥⑾致省⒐悴ズ透省?

此外,杨志强还对智能运行维护中的报警智能分析和智能报警方案设计做了补充介绍。基于VIPKID基础设施部门,团队构建了整个监控报警系统的设计框架天网系统。目前,信标塔的报警分析已经完成,包括报警计算、风险预警广播、订阅中心、质量报告、报警统计和问题归因分析。杨志强表示,未来将继续与大数据算法团队合作开发故障定位系统,“希望通过天网系统实现更完善的智能报警设计,提高报警系统的智能水平,护送小学生的每一堂课”

youtube.com