一、SRE核心是什么
我总结下来是:通过软件工程的方式开发(GOOGLE规定SRE团队必须将50%的精力花在真实的开发工作上)一些自动化的工具系统来解放传统运维工程师大量重复和手工操作,从而让新生代的SRE工程师有更多的时间:
1、思考如何让系统能够更健壮地运行
2、出现问题能够通过事先编制的自动化处置策略,最短时间自愈
3、事后思考如何让该事件的问题撤底修复,如果不能,SRE是否可以开发一些自动化的工具系统能够代替人工在最短的时间解决问题
4、最终:SRE可以有更多的时间享受生活,而非像传统软件工程师疲于奔命…