概述
先说说这篇内容适合谁看。主要是那些创业团队、技术人员不到5人、没有专职运维的小微企业。读之前,基础服务器管理和软件开发经验是需要的,不然有些操作可能会觉得陌生。
这篇文章要介绍的是阿里云的两个基础产品:云监控和日志服务。搭配使用之后,你不需要整天盯着系统、服务器、数据库的实时状态,也能及时掌握异常情况,并且在问题发生时第一时间响应和处理。
云监控
官方介绍
云监控服务可以用来收集阿里云资源的监控指标,或者用户自定义的监控指标,还能探测服务是否可用,并针对这些指标设置告警。简单说,它能让你全面了解云上资源的使用情况、业务运行状态和健康度。一旦出现异常,及时收到报警并做出反应,保证应用程序顺畅运行。
SLS 日志服务
官方介绍
日志服务(Log Service,简称LOG/原SLS)是一个针对实时数据的一站式服务,在阿里集团内部经历了大量大数据场景的锤炼。它提供日志类数据的采集、消费、投递以及查询分析功能,能极大提升海量日志的处理和分析能力,适用于智能研发、运维、运营、安全等多种场景。
这两款产品主要解决什么问题
几个关键好处:
- 天然集成:如果你用的是阿里云相关产品,云监控会默认设置报警规则,当出现CPU使用率过高这样的异常时,会自动触发报警。
- 数据可视化:通过监控大屏,可以实时查看各个云资源或应用的健康状况、性能指标。
- 监控数据处理:可以编写数据收集脚本上传到云监控,在控制台设置灵活的监控指标和维度。
- 灵活报警:可以按照企业的实际情况和监控对象的重要程度,灵活设置报警规则。比如一般异常通知开发组,重要报警通知项目经理或技术总监。
- 全托管服务:日志服务不需要你自建存储,通过Agent收集上传日志就行,不用担心服务器磁盘被日志写满导致应用异常。
- 生态丰富:无论是服务端应用(比如Ja va、PHP)还是浏览器应用(比如Ja vaScript),都能接入日志服务统一管理。
- 实时性强:日志写入就能消费,不用像以前那样登录服务器查看日志文件,直接在控制台就能实时查看和分析。
如何选择使用
云监控的基础免费版功能已经很丰富,也可以根据实际情况选用付费版。日志服务目前按量付费,也有免费额度,整体费用不高,几乎可以忽略不计。
案例一、云监控实时检测网站状态,宕机时第一时间响应和处理
1、控制台打开云监控,进入站点管理
2、点击右侧的新建监控任务
3、填写要监控的网址并设置监控频率。为了让监控更灵敏,这里设置1分钟一次。
4、设置报警规则。
这里的可用性,指的是一个探测周期内的失败率,正常情况下是100%。我们设置90%或95%就可以。平均响应时间指的是超过多少毫秒打不开网站就判定为失败,这里设置为3000毫秒。连续阈值这里要注意,有时候网站会因为网络抖动导致探测失败。如果设置为1,每次探测失败都会触发报警,为了避免误报,这里可以设置为3次。基本上连续3次探测失败,就不仅仅是网络抖动的原因了,而是网站确实打不开了。
5、设置好之后点击创建按钮。这时可以通过列表直观地看到所监控站点的健康状况。
案例二、日志服务收集nginx访问日志并分析
1、控制台打开日志服务,如果还没开通需要先开通。然后点击创建Project。
所属地域可以根据自己ECS服务器或所收集日志的目标最近区域来选择。
2、创建好Project之后,还需要创建Logstore来存储日志。

如果应用的日志比较少,这里的Shard数据可以选择1。
3、创建好Logstore之后,进入数据接入环节。

根据实际情况选择对应的接入方式。这里用nginx的访问日志做演示,选择nginx访问日志即可。
4、填写配置信息。需要知道服务器上nginx日志的存储位置,比如存放在/usr/local/nginx/logs目录中,要收集的是access.log日志。
路径配置这样填写即可。
5、打开nginx.conf,找到log_format配置。
填入NGINX日志格式中,系统会自动生成NGINX键名称。
检查无误后点击下一步。
6、应用到机器组。把需要添加的服务器加入到一个机器组中,方便批量监控。
机器组标识选择IP地址,并填写ECS服务器内网IP。
7、添加完成之后,确认机器状态正常。
如果检测异常,可以参考官方文档解决:https://help.aliyun.com/document_detail/51458.html
8、再次点击Logtail配置,完成未完成的应用到机器组的操作。
选择刚添加的机器组。
应用到机器组即可完成。
9、配置完成后回到日志库,点击预览,确保接入正确并且日志服务收集到了nginx的访问日志。
如果有这样的数据,说明所有配置都没有问题。
10、接下来可以点击查看nginx的访问日志,这样就不需要登录服务器了。

11、日志服务还有个高级玩法:根据查询脚本生成报表。
请求报表
原始脚本
总结
通过云监控和日志服务的灵活搭配,可以创造出很多想要的功能。这需要大家深入研究学习和使用,慢慢摸索出适合自己的方案。
