Datadog에서 수집되는 Metric을 통해서 Monitoring & Alram을 설정할 수 있다.
Datadog Agent를 가지고 있는 EC2 (Host 서버)가 죽게되면 바로 Alram을 만들어보자.
하나 이상의 호스트가 Datadog에 보고하는지 확인하는 Monitors Type
1) Datadog Monitors -> New Monitor -> Host Tpye
"""
2. Define the metric
Metric : "datadog.agent.running" from 계정정보
Evaluate the : "average", "last 5 minutes"
3. Set alert conditions
alert value : "ezual to"
Alert threshold =="0"
missing ofr : "Show NO DATA and notify"
4. Configure notifications & automations
"""
제목 : OO의 Datadog Agent가 중지되었습니다.
## "{{host.name}}"의 Datadog Agent가 <span style="color: red;"> 중지</span>되었습니다.
#### <span style="color: purple;">발생 시간 : {{local_time 'last_triggered_at' 'Asia/Seoul'}} </span> <br><br>
#### 다음 단계에 따라 조치를 취해주세요.
<span style="color: green;"> 1) Datadog Cluster 상태 확인 </span>
- `sudo systemcetl status datadog-cluser-agent`<br><br>
<span style="color: green;"> 2) Datadog Agent 상태 확인 </span>
- `sudo systemctl status datadog-agent`<br><br>
<span style="color: green;"> 3) Datadog Agent 재기동 </span>
- `sudo systemctl restart datadog-agent`<br><br>
수신자 : @계정정보
"""
Test Notifications 버튼으로 해당 문장 및 조건을 테스트해볼 수 있다.
'Datadog > Datadog Monitor & Alram' 카테고리의 다른 글
Datadog Monitoring & Alram 설정하기 - system cpu utilization (0) | 2025.02.01 |
---|