Datadog/Datadog Monitor & Alram

Datadog Monitoring & Alram 설정하기 - Datadog Agent availability

seongduck 2025. 2. 1. 19:44

Datadog에서 수집되는 Metric을 통해서 Monitoring & Alram을 설정할 수 있다.

Datadog Agent를 가지고 있는 EC2 (Host 서버)가 죽게되면 바로 Alram을 만들어보자.


하나 이상의 호스트가 Datadog에 보고하는지 확인하는 Monitors Type

1) Datadog Monitors -> New Monitor -> Host Tpye
"""
2. Define the metric
Metric : "datadog.agent.running" from 계정정보
Evaluate the : "average", "last 5 minutes"

3. Set alert conditions
alert value : "ezual to"
Alert threshold =="0"
missing ofr : "Show NO DATA and notify"

4. Configure notifications & automations
"""
제목 : OO의 Datadog Agent가 중지되었습니다.

##  "{{host.name}}"의 Datadog Agent가 <span style="color: red;"> 중지</span>되었습니다.
#### <span style="color: purple;">발생 시간 : {{local_time 'last_triggered_at' 'Asia/Seoul'}} </span> <br><br>

#### 다음 단계에 따라 조치를 취해주세요.
<span style="color: green;"> 1) Datadog Cluster 상태 확인 </span> 
- `sudo systemcetl status datadog-cluser-agent`<br><br>

<span style="color: green;"> 2) Datadog Agent 상태 확인 </span>
- `sudo systemctl status datadog-agent`<br><br>

<span style="color: green;"> 3) Datadog Agent 재기동 </span>
- `sudo systemctl restart datadog-agent`<br><br>

수신자 : @계정정보
"""

 

Test Notifications 버튼으로 해당 문장 및 조건을 테스트해볼 수 있다.