Datadog/Datadog Monitor & Alram
Datadog Monitoring & Alram 설정하기 - system cpu utilization
seongduck
2025. 2. 1. 19:45
EC2 (Host)의 CPU util값이 어느 값 이상이 되면 알람을 받을 수 있게 구성해보자.
Item Key
- system.cpu.util ===Datadog mapping===> system.cpu.idel
CPU idel 사용량이 70~100에 따라 알람 설정
1) Datadog Monitors -> New Monitor -> Metirc Type
"""
2. Define the metric
Metric : "system.cpu.idle" avg by "host"
Evaluate the : "average", "last 5 minutes"
3. Set alert conditions
alert value : "above or equal to"
Alert threshold >="90"
Warning threshold >= "80"
missing ofr : "Show last known status"
4. Configure notifications & automations
"""
제목 : OO의 Datadog Agent가 중지되었습니다.
## "{{host.name}}"의 Datadog Agent가 <span style="color: red;"> 중지</span>되었습니다.
#### <span style="color: purple;">발생 시간 : {{local_time 'last_triggered_at' 'Asia/Seoul'}} </span> <br><br>
#### 다음 단계에 따라 조치를 취해주세요.
## {{host.name}}의 Datadog Agent의 CPU Idel 값이 <span style="color: red;"> 높습니다. : {{value}}</span>
#### <span style="color: purple;">발생 시간 : {{local_time 'last_triggered_at' 'Asia/Seoul'}} </span> <br><br>
#### 다음 단계에 따라 조치를 취해주세요.
<span style="color: green;"> 1) Datadog Host CPU Idel 값 확인 </span>
- `sudo vmstat 1`<br><br>
<span style="color: green;"> 2) 무분별한 트래픽 유입 확인 </span><br><br>
수신자 : @계정정보
"""
Test Notifications 버튼으로 해당 문장 및 조건을 테스트해볼 수 있다.