Sentry가 「에러」를 본다면 Prometheus·Grafana는 「수치 메트릭(요청 수·응답 시간·CPU·메모리)」을 봅니다.
시계열 그래프로 「언제 무엇이 어떻게 변했나」 파악.
Prometheus.
메트릭 수집 + 저장 + 쿼리 시스템.
파이썬 앱은 prometheus-client 라이브러리로 메트릭 노출(/metrics 엔드포인트).
Prometheus가 주기적으로 스크래핑(pull) → DB에 저장.
흔한 메트릭.
Counter — 누적 카운트(요청 수).
Gauge — 현재 값(연결 수·메모리).
Histogram — 분포(응답 시간).
Summary — 백분위수.
코드에서 request_count.inc() / response_time.observe(0.123) 같이 기록.
Grafana.
시각화 도구.
Prometheus를 데이터 소스로 연결 → 대시보드에 그래프·게이지·표 배치.
알림(Slack·메일)도 설정 가능.
「응답 시간이 1초 초과 시 알림」 같은 SLO 모니터링.
대안 — 클라우드 SaaS.
Datadog·New Relic·Grafana Cloud — 인프라 운영 부담 없이 같은 효과.
작은 팀은 SaaS, 큰 팀은 self-hosted Prometheus + Grafana가 흔한 선택.
어느 쪽이든 「메트릭 → 대시보드 → 알림」 파이프라인은 운영의 기본.
한 줄 요약
Prometheus는 메트릭 수집·쿼리, Grafana는 시각화·알림.
Counter·Gauge·Histogram이 기본 타입, prometheus-client로 노출.
Datadog·New Relic이 SaaS 대안.
더 알아볼 것
- RED 메서드 vs USE 메서드
- SLO/SLI 정의
- OpenTelemetry — 표준화 프로젝트