「리눅스 서버를 운영」에서 매일·매주·매월 해야 하는 작업들.
자동화하지 않으면 잊고 사고로 이어짐.
매일 — 자동.
1) 모니터링 알림 확인 — Grafana·Slack.
2) 백업 성공 확인.
3) 보안 패치 자동 적용.
4) 로그 회전.
사람이 매일 손으로 하면 안 됨.
매주 — 사람이.
1) 디스크·메모리·CPU 추세 확인 — 「예상 못 한 증가」 식별.
2) 보안 로그(auth.log) 검토 — 비정상 접속 시도.
3) 패치 안 된 패키지 점검.
4) 백업 복원 시뮬레이션(1개라도).
매월.
1) 사용자 계정 정리 — 안 쓰는 것.
2) 권한 점검 — sudo 권한 최소 원칙.
3) SSL 인증서 만료 점검(자동 갱신 안 되면).
4) 디스크 SMART 상태.
5) 시스템 업그레이드 검토.
분기·연간.
1) DR(Disaster Recovery) 시나리오 시험 — 「데이터센터 통째 죽으면」.
2) 보안 감사 — Lynis 같은 도구.
3) 큰 업그레이드 계획 — Ubuntu 22.04 → 24.04 같은.
4) 비용 점검·최적화.
5) 운영 문서·룬북 갱신.
자동화 + 정기 사람 점검의 조합이 안전한 운영.
한 줄 요약
리눅스 운영 — 매일(모니터링·백업·패치·로그 회전 자동), 매주(추세·보안 로그·복원 시뮬레이션), 매월(계정·권한·인증서·SMART), 분기·연간(DR 시험·보안 감사·문서).
자동화 + 정기 점검.
더 알아볼 것
- 룬북(runbook) 작성
- SRE 원칙·SLO
- DevOps와 SRE의 차이