2026 다섯 가지 오해: 스크립트 green 이 사용자 가용성은 아니다
무인 모니터링은 고정 간격 yes/no 입니다. 사다리는 원인 추적입니다. remote 구성에서는 서버 루프백만 초록일 때 외부 WS 종단이 죽어 있을 수 있어 클라이언트 관점 plist 를 별도로 돌려야 합니다.
cron 이 대화형 dotfile 로드:업그레이드 후 PATH 변동.
사다리 전체를 타임아웃 없이 파이프:분단 시 launchd 정체.
첫 실패에 kill -9:split brain 복구 비용 증가.
로그를 동기 디스크에:state 권장과 충돌.
remote 대칭 무시:사용자 가시 경로 누락.
설치 미완이면 먼저 체크리스트 를 마칩니다.
사다리·프로브·합성 모니터 역할
사다리는 인시던트 조사, 프로브는 조기 감지, 합성은 외향 경로입니다. 알림 라우팅을 문서화해 PagerDuty 피로를 줄입니다.
| 수단 | 트리거 | 출력 | 비용 |
|---|---|---|---|
| 사다리 | 사람·에스컬레이션 | 서술 로그 | 엔지니어 시간 |
| 무인 스크립트 | 스케줄 | 종료 코드 | 디스크 소량 |
| 합성 | 외부 | E2E 지연 | 과금 |
자동화는 유한 상태 기계로 닫히게 설계합니다.
최소 bash: PATH·종료 코드·timeout
비동기 경로에 두고 launchd 로 EnvironmentVariables 를 명시합니다.cron 이면 상단에서 PATH 와 OPENCLAW_STATE_DIR 고정.
#!/bin/bash set -euo pipefail LOG=/var/log/openclaw-health.log export PATH="/usr/local/bin:/opt/homebrew/bin:$PATH" timeout 60s openclaw gateway status >>"$LOG" 2>&1 || exit 2 timeout 60s openclaw channels status --probe >>"$LOG" 2>&1 || exit 2 exit 0
안내:서브커맨드는 공식 문서에 맞게 교체하세요.
터널·토큰은 업그레이드 원격 글을 참고합니다.
여섯 단계로 일회성 cron 을 계약으로
CLI 절대 경로와 버전을 plist 에 고정.
로그 디렉터리와 로테이션 선택.
healthy·자동 복구·사람 세 상태 기계.
연속 실패 카운터 후에만 재시작.
remote 클라이언트 작업 시간 분산.
종료 코드를 티켓 필드에 매핑하고 주문 지역 SKU 와 연결.
주기·임계값·M4 Pro 헤드룸
샘플링:안정 임대에서는 3~5분이면 충분.
연속 exit 2 세 번:사람 호출 일반적 기준.
M4 Pro 64GB:야간 cron 과 세션 겹침 시 swap 오탐 완화.
주의:수면 노트북과 가정용 회선은 SLA 에 불리합니다.
수동 사다리만으로는 5분 간격 샘플링을 확장하기 어렵습니다. 계약 가능한 전용 Apple Silicon 과 명시 지역·통합 메모리 단계·일~월 임대로 운영을 고정하려는 팀에게 싱가포르·미 동서 등에 Gateway 를 올릴 때 KVMNODE Mac mini 클라우드 대여는 강한 선택지입니다.