2026년 Hermes Agent 열풍: 챗봇이 아니라 내 인프라에 사는 Agent
30일 체험기를 읽었다면 본문에서 3계층 역할을 정리하세요. OpenClaw 상시와 같이 launchd·헬스 체크가 전제입니다.
Episodic SQLite를 주기적으로 압축할 때는 Gateway를 유지한 채 짧은 유지보수 창을 두거나 read-only로 전환하는 절차를 runbook에 넣으세요. Skill과 Core는 소형 인스턴스에도 남고, 매우 긴 세션 히스토리만 디스크를 많이 씁니다. OpenClaw 상시와 마찬가지로 launchd 감시가 핵심이며, Hermes는 Skill·Episodic을 제품 스토리로 앞에 둡니다.
2026년 2월부터 Hermes Agent(Nous Research, MIT)가 GitHub·Hacker News에서 「자기 진화 Agent」 논의의 중심입니다. Copilot식 보완이나 일회성 ChatGPT 탭과 달리 프로세스 상시 구동, 세션 간 기억 누적, 작업 후 Skill 자동 작성이 핵심입니다. Telegram 한 줄이면 백그라운드에서 shell, 웹 검색, Git 저장소 편집——인프라 위 동료에 가깝습니다.
Closed Learning Loop는 Gateway 데몬, cron, SQLite 세션 인덱스의 지속 동작에 의존합니다. 덮개 닫기, 정전 유지보수, OOM 재시작은 ~/.hermes/skills/를 지우지 않지만 「항상 온라인 Agent」 체감은 무너집니다. 논의도 「모델이 강한가」에서 「Agent에 어떤 머신을 빌릴까」로 이동했습니다.
30일 기사는 시간축 실측, 본문은 아키텍처에 집중합니다. OpenClaw 등 상시 Gateway를 써 본 팀이라면 교훈은 같습니다. 영속성은 운영 모델이고, Hermes는 3계층 기억과 Closed Learning Loop로 Skill을 구체화한다는 점이 다릅니다. launchd·헬스 체크·밤에 자지 않는 머신은 동일하게 필요합니다.
역할 불일치: 일회용 CLI로 쓰고 매번 종료, Skill은 늘지만 복리 곡선은 평탄합니다.
플랫폼 불일치: Linux VPS에 억지로 올려 macOS 공식 설치·Metal 로컬 추론 경로를 잃습니다.
용량 불일치: 16GB에서 Xcode와 Hermes-3 병행, swap으로 Episodic 리콜 지연.
이전 불일치: Skill이 커질수록 ~/.hermes/ 백업 없이 호스트 변경을 꺼립니다.
비용 불일치: VPS 월요금만 보고 RTT와 hermes doctor 인건비를 무시합니다.
결론: Hermes 가치는 시간에 복리화되며, 하드웨어 선정의 본질은 프로세스·디스크 상태의 지속 온라인입니다.
엔터프라이즈에서는 사용자 맥락과 Skill이 임대 인스턴스에 머물고 벤더 기억 클라우드로 흘러가지 않는 점도 장점입니다. SSH·백업·반납 전 삭제를 내부 정책에 적어 두면 데이터 흐름 설명이 수월합니다.
Stateless에서 Persistent로: Hermes Agent 3계층 메모리 역할
1계층 — 단기 세션 맥락: 현재 thread 메시지·도구 결과. 프로세스 중지 후 모델 맥락에 남지 않으며 하위 계층이 보완합니다.
2계층 — Skill Documents(절차 기억): 복잡 작업 후 Closed Learning Loop가 ~/.hermes/skills/에 Markdown Skill을 남기고, 유사 작업에서 progressive disclosure로 로드해 token·실패율을 줄입니다.
3계층 — 세션 간 사용자 모델: USER.md 등 Core Memory와 SQLite FTS5 Episodic Memory로 「두 주 뒤 이어서」가 가능해집니다.
curl -fsSL https://get.hermes-agent.org | bash hermes gateway start ls ~/.hermes/skills/ hermes memory search "deploy checklist"
Nous Portal, OpenRouter, Ollama / llama.cpp / MLX 연결 가능하며 Skill은 특정 모델 가중치에 묶이지 않습니다. Gateway가 주 1~2회만 깨우면 Episodic 시간 연속성이 끊기고 수동 re-ground가 늘어납니다.
「큰 context」가 아니라 절차 Skill 재사용이 Hermes의 핵심 이득입니다. 두 번째 배포 체크리스트가 더 저렴해지려면 cron과 SQLite가 상시 가동해야 합니다.
용량 계획은 계층별로 나눕니다. Core Markdown은 작고, Skill은 성공 작업과 함께 늘며, Episodic SQLite와 로테이션 세션 로그가 장기 팽창의 주원인입니다. OpenRouter나 Nous Portal로 API만 쓰면 16GB·256이면 되는 경우가 많고, 로컬 Hermes-3나 MLX를 병행하면 24GB·512로 Apple 통합 메모리에서 리콜과 추론이 서로 밀어내지 않게 합니다.
검색에서는 「Skill이 사라지나」가 많지만, 운영 질문은 「새벽 3시 Telegram 응답」과 「야간 문서 동기화」입니다. 파일만 남고 Gateway가 멈추면 Skill은 풍부해도 복리는 거의 없습니다.
재시작하면 Hermes 기억이 사라지나? 파일은 남고 연속성 단절이 고통
파일은 대개 유지되고 실행 리듬이 손상됩니다.
MacBook 절전: hermes gateway 종료, Telegram 대기열, 야간 cron 누락.
VPS 유지보수 재시작: systemd 환경변수 누락, webhook 502, hermes doctor 필요.
라즈베리파이 등: SQLite 팽창 후 리콜 지연, 로컬 모델 병행 어려움.
교차 리전 RTT: 원거리 노드·미 서부 운영자 조합에서 타임아웃 증가.
심리 비용: Skill이 커질수록 이전은 「재설치」가 아닌 상태 이전.
OpenClaw Gateway 상시와 동형 문제입니다. launchd 감시와 헬스 프로브를 Hermes에도 적용하세요.
호스트 변경 전 ~/.hermes/ tarball, 스테이징 복원 후 채널 token 전환 습관이 연속성을 지킵니다. Hermes는 필요할 때만 켜는 CLI가 아니라 모니터링 있는 상시 서비스로 다루는 것이 프로덕션 정석입니다.
Hermes Agent에 Mac Mini M4가 맞는 이유: UMA, macOS, 저소음 7×24
공식 macOS, Apple GPU API Metal용 llama.cpp / MLX(금속 metal과 혼동하지 마세요). Mac Mini M4는 UMA로 Agent(대개 2GB 미만)와 13B급 모델 여유, 대기 약 10W, 책상을 차지하지 않습니다. 개발자는 아키텍처 선호를 문서 Skill로, 크리에이터는 기획 Skill로, 연구자는 논문 파이프라인을 재사용 Skill로 남깁니다.
x86 미니 PC는 공식 macOS 경로가 약하고, MacBook은 절전과 맞지 않으며, VPS는 Linux 호환·RTT 트레이드오프가 있습니다. Git 리모트·API 출구에 가까운 전용 Mini가 다단계 도구 실패율을 낮추기 쉽습니다.
| 항목 | 로컬 MacBook | 저가 VPS / Pi | 월 대여 Mac Mini M4(KVMNODE) |
|---|---|---|---|
| 7×24 | 덮개 닫으면 중단 | 유지보수 재시작 잦음 | 전용 + launchd |
| macOS / Metal | 예 | 아니오 | 공식 경로 |
| 3계층 메모리 | 디스크 가능 | 연속성 약함 | 3계층 + 안정 cron |
| 도구 지연 | 최저 | RTT | 6리전 |
| 24개월 TCO | 구매 감가 | 저월요금+운영 | 고정 OpEx |
3계층 메모리는 소프트웨어 설계, 상시 가동 Mac Mini는 7×24 복리의 전원입니다.
Agent가 원격 Git 저장소를 자주 수정하면 호스트의 shell 지연과 DNS가 모델만큼 중요합니다. Git 리모트와 API 출구에 가까운 전용 Mac Mini는 다단계 도구 체인 왕복을 줄입니다. 야간 발행 Skill을 돌리는 크리에이터일수록 차이가 큽니다. 저소음 7×24 운전은 Episodic 타임스탬프를 신뢰 가능하게 유지합니다.
구매 vs 월 대여 24개월 + KVMNODE Hermes 6단계
가격은 요금 페이지 기준입니다. 24개월 관점에서 숨은 비용은 다운타임입니다. Gateway가 잠든 밤마다 Skill 복리와 Episodic 리콜이 멈춥니다. 위 구매 vs 월 대여 표를 VPS 견적과 함께 아키텍처 리뷰에 넣으세요. KVMNODE 월 대여는 CapEx를 고정 OpEx로 바꾸고, 계약 중 24GB·리전 변경이 가능합니다.
| 24개월 | 구매 | 월 대여 |
|---|---|---|
| 현금흐름 | 일시불+전기 | 고정 월요금 |
| 업그레이드 | 재구매 | 24GB·리전 변경 |
| Hermes 상태 | 자체 백업 | ~/.hermes/ 동일 경로 scp |
| 리스크 | 수리·세대 | 반납 전 삭제 |
주문: 주문 페이지에서 16GB·256 또는 24GB·512.
SSH: iCloud 동기화 외 디스크, ~/.hermes/ 공간 확보.
설치: curl -fsSL https://get.hermes-agent.org | bash, hermes gateway install.
이전: tar czf hermes-backup.tgz -C ~ .hermes scp.
채널: hermes channels login, cron hermes doctor.
반납 삭제: tarball 후 rm -rf ~/.hermes.
참고: 공식 클라우드 동기화 없음. SSH는 고객 센터.
5단계에서는 cron으로 매일 hermes doctor를 돌려 토큰 만료·유지보수 후 webhook 오류를 조기에 잡습니다. OpenClaw 헬스 프로브와 같은 운영 규율입니다. 이전 후 구 토큰을 폐기해 이중 Gateway가 메시지를 가로채지 않게 하세요.
인용 데이터, 독자별 선택, 월 대여 결론
① 2026년 2월 MIT 공개. ② 기억은 ~/.hermes/ 로컬, 텔레메트리 없음. ③ Skill 절차 재사용이 운영·콘텐츠 파이프라인에 유리.
개발자 API만 16GB, 로컬 Hermes-3는 24GB. 크리에이터 안정성 우선. 연구자 SQLite·디스크 여유.
대안: 가끔 켜는 노트북은 파일만 늘고 Gateway는 오프라인, 장기 저가 VPS는 월요금은 낮지만 Linux 호환·RTT 비용, Mac Mini 구매는 CapEx·세대 리스크를 직접 부담합니다. KVMNODE Mac Mini M4 월 전용 대여는 macOS에서 3계층이 7×24 복리화되고 ~/.hermes/ 이전·반납 전 삭제가 가능합니다.
OpenClaw 등 다른 상시 Gateway와 비교해도 프로세스 연속성을 먼저, 모델 비용을 다음에 둡니다. 3계층 설계는 주말 튜닝보다 수개월 안정 가동에 보상됩니다. 협업자에 가까운 리전에서 Mac Mini를 빌려 ~/.hermes/를 한 번 옮기고 채널을 연결한 뒤 Skill을 쌓고 구매를 결정하세요.
주문 전 체크리스트: ① Git 리모트·API에 가까운 리전, ② 로컬 모델 여부에 따른 16/24GB, ③ ~/.hermes/ 백업, ④ hermes doctor cron, ⑤ 이전 후 토큰 폐기. KVMNODE는 전용 베어메탈 Mac을 예측 가능한 OpEx로 제공합니다. 요금과 고객 센터를 확인하세요.
Hermes와 Xcode CI를 같은 머신에 둘 계획이면 스토리지·메모리 가이드를, 리전·계약은 6리전 가이드를 함께 보세요. Episodic 성장과 로컬 모델 병행 시 24GB가 안전 마진인 경우가 많습니다.
기업 환경에서는 USER.md·Episodic에 개인 맥락이 남을 수 있음을 내부 문서에 적고, SSH 접근 권한과 반납 전 ~/.hermes/ 삭제 절차를 runbook에 포함하세요. 아키텍처 리뷰가 끝나면 주문 페이지에서 바로 시작하고, 이어서 6단계 체크리스트를 따르세요.