Échelle à cinq commandements en 2026 : identifier qui court avant de blâmer les canaux
OpenClaw traite la passerelle comme le plan de contrôle permanent ; les assistants sont assis au-dessus. Les documents du fournisseur recommandent de commencer par openclaw status , puis par openclaw gateway status afin que le runtime, les cibles de sonde et les métadonnées du superviseur partagent une même histoire. Lorsque les ingénieurs lisent la sortie CLI verte alors que launchd fait toujours référence à un préfixe plus ancien après une bosse npm, vous héritez d'un cerveau divisé : le médecin réussit mais les sondes RPC échouent. Les images dorées gelées sur les Mac de location amplifient cette dérive car les préfixes globaux sont mis à jour une fois tandis que les chemins plist sont à la traîne.
Cet article promeut le premier écran de tout ticket d'incident vers six sorties : statut, statut de la passerelle, queue de journal limitée, médecin, sondes de canal, puis listes cron. Les canaux expliquent si l'entrée externe est prête ; cron explique si les lots nocturnes entrent en collision avec le trafic de pointe de l'assistant. Cron n'est pas une anecdote facultative : c'est le deuxième tableau de bord manquant que les articles sur la stabilité ignorent.
L'ordre fixe est important car il attribue des limites de blâme : la première couche prouve le processus plus la poignée de main RPC ; la deuxième couche prouve l’alignement des superviseurs ; la couche trois isole les canaux et les programmes. Les équipes qui passent aux échanges de modèles avant de terminer le statut de passerelle intègrent des solutions de contournement fragiles dans les runbooks.
Les cinq pièges ci-dessous restent interdits jusqu'à ce que les horodatages associent chaque observation à des étiquettes de file d'attente plutôt qu'à des anecdotes de discussion.
Ignorer l'état de la passerelle pour les canaux : les canaux rouges peuvent simplement signifier que rien n'écoute sur la liaison attendue ; les boucles de réauthentification amplifient le bruit.
Ignorer les journaux avant de régler la température : les collisions de ports apparaissent déjà dans les journaux pendant que les opérateurs modifient les boutons d'échantillonnage.
Traiter le docteur vert comme une preuve de parité : le médecin valide la friction du schéma, pas la parité plist-binaire.
Ignorer la liste cron : le résumé nocturne peut chevaucher les pics de conversation, de sorte que les échecs semblent aléatoires pendant la journée uniquement.
Blâmer le WAN lorsque les sondes distantes échouent : gateway.mode=remote avec la mauvaise URL maintient le Runtime en bon état tandis que les sondes ne réussissent jamais.
Si l'intégration n'est jamais terminée, revenez à la liste de contrôle d'installation ; si les politiques de pulsation sont importantes, lisez l'article 24h/24 et 7j/7. Cette pièce suppose un succès intermittent et vise une répétabilité du jour au lendemain.
Matrices : exécution du runtime par rapport aux fourches de sonde RPC
L'état de la passerelle fusionne la vérité du Runtime avec la vérité de la Connectivité. Lorsqu'ils divergent, suivez la matrice au lieu de redémarrer la roulette. La stratégie de jeton Bind plus appartient à l'article de mise à niveau ; ici, nous ne prolongeons que les fourches.
Lorsque les sondes échouent mais que le bouclage semble sain, vérifiez quelle URL la sonde cible par rapport à quelle adresse la liaison expose : le mode distant peut sonder les points de terminaison distants pendant que le service écoute toujours localement.
| Paire d'observations | Suspecter d'abord | Prochain coup |
|---|---|---|
| L'exécution s'est arrêtée | gateway.mode manquant, blocs de schéma | journaux de queue → docteur |
| Runtime en cours d'exécution · échec de la sonde | conflit de port, inadéquation de liaison, dérive de jeton | échantillon lsof → vérifier l'URL de liaison par rapport à la sonde → état de la passerelle --deep |
| Sonde ok · canaux malsains | appariement, expiration des informations d'identification, limites des fournisseurs | état des canaux --probe |
| Chaînes ok · échecs chronométrés | collisions cron | liste cron vs fenêtres de fuseau horaire |
| Indice de journal | Meaning | Réponse |
|---|---|---|
| Démarrage de la passerelle bloqué : définissez gateway.mode=local | mode désarmé | mode de restauration ou réexécution à bord |
| refuser de lier... sans autorisation | le non-bouclage manque de jeton | définir un jeton ou annuler le bouclage plus le tunnel |
| EADDRINUSE | auditeur errant | effacer le port puis réfléchir à la réinstallation forcée |
Fermez le Runtime et les sondes avant d'ouvrir les canaux et cron ; l'ordre empêche les tempêtes de nouvelles tentatives de se faire passer pour des délais d'attente du renseignement.
Sur les nœuds de Singapour ou de l'ouest des États-Unis dotés d'une mémoire unifiée de classe M4 Pro, le bruit Xcode peut chevaucher les rafales de l'assistant ; allonger les échantillons de journaux plutôt que de mélanger les pics de GC avec des échecs de poignée de main.
Lorsque des sessions interactives partagent du matériel avec des lots cron nocturnes, annotez les phases de charge de travail dans la matrice afin que les échecs transitoires des sondes remontent aux planifications plutôt qu'aux rotations de clés d'urgence.
Split brain : quel openclaw.json lit la CLI par rapport au service
La documentation avertit lorsque les binaires les plus récents tamponnent les configurations alors que les anciens superviseurs refusent les correctifs destructeurs. Comparez pratiquement quel openclaw avec plist ProgramArguments , confirmez les répertoires d'état partagés entre les shells et launchd et lisez les journaux pour les incompatibilités de méta-version. Alignez d'abord PATH, puis comptez sur gateway install --force pour réécrire les métadonnées du superviseur, et non sur les boucles de réinstallation aveugles de npm.
Extrait d'échelle facile à coller : échangez les ports et les profils pour votre locataire.
openclaw status openclaw gateway status openclaw gateway status --deep openclaw logs --follow openclaw doctor openclaw channels status --probe openclaw cron status && openclaw cron list
Remarque : exécutez gateway install --force uniquement une fois la parité binaire prouvée ; la FAQ sur la mise à niveau explique les limites.
Les liaisons sans bouclage pour les tunnels exigent toujours des jetons ainsi que des tickets de pare-feu : l'accessibilité SSH à elle seule ne constitue pas un facteur de santé de la passerelle.
Les rétrospectives de production doivent capturer les horodatages de début et de fin pour chaque exemple de fenêtre afin que les échecs d'authentification intermittents se séparent des conflits de port persistants ; les tickets manquant d’horodatage ne devraient pas dégénérer.
Six étapes pour les listes de contrôle des quarts de travail au cimetière
Geler les fenêtres : écrivez des intervalles d'échantillonnage tenant compte du fuseau horaire.
Exécutez les étapes un à quatre du ladder : collez les résultats dans le ticket.
Sondes de canal : stockez du texte ou des captures d'écran à côté de la sortie de la passerelle.
Alignement Cron : comparez la liste Cron avec les tables de pointe et attribuez des propriétaires.
Parité binaire : enregistrez les chemins openclaw --version par rapport aux chemins plist.
Clôture des modifications : capturez les modifications de SKU via la page de commande pour l'alignement financier.
Les transferts couvrant les équipes de soir de l'APAC et des États-Unis devraient enregistrer la progression de l'échelle afin que l'équipe suivante reprenne sur les canaux ou cron au lieu de répéter aveuglément la première étape.
Faits citables : port par défaut, sondes, discipline cron
Port multiplex par défaut : centres de tri communautaire sur les auditeurs de classe 18 789 ; libérez le port avant de débattre des réinstallations forcées.
Sémantique des sondes : les sondes RPC valident les chemins d'établissement de liaison indépendamment de l'état de préparation du canal ; les deux doivent réussir.
Observabilité Cron : les listes de planification appartiennent à côté des limites de débit en amont dans les runbooks.
Attention : exposer Gateway sans authentification reste dangereux ; préférez le bouclage et les tunnels SSH selon le guide de mise à niveau.
Lorsque les runbooks associent des sorties d'échelle aux systèmes de modification, les auditeurs examinent les chaînes de preuves reproductibles au lieu des décomptes de redémarrages anecdotiques.
Les ordinateurs portables locaux luttent contre le sommeil, les verrouillages de dossiers de synchronisation et le Wi-Fi irrégulier ; Les locations sans système d'exploitation dans toutes les métropoles permettent aux SSH, à la bande passante et aux fenêtres de location de vivre dans le langage des achats. Les équipes qui ont besoin de plans de contrôle fiables et de boucles d'observabilité prévisibles trouvent généralement la location de Mac mini dans le cloud KVMNODE la meilleure solution : Apple Silicon dédié, régions explicites et baux qui suivent les phases du projet.