# Session Resume — 2026-06-01 (Reprise après crash) ## Objectif Reprendre la session précédente qui a planté. Commits, sauvegardes, état des lieux infrastructure. ## Actions réalisées ### 1. État des lieux infrastructure - **86 conteneurs** Docker au total - **82 UP**, **4 en restart loop**, **2 Exited** ### 2. Problèmes identifiés | Conteneur | Statut | Problème | Solution | |-----------|--------|----------|----------| | kafka-1, kafka-2 | Restarting | `zookeeper.connect` manquant | Ajouter ZK conn string | | trino | Restarting (100) | `node.environment` null | Ajouter `node.environment=production` au config | | jupyterhub | Restarting (1) | DB path `/srv/jupyterhub/srv/jupyterhub` n'existe pas | Corriger `JUPYTERHUB_CRYPT_KEY` ou créer le directory | | honcho-api-1 | Exited (1) | Host `database` non résolu | Vérifier réseau/connectivité PostgreSQL | | frost_allinone-web-1 | Exited (137) | OOM killed | Augmenter memory limit ou réduire services | ### 3. Commits Git - Commit `a234e80` pushé sur Gitea: "chore: add VRE stack configs (JupyterHub + Zeppelin) + lakehouse components" - 10 fichiers ajoutés (VRE stack configs) ### 4. Services opérationnels (UP ✅) - **Traefik** — reverse proxy principal - **OpenRemote** (manager, keycloak, postgresql) — tous healthy - **Grafana** (smart-city-grafana) → http://localhost:3001 - **InfluxDB** → http://localhost:8086 - **Simulateur** (smart-city-simulator) + **Telegraf** (smart-city-telegraf) - **Mosquitto** + **BunkerM** (bunkerm-bunkerm-1) - **Contexus** (app unhealthy, postgres+redis healthy) - **ODK Central** (nginx+service+postgres) — tous UP - **MindsDB** (mindsdb+postgres+autoheal) — tous healthy - **MapStore** (proxy+app+postgres) - **GeoServer** (geoserver_stack-geoserver-1) healthy - **PostGIS** (postgis-smartcity) healthy - **EMQX** (emqx_emqx_1) UP - **Ditto** (policies+gateway+mongodb) UP - **ChirpStack** (4 conteneurs) UP - **FIWARE Orion** (orion+orionproxy+mongo) healthy - **Gitea** UP - **Stellio** (api-gateway) UP - **Node-RED** (digital-twin-nodered) healthy - **MinIO** healthy - **Superset** healthy - **Zeppelin** healthy - **Superset** healthy - **Gravitino** unhealthy (mais UP) - **Flink** (jobmanager+taskmanager) healthy - **Loki** + **Promtail** UP - **LocalAI** healthy - **PHPIPAM** UP - **Honcho** (deriver+prometheus+grafana) healthy ## Prochaine session - Corriger Kafka (zookeeper.connect) - Corriger Trino (node.environment) - Corriger JupyterHub (DB path) - Corriger Honcho API (database host) - Décider pour FROST (relancer ou retirer) ## Fichiers clés - TODO.md: `/home/eric/smart-city-digital-twin-martinique/TODO.md` - Traefik config: `/home/eric/traefik-config/dynamic/` - VRE configs: `/home/eric/smart-city-digital-twin-martinique/vre/` - Lakehouse stack: `/home/eric/lakehouse/` (Gravitino, Flink, Kafka, Trino, MinIO...)