Exploitation de mes données météo

2025-11-26 23:51:23 +01:00
parent 9a55414245
commit bf500c183a
194 changed files with 1933 additions and 0 deletions
--- a/content/interets/meteorologie/2025/11/26/00-introduction/data/images/cover.yaml
+++ b/content/interets/meteorologie/2025/11/26/00-introduction/data/images/cover.yaml
@@ -0,0 +1,4 @@
+#title: ""
+attribution: "ChatGPT 5.1"
+#description: ""
+prompt: "2D digital illustration in a flat, clean style, very wide aspect ratio, showing a computer monitor in the center displaying colorful overlapping weather data graphs, with a small sun and cloud above the curves. Around the monitor, additional sheets with bar charts, scatter plots and contour lines, a Python logo and simple code symbols, and a small weather station anemometer. Soft pastel colors, light blue background suggesting sky, no text anywhere, high resolution."
--- a/content/interets/meteorologie/2025/11/26/00-introduction/images/cover.png
+++ b/content/interets/meteorologie/2025/11/26/00-introduction/images/cover.png
--- a/content/interets/meteorologie/2025/11/26/00-introduction/index.md
+++ b/content/interets/meteorologie/2025/11/26/00-introduction/index.md
@@ -0,0 +1,37 @@
+---
+title: "Introduction"
+dossier: ["Exploitation de mes données météo"]
+date: 2025-11-26T23:47:23
+cover: images/cover.png
+weight: 1
+---
+
+J'ai longtemps hésité à déterminer comment stocker mes données météo sur le long terme.
+Les données de [ma station](/interets/meteorologie/2023/09/15/mise-a-jour-de-ma-station-meteo/) sont ingérées par [Home Assistant](https://www.home-assistant.io/), qui n'est pas fait pour un tel stockage.
+En me renseignant sur la question, j'ai réalisé que, finalement, la question de la rétention des données sur le long terme était un sujet épineux...
+J'ai finalement décidé, en mars 2025, d'opter pour une base [InfluxDB2](https://influxdata.com/time-series-platform/influxdb/).
+
+Depuis ce jour, j'attends d'avoir assez de données pour pouvoir travailler un peu avec.
+En théorie, **on n'a jamais assez de données** !
+En tout cas, j'aurais peut-être pu attendre d'avoir une année complète, mais l'envie de jouer avec était plus forte...
+Ainsi est né ce dossier consacré à leur exploitation.
+
+Mes objectifs ici sont les suivants :
+
+- M'amuser à redécouvrir des principes physiques et météorologiques de base
+- M'amuser à produire des graphiques et les interpréter
+- Essayer de créer un petit modèle de prévisions
+- Jouer avec l'IA et python
+
+Et, en fil rouge, de montrer que **prévoir le temps dépend de beaucoup plus** que ce à quoi on a accès.
+
+Vous ne trouverez pas dans ce dossier un véritable travail scientifique.
+C'est une **friandise intellectuelle**, et non une étude sérieuse.
+
+Chaque chapitre fait référence à du code python que [je mets à disposition](https://git.dern.ovh/richard/donnees_meteo).
+Vous êtes **libres** de télécharger, étudier et exploiter ce code.
+Je ne le place explicitement sous aucune licence.
+Bonne lecture !
+
+> J'ai utilisé ChatGPT 5.1 Codex Max, profil _High_ pour m'assister dans la rédaction du code python, et ChatGPT 5.1, profil _High_ pour m'assister dans la rédaction du texte.
+> Bien que je le mentionne explicitement dans [mon manifeste](/manifeste/), j'estime important de le re-préciser spécifiquement ici.
--- a/content/interets/meteorologie/2025/11/26/01-installation-configuration-et-tests/index.md
+++ b/content/interets/meteorologie/2025/11/26/01-installation-configuration-et-tests/index.md
@@ -0,0 +1,224 @@
+---
+title: "Installation, configuration et tests"
+dossier: ["Exploitation de mes données météo"]
+date: 2025-11-26T22:57:23
+weight: 10
+---
+
+## Installation de l'environnement de base
+
+Après avoir cloné le [dépôt](https://git.dern.ovh/richard/donnees_meteo), on commence par préparer un environnement Python isolé pour ne pas polluer le système global et pouvoir supprimer facilement tout ce qui concerne ce projet.
+L’idée est de regrouper au même endroit le moteur [`Python`](https://www.python.org/), les bibliothèques scientifiques et le client pour la base de données [`InfluxDB`](https://www.influxdata.com/), qui stocke nos séries temporelles.
+
+```shell
+python3 -m venv .venv
+source .venv/bin/activate
+python -m pip install --upgrade pip
+pip install -r requirements.txt
+python -c "import pandas, influxdb_client, sklearn; print('OK')"
+```
+
+- `python3 -m venv .venv` crée un environnement virtuel Python local dans le dossier `.venv`, ce qui permet d’isoler les paquets de ce projet du reste du système (voir par exemple la documentation sur les environnements virtuels [`venv`](https://docs.python.org/fr/3/library/venv.html)).
+- `source .venv/bin/activate` active cet environnement dans le shell courant ; tant qu’il est actif, la commande `python` pointera vers l’interpréteur de `.venv` et non vers celui du système.
+- `python -m pip install --upgrade pip` met à jour [`pip`](https://pip.pypa.io/), le gestionnaire de paquets de Python, afin d’éviter les bugs ou limitations des versions trop anciennes.
+- `pip install -r requirements.txt` installe toutes les dépendances nécessaires au projet (notamment [`pandas`](https://pandas.pydata.org/), le client Python pour InfluxDB et [`scikit-learn`](https://scikit-learn.org/stable/) pour les modèles prédictifs) en suivant la liste déclarée dans `requirements.txt`.
+- `python -c "import pandas, influxdb_client, sklearn; print('OK')"` vérifie que les principales bibliothèques s’importent correctement ; si la commande affiche `OK`, l’environnement de base est prêt à être utilisé.
+
+## Configuration
+
+```shell
+cp .env.example .env
+```
+
+On copie le fichier de configuration d'exemple, puis on l'ouvre pour l'adapter à notre cas. Ce fichier `.env` sera lu automatiquement par les scripts via [`python-dotenv`](https://github.com/theskumar/python-dotenv) (voir `meteo/config.py`), ce qui évite d’exporter les variables à la main à chaque session.
+
+- `INFLUXDB_URL` : URL de l'API du serveur InfluxDB 2.x (incluant généralement le port 8086), par exemple `http://localhost:8086` ou l’adresse de votre serveur ; c’est le point d’entrée HTTP/HTTPS vers votre base de données de séries temporelles (voir aussi l’introduction aux [bases de données de séries temporelles](https://fr.wikipedia.org/wiki/Base_de_donn%C3%A9es_de_s%C3%A9ries_temporelles)).
+- `INFLUXDB_TOKEN` : jeton d'authentification généré dans l’interface d’[`InfluxDB 2.x`](https://docs.influxdata.com/influxdb/v2/), associé à un jeu de permissions (lecture/écriture) ; sans ce token, le client Python ne peut pas interroger le serveur.
+- `INFLUXDB_ORG` : nom de l'organisation InfluxDB à laquelle le token est rattaché ; InfluxDB 2.x organise les ressources (utilisateurs, buckets, tokens) par organisation, il faut donc préciser celle que l’on souhaite utiliser.
+- `INFLUXDB_BUCKET` : nom du bucket (espace logique de stockage avec sa politique de rétention) dans lequel les données sont enregistrées ; c’est ce bucket que les scripts interrogeront pour récupérer les mesures de la station.
+- `STATION_LATITUDE` : latitude GPS de la station météo (en degrés décimaux), utilisée plus loin pour les calculs d’élévation solaire et pour enrichir les données avec des métadonnées astronomiques.
+- `STATION_LONGITUDE` : longitude GPS de la station météo (en degrés décimaux), nécessaire pour les mêmes raisons que la latitude.
+- `STATION_ELEVATION` : altitude de la station météo (en mètres au-dessus du niveau de la mer) ; cette information affine légèrement certains calculs physiques, mais reste optionnelle si l’altitude est mal connue.
+
+## Tests de l'environnement de travail
+
+Avant d’attaquer des analyses plus lourdes, on vérifie que la connexion au serveur InfluxDB fonctionne bien et que la configuration est cohérente.
+Les scripts de test qui suivent n’écrivent rien dans la base : ils se contentent d’effectuer quelques requêtes simples pour valider l’accès.
+
+```shell
+python "docs/01 - Installation, configuration et tests/scripts/test_influx_connection.py"
+```
+
+```text
+Configuration InfluxDB chargée :
+  URL    : 
+  Org    : Dern
+  Bucket : weather
+
+→ Ping du serveur InfluxDB…
+✔ Ping OK
+→ Requête de test sur le bucket…
+✔ Requête de test réussie : 18 table(s), 58 enregistrement(s) trouvés.
+Exemple de point :
+  time      : 2025-11-16 22:30:50.263360+00:00
+  measurement : %
+  field     : device_class_str
+  value     : humidity
+```
+
+Si vous obtenez un résultat similaire (URL affichée, ping OK, requête de test qui retourne quelques enregistrements), c’est que le serveur InfluxDB est joignable, que le token est valide et que le bucket indiqué existe bien.
+
+Ensuite, on peut demander à InfluxDB de nous détailler ce qu'il stocke :
+
+```shell
+python "docs/01 - Installation, configuration et tests/scripts/test_influx_schema.py"
+```
+
+```text
+Bucket InfluxDB : weather
+
+Measurements disponibles :
+  - %
+  - hPa
+  - km/h
+  - lx
+  - mm/h
+  - °
+  - °C
+
+Champs pour measurement « % » :
+  - device_class_str (type: unknown)
+  - friendly_name_str (type: unknown)
+  - state_class_str (type: unknown)
+  - value (type: unknown)
+
+Champs pour measurement « hPa » :
+  - device_class_str (type: unknown)
+  - friendly_name_str (type: unknown)
+  - state_class_str (type: unknown)
+  - value (type: unknown)
+
+Champs pour measurement « km/h » :
+  - device_class_str (type: unknown)
+  - friendly_name_str (type: unknown)
+  - state_class_str (type: unknown)
+  - value (type: unknown)
+
+Champs pour measurement « lx » :
+  - device_class_str (type: unknown)
+  - friendly_name_str (type: unknown)
+  - value (type: unknown)
+
+Champs pour measurement « mm/h » :
+  - device_class_str (type: unknown)
+  - friendly_name_str (type: unknown)
+  - state_class_str (type: unknown)
+  - value (type: unknown)
+
+Champs pour measurement « ° » :
+  - friendly_name_str (type: unknown)
+  - value (type: unknown)
+
+Champs pour measurement « °C » :
+  - device_class_str (type: unknown)
+  - friendly_name_str (type: unknown)
+  - state_class_str (type: unknown)
+  - value (type: unknown)
+```
+
+Ce deuxième script interroge le schéma du bucket : il liste les _measurements_ (grandeurs physiques comme `%`, `°C`, `km/h`, etc.), ainsi que les champs associés à chacun.
+Dans InfluxDB, un _measurement_ correspond en gros à un type de mesure (par exemple une unité), et les _fields_ contiennent les valeurs numériques que l’on exploitera plus tard ; les metadata (comme `entity_id`) sont stockées sous forme de _tags_ (voir la documentation sur le [modèle de données InfluxDB](https://docs.influxdata.com/influxdb/v2/reference/key-concepts/data-elements/)).
+
+Mais pour obtenir les données dont on a besoin, il faut aussi connaitre les entités manipulées par Influx :
+
+```shell
+python "docs/01 - Installation, configuration et tests/scripts/test_influx_entities.py"
+```
+
+```text
+Bucket InfluxDB : weather
+
+Measurement « % »
+  Tag keys :
+    - _field
+    - _measurement
+    - _start
+    - _stop
+    - domain
+    - entity_id
+  entity_id possibles :
+    - station_meteo_bresser_exterieur_humidite_relative
+
+Measurement « hPa »
+  Tag keys :
+    - _field
+    - _measurement
+    - _start
+    - _stop
+    - domain
+    - entity_id
+  entity_id possibles :
+    - station_meteo_bresser_exterieur_pression_atmospherique
+
+Measurement « km/h »
+  Tag keys :
+    - _field
+    - _measurement
+    - _start
+    - _stop
+    - domain
+    - entity_id
+  entity_id possibles :
+    - station_meteo_bresser_exterieur_vitesse_du_vent
+
+Measurement « lx »
+  Tag keys :
+    - _field
+    - _measurement
+    - _start
+    - _stop
+    - domain
+    - entity_id
+  entity_id possibles :
+    - station_meteo_bresser_exterieur_luminance
+
+Measurement « mm/h »
+  Tag keys :
+    - _field
+    - _measurement
+    - _start
+    - _stop
+    - domain
+    - entity_id
+  entity_id possibles :
+    - station_meteo_bresser_exterieur_precipitations
+
+Measurement « ° »
+  Tag keys :
+    - _field
+    - _measurement
+    - _start
+    - _stop
+    - domain
+    - entity_id
+  entity_id possibles :
+    - station_meteo_bresser_exterieur_direction_du_vent
+
+Measurement « °C »
+  Tag keys :
+    - _field
+    - _measurement
+    - _start
+    - _stop
+    - domain
+    - entity_id
+  entity_id possibles :
+    - station_meteo_bresser_exterieur_temperature
+```
+
+Ce dernier script fait le lien avec la source des données : il dresse la liste des clés de tags et des `entity_id` possibles pour chaque _measurement_.
+Ces identifiants correspondent aux entités exposées par votre système domotique (par exemple [`Home Assistant`](https://www.home-assistant.io/)), et permettent de distinguer clairement l’humidité extérieure, la pression, la vitesse du vent, etc.
+
+Ces informations combinées se retrouvent dans le fichier `meteo/station_config.py` et dans `meteo/variables.py` : c’est là que l’on fixe, une fois pour toutes, quelles entités InfluxDB seront considérées comme « température extérieure », « pluie », « vent », et sous quels noms elles seront manipulées dans la suite de l’étude.
+
+On aurait pu se passer de ces scripts pour déterminer la structure des données stockées dans Influx, mais ils évitent de se reposer sur des intuitions : ici, on demande à Influx de nous donner les informations dont on va avoir besoin au lieu de les deviner.
--- a/content/interets/meteorologie/2025/11/26/02-preparation-des-donnees/index.md
+++ b/content/interets/meteorologie/2025/11/26/02-preparation-des-donnees/index.md
@@ -0,0 +1,291 @@
+---
+title: "Préparation des données"
+dossier: ["Exploitation de mes données météo"]
+date: 2025-11-26T22:57:24
+weight: 20
+---
+
+Cette étape regroupe l'export initial depuis InfluxDB ainsi que les scripts d'ajustement nécessaires pour obtenir un dataset minuté propre, c’est‑à‑dire une [série temporelle](https://fr.wikipedia.org/wiki/S%C3%A9rie_temporelle) où chaque minute possède une observation complète pour toutes les variables utiles.
+L’objectif est de passer d’un format brut, pensé pour la domotique temps réel, à un format tabulaire lisible par les bibliothèques d’analyse comme `pandas`.
+
+## Export des données
+
+```shell
+python "docs/02 - Préparation des données/scripts/export_station_data.py"
+```
+
+Ce script se connecte au serveur InfluxDB configuré au chapitre précédent, interroge les mesures de la station sur une fenêtre récente (par défaut les sept derniers jours) et les exporte dans un fichier CSV `data/weather_raw_7d.csv`.
+On quitte ainsi la base de données de séries temporelles pour un format beaucoup plus simple à manipuler avec `pandas`, tout en conservant l’horodatage précis.
+
+La sortie est assez longue, et inclut un certain nombre d'avertissements qui peuvent être ignorés.
+L'important est que le script se termine sur :
+
+```text
+✔ Export terminé : /Users/richard/Documents/donnees_meteo/data/weather_raw_7d.csv
+```
+
+(Le chemin changera sur votre propre machine)
+
+Vérifiez que le fichier est bien créé et qu'il contient des données.
+
+À la place de `export_station_data.py`, on peut aussi lancer :
+
+```shell
+python "docs/02 - Préparation des données/scripts/export_station_data_full.py"
+```
+
+Au lieu de télécharger les données des sept derniers jours, l'ensemble des données stockées sur le serveur pour ce _bucket_ seront téléchargées, ce qui, selon la granularité et l'ancienneté des données, peut prendre un certain temps et occuper un espace disque conséquent.
+Mon fichier complet contient plus d'un million d'enregistrements et pèse 70 Mo.
+
+En pratique, il est souvent plus confortable de développer et tester les scripts suivants sur quelques jours de données (fichier `weather_raw_7d.csv`), puis de relancer le pipeline complet sur l’historique complet une fois les étapes stabilisées.
+Les deux scripts s’appuient sur l’API HTTP d’[InfluxDB 2.x](https://docs.influxdata.com/influxdb/v2/) et son langage de requête Flux (voir la documentation dédiée à [Flux](https://docs.influxdata.com/flux/v0.x/)).
+
+## Ajustements
+
+Le CSV exporté reste très proche du format de stockage utilisé par la domotique : chaque capteur envoie une mesure à des instants légèrement différents, et InfluxDB stocke donc plusieurs lignes par seconde, chacune ne contenant qu’une seule variable renseignée.
+Pour l’analyse statistique, on cherche au contraire à obtenir une table où chaque horodatage regroupe toutes les variables de la station sur une grille temporelle régulière.
+
+Le fichier peut être rapidement inspecté avec la commande `head` :
+
+```shell
+head data/weather_raw_full.csv
+```
+
+```text
+time,temperature,humidity,pressure,illuminance,wind_speed,wind_direction,rain_rate
+2025-03-10 09:35:23.156646+00:00,,,996.95,,,,
+2025-03-10 09:35:23.158538+00:00,10.6,,,,,,
+2025-03-10 09:35:23.162398+00:00,,83.0,,,,,
+2025-03-10 09:35:23.164634+00:00,,,,,7.4,,
+2025-03-10 09:35:23.170122+00:00,,,,,,256.0,
+2025-03-10 09:35:23.183555+00:00,,,,,,,0.0
+2025-03-10 09:35:41.211148+00:00,,,,20551.2,,,
+2025-03-10 09:36:22.638255+00:00,,,,,12.2,,
+2025-03-10 09:36:22.640356+00:00,,,,,,306.0,
+```
+
+On peut voir que [Home Assistant](https://www.home-assistant.io/) écrit une nouvelle entrée pour chaque capteur, alors qu'on aurait pu s'attendre à une ligne unique pour l'ensemble des capteurs.
+C’est un format très pratique pour la collecte temps réel, mais moins confortable pour l’analyse : il faut d’abord tout remettre en forme.
+
+Le script suivant s'occupe de regrouper les données de capteurs dont l'enregistrement est proche :
+
+```shell
+python "docs/02 - Préparation des données/scripts/format_raw_csv.py"
+```
+
+```text
+Fichier brut chargé : data/weather_raw_full.csv
+  Lignes : 1570931, colonnes : ['temperature', 'humidity', 'pressure', 'illuminance', 'wind_speed', 'wind_direction', 'rain_rate']
+  Type d'index : <class 'pandas.core.indexes.datetimes.DatetimeIndex'>
+Après combinaison (1s) : 630171 lignes
+✔ Fichier formaté écrit dans : /Users/richard/Documents/donnees_meteo/data/weather_formatted_1s.csv
+```
+
+Un nouveau document CSV intermédiaire est donc créé.
+On voit que l’on passe d’environ 1,57 million de lignes à 630 000 lignes « combinées » : le script regroupe les mesures de tous les capteurs tombant dans la même seconde, en utilisant l’horodatage comme clé.
+L’index de type `DatetimeIndex` indiqué dans la sortie est l’axe temporel standard de `pandas` (voir la documentation de [`pandas.DatetimeIndex`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DatetimeIndex.html)).
+Cette étape correspond à une première forme de rééchantillonnage temporel, classique lorsqu’on prépare une série pour l’analyse.
+
+```shell
+head data/weather_formatted_1s.csv
+```
+
+```text
+time,temperature,humidity,pressure,illuminance,wind_speed,wind_direction,rain_rate
+2025-03-10 09:35:23+00:00,10.6,83.0,996.95,,7.4,256.0,0.0
+2025-03-10 09:35:41+00:00,,,,20551.2,,,
+2025-03-10 09:36:22+00:00,,,,20247.6,12.2,306.0,
+2025-03-10 09:36:52+00:00,,,,20199.6,9.3,246.0,
+2025-03-10 09:37:22+00:00,,,,20034.0,7.9,,
+2025-03-10 09:37:52+00:00,,,,20124.0,7.4,284.0,
+2025-03-10 09:38:22+00:00,,,,19860.0,9.7,215.0,
+2025-03-10 09:39:22+00:00,,,,19722.0,11.4,203.0,
+2025-03-10 09:40:22+00:00,,,,19720.8,10.0,209.0,
+```
+
+Il reste des cellules vides : en effet, Home Assistant n'enregistre pas la valeur d'un capteur si elle n'a pas changé depuis la dernière fois.
+On se retrouve donc avec une série temporelle à pas régulier (1 s), mais encore parsemée de trous.
+
+On fait donc :
+
+```shell
+python "docs/02 - Préparation des données/scripts/fill_formatted_1s.py"
+```
+
+```text
+Fichier 1s formaté chargé : data/weather_formatted_1s.csv
+  Lignes : 630171, colonnes : ['temperature', 'humidity', 'pressure', 'illuminance', 'wind_speed', 'wind_direction', 'rain_rate']
+Après propagation des dernières valeurs connues : 630171 lignes
+✔ Fichier 1s 'complet' écrit dans : /Users/richard/Documents/donnees_meteo/data/weather_filled_1s.csv
+```
+
+Cette seconde passe applique un remplissage par propagation de la dernière valeur connue (_forward fill_ ou `ffill` dans `pandas`) : tant qu’un capteur ne publie pas de nouvelle mesure, on considère que la précédente reste valable. C’est une hypothèse raisonnable pour des variables relativement lisses comme la température ou la pression, moins pour des phénomènes très brusques ; l’objectif ici est surtout d’obtenir un _dataset_ sans [valeurs manquantes](https://fr.wikipedia.org/wiki/Donn%C3%A9es_manquantes), ce qui simplifie grandement les analyses et les modèles dans les chapitres suivants.
+
+## Enrichissements (saisons et position du soleil)
+
+Une fois les données nettoyées, on peut les enrichir avec des métadonnées météorologiques simples, qui aideront ensuite à interpréter les graphiques et à construire des modèles plus pertinents :
+
+- regrouper les points par minute, pour lisser légèrement le bruit tout en restant réactif ; ce pas de 60 secondes est un bon compromis entre fidélité au signal brut et taille raisonnable du _dataset_ ;
+- ajouter la saison correspondant à chaque observation (en fonction de l'hémisphère), ce qui permet de comparer facilement les comportements printemps/été/automne/hiver et de relier nos courbes aux notions classiques de [saisons](https://fr.wikipedia.org/wiki/Saison) en météorologie ;
+- calculer la hauteur du soleil si la latitude/longitude de la station sont configurées, afin de disposer d’une estimation de l’élévation solaire au‑dessus de l’horizon (jour/nuit, midi solaire, etc.) en s’appuyant sur la bibliothèque d’astronomie [`astral`](https://astral.readthedocs.io/).
+
+Ces opérations sont réalisées par :
+
+```shell
+python "docs/02 - Préparation des données/scripts/make_minutely_dataset.py"
+```
+
+Le script produit `data/weather_minutely.csv`. Chaque ligne de ce fichier correspond à une minute, avec toutes les variables météo alignées (température, humidité, pression, vent, pluie, etc.) et, si les coordonnées de la station sont connues, des colonnes supplémentaires comme la saison et l’élévation du soleil.
+
+> Pensez à définir `STATION_LATITUDE`, `STATION_LONGITUDE` et `STATION_ELEVATION` dans votre `.env` pour permettre le calcul de la position du soleil ; sinon, seule la colonne `season` sera ajoutée.
+
+Ce fichier minuté est le jeu de données de référence utilisé dans la majorité des chapitres suivants.
+
+## Pipeline simplifié
+
+Un script tout simple permet de faire automatiquement tout ce qu'on vient de voir, dans le bon ordre, sans avoir à lancer chaque étape à la main.
+Il supprime **tous** les fichiers CSV existants : il faudra donc relancer la génération des images dans les étapes suivantes pour qu'elles intègrent les nouvelles données.
+
+```shell
+python -m scripts.refresh_data_pipeline
+```
+
+Ce module Python orchestre l’export depuis InfluxDB, la mise en forme à 1 seconde, le remplissage des valeurs manquantes puis la construction du dataset minuté.
+Le fait de repartir de zéro à chaque exécution garantit que `weather_minutely.csv` reflète bien l’état actuel de la base, au prix d’un temps de calcul un peu plus long.
+
+## Vérification des données
+
+Avant d’explorer les graphiques ou de lancer des modèles, on vérifie que le dataset minuté est cohérent : pas de valeurs manquantes, des ordres de grandeur plausibles, et une grille temporelle effectivement régulière.
+On peut d’abord s'assurer que plus aucune information n'est manquante :
+
+```shell
+python "docs/02 - Préparation des données/scripts/check_missing_values.py"
+```
+
+```text
+Dataset chargé : data/weather_minutely.csv
+  Lignes   : 321881
+  Colonnes : ['temperature', 'humidity', 'pressure', 'illuminance', 'wind_speed', 'wind_direction', 'rain_rate']
+=== Synthèse des valeurs manquantes ===
+Total de cellules      : 2253167
+Cellules manquantes    : 0
+Fraction manquante     : 0.000000
+Lignes complètes       : 321881
+Lignes avec des trous  : 0
+Fraction lignes complètes : 1.000000
+
+Valeurs manquantes par colonne :
+  - temperature   : 0
+  - humidity      : 0
+  - pressure      : 0
+  - illuminance   : 0
+  - wind_speed    : 0
+  - wind_direction : 0
+  - rain_rate     : 0
+
+✔ Aucune valeur manquante dans le dataset minuté.
+```
+
+Ce premier contrôle confirme que toutes les lignes de `weather_minutely.csv` sont complètes : aucune cellule n’est manquante, ce qui évitera bien des subtilités dans les analyses ultérieures.
+
+Le script suivant nous permet de vérifier rapidement si des problèmes majeurs peuvent être découverts :
+
+```shell
+python "docs/02 - Préparation des données/scripts/describe_minutely_dataset.py"
+```
+
+```text
+Dataset minuté chargé : data/weather_minutely.csv
+  Lignes   : 321881
+  Colonnes : ['temperature', 'humidity', 'pressure', 'illuminance', 'wind_speed', 'wind_direction', 'rain_rate']                              Période  : 2025-03-10 09:35:00+00:00 → 2025-11-17 00:41:00+00:00
+
+=== describe() ===
+         temperature       humidity       pressure  ...     wind_speed  wind_direction      rain_rate
+count  321881.000000  321881.000000  321881.000000  ...  321881.000000   321881.000000  321881.000000
+mean       15.004488      74.131993    1010.683189  ...       2.877190      181.977411       0.108216
+std         6.349077      18.885843       8.210283  ...       3.151080       88.089334       0.820691
+min        -2.200000      20.000000     976.973123  ...       0.000000        0.000000       0.000000
+25%        10.277778      59.000000    1005.420000  ...       0.000000       96.000000       0.000000
+50%        14.600000      77.666667    1011.514287  ...       2.333549      210.000000       0.000000
+75%        19.000000      91.000000    1015.900000  ...       4.650000      247.666196       0.000000
+max        34.888889      99.000000    1033.187174  ...      26.554176      360.000000      42.672000
+
+[8 rows x 7 columns]
+
+=== Min / max avec dates ===
+- temperature:
+    min = -2.2 à 2025-03-17 05:16:00+00:00
+    max = 34.8888888888889 à 2025-07-02 15:59:00+00:00
+- humidity:
+    min = 20.0 à 2025-04-30 15:22:00+00:00
+    max = 99.0 à 2025-03-11 06:29:00+00:00
+- pressure:
+    min = 976.973122738378 à 2025-10-23 05:06:00+00:00
+    max = 1033.18717416804 à 2025-10-10 17:12:00+00:00
+- illuminance:
+    min = 0.0 à 2025-03-10 17:44:00+00:00
+    max = 133520.394 à 2025-07-29 11:48:00+00:00
+- wind_speed:
+    min = 0.0 à 2025-03-10 14:31:00+00:00
+    max = 26.554176 à 2025-06-26 00:10:00+00:00
+- wind_direction:
+    min = 0.0 à 2025-03-12 04:57:00+00:00
+    max = 360.0 à 2025-03-12 07:33:00+00:00
+- rain_rate:
+    min = 0.0 à 2025-03-10 09:35:00+00:00
+    max = 42.672 à 2025-06-15 03:10:00+00:00
+
+=== Vérification de la continuité temporelle ===
+Différences d'intervalle (top 5):
+time
+0 days 00:01:00    304291
+0 days 00:02:00      9426
+0 days 00:03:00      3562
+0 days 00:04:00      1740
+0 days 00:05:00      1142
+Name: count, dtype: int64
+
+Nombre d'intervalles ≠ 60s : 17589
+```
+
+Ce deuxième script fournit un aperçu statistique classique (fonction `describe()` de `pandas`) et quelques min/max datés pour chaque variable : on y vérifie que les valeurs restent plausibles (par exemple pas de température à +80 °C ni de vent négatif) et que les extrêmes correspondent à des dates réalistes.
+La section sur les différences d’intervalle permet déjà de repérer que certains pas ne sont pas strictement de 60 secondes, ce qui est courant sur des données issues de capteurs, mais qu’il faut garder en tête pour la suite.
+Ce type de contrôle s’inscrit dans une démarche d’[analyse exploratoire de données](https://fr.wikipedia.org/wiki/Analyse_exploratoire_de_donn%C3%A9es).
+
+Ces écarts peuvent être identifiés plus finement avec le script suivant :
+
+```shell
+python "docs/02 - Préparation des données/scripts/list_time_gaps.py"
+```
+
+```text
+Dataset minuté chargé : data/weather_minutely.csv
+  Lignes   : 321881
+
+=== Gaps temporels détectés ===
+Nombre de gaps        : 17589
+Total minutes manquantes (théoriques) : 40466
+
+Top 10 des gaps les plus longs :
+- De 2025-06-21 19:09:00+00:00 à 2025-06-21 20:10:00+00:00 (durée: 0 days 01:01:00, manquants: 60, de 2025-06-21 19:10:00+00:00 à 2025-06-21 20:09:00+00:00)
+- De 2025-08-10 22:17:00+00:00 à 2025-08-10 23:15:00+00:00 (durée: 0 days 00:58:00, manquants: 57, de 2025-08-10 22:18:00+00:00 à 2025-08-10 23:14:00+00:00)
+- De 2025-09-24 20:34:00+00:00 à 2025-09-24 21:32:00+00:00 (durée: 0 days 00:58:00, manquants: 57, de 2025-09-24 20:35:00+00:00 à 2025-09-24 21:31:00+00:00)
+- De 2025-06-21 10:58:00+00:00 à 2025-06-21 11:55:00+00:00 (durée: 0 days 00:57:00, manquants: 56, de 2025-06-21 10:59:00+00:00 à 2025-06-21 11:54:00+00:00)
+- De 2025-07-10 07:17:00+00:00 à 2025-07-10 08:14:00+00:00 (durée: 0 days 00:57:00, manquants: 56, de 2025-07-10 07:18:00+00:00 à 2025-07-10 08:13:00+00:00)
+- De 2025-07-24 03:52:00+00:00 à 2025-07-24 04:46:00+00:00 (durée: 0 days 00:54:00, manquants: 53, de 2025-07-24 03:53:00+00:00 à 2025-07-24 04:45:00+00:00)
+- De 2025-10-28 08:31:00+00:00 à 2025-10-28 09:23:00+00:00 (durée: 0 days 00:52:00, manquants: 51, de 2025-10-28 08:32:00+00:00 à 2025-10-28 09:22:00+00:00)
+- De 2025-03-16 15:31:00+00:00 à 2025-03-16 16:20:00+00:00 (durée: 0 days 00:49:00, manquants: 48, de 2025-03-16 15:32:00+00:00 à 2025-03-16 16:19:00+00:00)
+- De 2025-06-21 12:22:00+00:00 à 2025-06-21 13:08:00+00:00 (durée: 0 days 00:46:00, manquants: 45, de 2025-06-21 12:23:00+00:00 à 2025-06-21 13:07:00+00:00)
+- De 2025-06-21 17:25:00+00:00 à 2025-06-21 18:10:00+00:00 (durée: 0 days 00:45:00, manquants: 44, de 2025-06-21 17:26:00+00:00 à 2025-06-21 18:09:00+00:00)
+```
+
+Ce troisième script ne corrige rien : il se contente de lister précisément les intervalles dans lesquels des minutes manquent dans la série, ainsi que leur durée.
+Ces trous dans les données peuvent correspondre à des pannes de connexion entre la station et mon réseau, un redémarrage de mon serveur (physique ou logiciel), au redémarrage de la box ou du point d'accès sans‑fil, etc.
+Mais ils peuvent également correspondre aux modifications opérées dans les scripts précédents !
+
+Ces scripts sont intéressants parce qu'ils mettent en évidence des facteurs indirects, contribuant à la qualité des données soumise.
+On peut prendre toutes les précautions, on peut avoir l'intuition d'avoir tout géré, et se rassurer parce qu'on utilise des outils fiables, mais il existera toujours des manques dans les données.
+
+Il faut être capable de les identifier, et il faut les prendre en compte dans tout calcul ultérieur.
+
+Une fois que tout est passé en revue, on passe d'un jeu contenant plus d'un million d'enregistrements à un jeu n'en contenant plus que 300 000.
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/calendar/calendar_humidity_2025.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/calendar/calendar_humidity_2025.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/calendar/calendar_illuminance_2025.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/calendar/calendar_illuminance_2025.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/calendar/calendar_pressure_2025.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/calendar/calendar_pressure_2025.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/calendar/calendar_rain_2025.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/calendar/calendar_rain_2025.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/calendar/calendar_temperature_2025.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/calendar/calendar_temperature_2025.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/calendar/calendar_wind_2025.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/calendar/calendar_wind_2025.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/humidity_last_7_days.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/humidity_last_7_days.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/humidity_overview.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/humidity_overview.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/illuminance_last_7_days.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/illuminance_last_7_days.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/illuminance_overview.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/illuminance_overview.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/pressure_last_7_days.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/pressure_last_7_days.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/pressure_overview.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/pressure_overview.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/rain_rate_last_7_days.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/rain_rate_last_7_days.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/rain_rate_overview.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/rain_rate_overview.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/sun_elevation_last_7_days.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/sun_elevation_last_7_days.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/sun_elevation_overview.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/sun_elevation_overview.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/temperature_last_7_days.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/temperature_last_7_days.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/temperature_overview.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/temperature_overview.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/wind_direction_last_7_days.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/wind_direction_last_7_days.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/wind_direction_overview.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/wind_direction_overview.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/wind_speed_last_7_days.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/wind_speed_last_7_days.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/wind_speed_overview.png
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/images/wind_speed_overview.png
--- a/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/index.md
+++ b/content/interets/meteorologie/2025/11/26/03-premiers-graphiques/index.md
@@ -0,0 +1,65 @@
+---
+title: "Premiers graphiques"
+dossier: ["Exploitation de mes données météo"]
+date: 2025-11-26T22:57:25
+weight: 30
+---
+
+On peut désormais tracer nos premiers graphiques simples et bruts à partir du dataset minuté construit au chapitre précédent.
+S'ils ne sont pas encore très instructifs par rapport à ce que nous fournissent déjà Home Assistant et InfluxDB, ils nous permettent au moins de nous assurer que tout fonctionne, que les données semblent cohérentes, et que la chaîne « export → préparation → visualisation » tient la route.
+Les scripts de ce chapitre s’appuient sur [`pandas`](https://pandas.pydata.org/) et sur la bibliothèque de visualisation [`Matplotlib`](https://matplotlib.org/) (via le module `meteo.plots`) pour produire des graphiques standards : séries temporelles, _heatmaps_, calendriers.
+Les fichiers CSV correspondant à chaque figure sont conservés dans le sous-dossier `data/` de ce chapitre, ce qui permet de réutiliser directement les séries pré-agrégées si besoin.
+
+```shell
+python "docs/03 - Premiers graphiques/scripts/plot_basic_variables.py"
+```
+
+Ce script lit `data/weather_minutely.csv`, sélectionne éventuellement une fenêtre temporelle (par exemple les derniers jours si l’on utilise l’option `--days`) puis choisit une fréquence d’agrégation adaptée pour ne pas saturer le graphique en points.
+Pour chaque variable (température, pression, humidité, pluie, vent, illuminance, élévation du soleil), il applique un style par défaut : courbe continue pour les variables lisses, diagramme en barres pour la pluie, nuage de points pour la direction du vent, etc.
+L’idée est d’obtenir une première vue d’ensemble de la [série temporelle](https://fr.wikipedia.org/wiki/S%C3%A9rie_temporelle) de chaque variable, sans prise de tête :
+
+- vérifier le cycle quotidien de la température et de l’élévation solaire ;
+- repérer les paliers ou dérives de capteurs (pression trop plate, humidité coincée, etc.) ;
+- confirmer que les unités, ranges et horodatages sont plausibles.
+
+![](images/temperature_overview.png)
+
+![](images/pressure_overview.png)
+
+![](images/humidity_overview.png)
+
+![](images/rain_rate_overview.png)
+
+![](images/wind_speed_overview.png)
+
+![](images/wind_direction_overview.png)
+
+![](images/illuminance_overview.png)
+
+![](images/sun_elevation_overview.png)
+
+## Vues calendrier
+
+```shell
+python "docs/03 - Premiers graphiques/scripts/plot_calendar_overview.py"
+```
+
+Le second script propose une vue complémentaire sous forme de _calendrier thermique_ (une [carte de chaleur](https://fr.wikipedia.org/wiki/Carte_de_chaleur) disposée en jours et mois).
+À partir du même dataset minuté, il calcule des moyennes quotidiennes (température, humidité, pression, illuminance, vent) ou des cumuls quotidiens (pluie), puis remplit une matrice « mois x jours » pour l’année la plus récente disponible.
+Ces vues servent surtout à :
+
+- repérer rapidement les saisons, épisodes pluvieux ou périodes de vent soutenu ;
+- détecter des trous dans la série (jours entièrement manquants) ;
+- avoir un aperçu global de l’année sans zoomer/dézoomer en permanence sur une longue série temporelle.
+
+![](images/calendar/calendar_temperature_2025.png)
+
+![](images/calendar/calendar_pressure_2025.png)
+
+![](images/calendar/calendar_humidity_2025.png)
+
+![](images/calendar/calendar_rain_2025.png)
+
+![](images/calendar/calendar_illuminance_2025.png)
+
+![](images/calendar/calendar_wind_2025.png)
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/correlation_heatmap.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/correlation_heatmap.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/correlation_heatmap_spearman.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/correlation_heatmap_spearman.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_humidity_vs_illuminance.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_humidity_vs_illuminance.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_humidity_vs_pressure.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_humidity_vs_pressure.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_humidity_vs_rain_rate.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_humidity_vs_rain_rate.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_humidity_vs_sun_elevation.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_humidity_vs_sun_elevation.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_humidity_vs_wind_direction.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_humidity_vs_wind_direction.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_humidity_vs_wind_speed.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_humidity_vs_wind_speed.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_illuminance_vs_sun_elevation.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_illuminance_vs_sun_elevation.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_illuminance_vs_wind_direction.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_illuminance_vs_wind_direction.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_illuminance_vs_wind_speed.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_illuminance_vs_wind_speed.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_pressure_vs_illuminance.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_pressure_vs_illuminance.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_pressure_vs_rain_rate.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_pressure_vs_rain_rate.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_pressure_vs_sun_elevation.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_pressure_vs_sun_elevation.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_pressure_vs_wind_direction.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_pressure_vs_wind_direction.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_pressure_vs_wind_speed.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_pressure_vs_wind_speed.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_rain_rate_vs_illuminance.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_rain_rate_vs_illuminance.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_rain_rate_vs_sun_elevation.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_rain_rate_vs_sun_elevation.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_rain_rate_vs_wind_direction.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_rain_rate_vs_wind_direction.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_rain_rate_vs_wind_speed.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_rain_rate_vs_wind_speed.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_temperature_vs_humidity.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_temperature_vs_humidity.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_temperature_vs_illuminance.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_temperature_vs_illuminance.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_temperature_vs_pressure.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_temperature_vs_pressure.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_temperature_vs_rain_rate.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_temperature_vs_rain_rate.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_temperature_vs_sun_elevation.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_temperature_vs_sun_elevation.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_temperature_vs_wind_direction.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_temperature_vs_wind_direction.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_temperature_vs_wind_speed.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_temperature_vs_wind_speed.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_wind_direction_vs_sun_elevation.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_wind_direction_vs_sun_elevation.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_wind_speed_vs_sun_elevation.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_wind_speed_vs_sun_elevation.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_wind_speed_vs_wind_direction.png
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/images/pairwise_timeseries/timeseries_wind_speed_vs_wind_direction.png
--- a/content/interets/meteorologie/2025/11/26/04-correlations-binaires/index.md
+++ b/content/interets/meteorologie/2025/11/26/04-correlations-binaires/index.md
@@ -0,0 +1,117 @@
+---
+title: "Corrélations binaires"
+dossier: ["Exploitation de mes données météo"]
+date: 2025-11-26T22:57:26
+weight: 40
+---
+
+L’objectif de ce chapitre est d’explorer les relations entre variables deux à deux : d’abord visuellement (superposition de séries temporelles, comme ci-dessous, et [nuages de points](https://fr.wikipedia.org/wiki/Nuage_de_points), comme dans le chapitre suivant), puis numériquement via des coefficients de [corrélation](<https://fr.wikipedia.org/wiki/Corr%C3%A9lation_(statistiques)>).
+On reste volontairement dans un cadre simple : une variable « primaire » et une variable « associée », à la fois dans le temps et dans les matrices de corrélation.
+
+## Superpositions simples
+
+```shell
+python "docs/04 - Corrélations binaires/scripts/plot_pairwise_time_series.py"
+```
+
+Ce script parcourt toutes les paires de variables disponibles et produit, pour chacune, un graphique superposant les deux séries sur le même axe temporel (ou sur deux axes verticaux si nécessaire).
+Les données sont ré-échantillonnées pour limiter le nombre de points et lisser légèrement le bruit, en utilisant les mêmes mécanismes que dans le chapitre 3.
+Ces superpositions servent surtout à repérer des co‑évolutions évidentes (par exemple humidité qui baisse quand la température monte) ou, au contraire, des paires qui semblent indépendantes à l’œil nu.
+
+### Température
+
+Toutes les figures de cette section ont pour variable « primaire » la température ; l’autre variable change d’un graphique à l’autre.
+
+![](images/pairwise_timeseries/timeseries_temperature_vs_humidity.png)
+
+![](images/pairwise_timeseries/timeseries_temperature_vs_pressure.png)
+
+![](images/pairwise_timeseries/timeseries_temperature_vs_rain_rate.png)
+
+![](images/pairwise_timeseries/timeseries_temperature_vs_illuminance.png)
+
+![](images/pairwise_timeseries/timeseries_temperature_vs_wind_speed.png)
+
+![](images/pairwise_timeseries/timeseries_temperature_vs_wind_direction.png)
+
+![](images/pairwise_timeseries/timeseries_temperature_vs_sun_elevation.png)
+
+### Humidité relative
+
+Ici, on fixe l’humidité comme variable principale et on observe comment elle évolue en parallèle des autres variables.
+
+![](images/pairwise_timeseries/timeseries_humidity_vs_pressure.png)
+
+![](images/pairwise_timeseries/timeseries_humidity_vs_rain_rate.png)
+
+![](images/pairwise_timeseries/timeseries_humidity_vs_illuminance.png)
+
+![](images/pairwise_timeseries/timeseries_humidity_vs_wind_speed.png)
+
+![](images/pairwise_timeseries/timeseries_humidity_vs_wind_direction.png)
+
+![](images/pairwise_timeseries/timeseries_humidity_vs_sun_elevation.png)
+
+### Pression
+
+Dans ces vues, on suit la pression atmosphérique et on la compare aux autres champs mesurés.
+
+![](images/pairwise_timeseries/timeseries_pressure_vs_rain_rate.png)
+
+![](images/pairwise_timeseries/timeseries_pressure_vs_illuminance.png)
+
+![](images/pairwise_timeseries/timeseries_pressure_vs_wind_speed.png)
+
+![](images/pairwise_timeseries/timeseries_pressure_vs_wind_direction.png)
+
+![](images/pairwise_timeseries/timeseries_pressure_vs_sun_elevation.png)
+
+### Pluviométrie
+
+On regarde ici comment les épisodes de pluie (taux de précipitation) se positionnent par rapport au vent et à la hauteur du soleil.
+
+![](images/pairwise_timeseries/timeseries_rain_rate_vs_wind_speed.png)
+
+![](images/pairwise_timeseries/timeseries_rain_rate_vs_wind_direction.png)
+
+![](images/pairwise_timeseries/timeseries_rain_rate_vs_sun_elevation.png)
+
+### Luminance
+
+Ces superpositions éclairent les liens entre lumière, vent et position du soleil.
+
+![](images/pairwise_timeseries/timeseries_illuminance_vs_wind_speed.png)
+
+![](images/pairwise_timeseries/timeseries_illuminance_vs_wind_direction.png)
+
+![](images/pairwise_timeseries/timeseries_illuminance_vs_sun_elevation.png)
+
+### Vent (vitesse / direction)
+
+Enfin, on se concentre sur le vent : d’abord sa vitesse en lien avec l’élévation solaire, puis la direction comparée à cette même référence.
+
+![](images/pairwise_timeseries/timeseries_wind_speed_vs_wind_direction.png)
+
+![](images/pairwise_timeseries/timeseries_wind_speed_vs_sun_elevation.png)
+
+![](images/pairwise_timeseries/timeseries_wind_direction_vs_sun_elevation.png)
+
+## Matrices de corrélation (instantané, signé)
+
+Le calcul des coefficients de Pearson et de Spearman peut nous donner une indication numérique de la force et du signe des corrélations entre les différentes variables.
+On passe ainsi du visuel (superpositions, nuages de points) à un résumé compact des co‑variations, même si cela ne capture que des dépendances linéaires ou monotones simples.
+On utilise ici :
+
+- le coefficient de corrélation linéaire de Pearson (voir [corrélation linéaire](https://fr.wikipedia.org/wiki/Corr%C3%A9lation_lin%C3%A9aire)) pour mesurer à quel point deux variables varient ensemble de manière approximativement linéaire ;
+- le coefficient de Spearman (voir [corrélation de Spearman](https://fr.wikipedia.org/wiki/Corr%C3%A9lation_de_Spearman)) pour capturer des relations monotones (croissantes ou décroissantes), même si elles ne sont pas parfaitement linéaires.
+
+```shell
+python "docs/04 - Corrélations binaires/scripts/plot_correlation_heatmap.py" --transform=identity --upper-only
+```
+
+![](images/correlation_heatmap.png)
+
+![](images/correlation_heatmap_spearman.png)
+
+Le signe et l'intensité des coefficients montrent à quel point deux variables bougent ensemble au même instant (co‑mouvement linéaire pour Pearson, monotone pour Spearman).
+Cette matrice sert donc surtout de carte globale : repérer rapidement les couples très corrélés ou indiquer un lien physique évident, mettre en alerte des variables à forte corrélation qui pourraient masquer d'autres effets (saisonnalité, cycle jour/nuit), et choisir quelles paires méritent qu'on teste des décalages temporels ou des relations non linéaires dans la suite.
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/correlation_heatmap_lagged.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/correlation_heatmap_lagged.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_humidity_to_illuminance.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_humidity_to_illuminance.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_humidity_to_pressure.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_humidity_to_pressure.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_humidity_to_rain_rate.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_humidity_to_rain_rate.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_humidity_to_sun_elevation.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_humidity_to_sun_elevation.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_humidity_to_wind_direction.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_humidity_to_wind_direction.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_humidity_to_wind_speed.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_humidity_to_wind_speed.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_illuminance_to_sun_elevation.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_illuminance_to_sun_elevation.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_illuminance_to_wind_direction.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_illuminance_to_wind_direction.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_illuminance_to_wind_speed.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_illuminance_to_wind_speed.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_pressure_to_illuminance.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_pressure_to_illuminance.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_pressure_to_rain_rate.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_pressure_to_rain_rate.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_pressure_to_sun_elevation.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_pressure_to_sun_elevation.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_pressure_to_wind_direction.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_pressure_to_wind_direction.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_pressure_to_wind_speed.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_pressure_to_wind_speed.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_rain_rate_to_illuminance.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_rain_rate_to_illuminance.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_rain_rate_to_sun_elevation.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_rain_rate_to_sun_elevation.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_rain_rate_to_wind_direction.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_rain_rate_to_wind_direction.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_rain_rate_to_wind_speed.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_rain_rate_to_wind_speed.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_temperature_to_humidity.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_temperature_to_humidity.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_temperature_to_illuminance.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_temperature_to_illuminance.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_temperature_to_pressure.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_temperature_to_pressure.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_temperature_to_rain_rate.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_temperature_to_rain_rate.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_temperature_to_sun_elevation.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_temperature_to_sun_elevation.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_temperature_to_wind_direction.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_temperature_to_wind_direction.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_temperature_to_wind_speed.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_temperature_to_wind_speed.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_wind_direction_to_sun_elevation.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_wind_direction_to_sun_elevation.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_wind_speed_to_sun_elevation.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_wind_speed_to_sun_elevation.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_wind_speed_to_wind_direction.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/lagged_correlations/lagcorr_wind_speed_to_wind_direction.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_illuminance.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_illuminance.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_illuminance_lagged.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_illuminance_lagged.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_pressure.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_pressure.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_pressure_lagged.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_pressure_lagged.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_rain_rate.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_rain_rate.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_rain_rate_lagged.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_rain_rate_lagged.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_sun_elevation.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_sun_elevation.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_sun_elevation_lagged.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_sun_elevation_lagged.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_wind_direction.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_wind_direction.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_wind_direction_lagged.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_wind_direction_lagged.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_wind_speed.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_wind_speed.png
--- a/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_wind_speed_lagged.png
+++ b/content/interets/meteorologie/2025/11/26/05-correlations-binaires-avancees/images/pairwise_scatter/scatter_humidity_vs_wind_speed_lagged.png
--- a/Show More
+++ b/Show More