1

248 lines
15 KiB
Markdown
Raw Blame History

This file contains invisible Unicode characters

This file contains invisible Unicode characters that are indistinguishable to humans but may be processed differently by a computer. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Corrélations binaires avancées
## Corrélations décalées
```shell
python "docs/05 - Corrélations binaires avancées/scripts/plot_lagged_correlations.py"
```
![](figures/lagged_correlations/lagcorr_temperature_to_humidity.png)
![](figures/lagged_correlations/lagcorr_temperature_to_pressure.png)
![](figures/lagged_correlations/lagcorr_temperature_to_rain_rate.png)
![](figures/lagged_correlations/lagcorr_temperature_to_illuminance.png)
![](figures/lagged_correlations/lagcorr_temperature_to_wind_speed.png)
![](figures/lagged_correlations/lagcorr_temperature_to_wind_direction.png)
![](figures/lagged_correlations/lagcorr_temperature_to_sun_elevation.png)
![](figures/lagged_correlations/lagcorr_humidity_to_pressure.png)
![](figures/lagged_correlations/lagcorr_humidity_to_rain_rate.png)
![](figures/lagged_correlations/lagcorr_humidity_to_illuminance.png)
![](figures/lagged_correlations/lagcorr_humidity_to_wind_speed.png)
![](figures/lagged_correlations/lagcorr_humidity_to_wind_direction.png)
![](figures/lagged_correlations/lagcorr_humidity_to_sun_elevation.png)
![](figures/lagged_correlations/lagcorr_pressure_to_rain_rate.png)
![](figures/lagged_correlations/lagcorr_pressure_to_illuminance.png)
![](figures/lagged_correlations/lagcorr_pressure_to_wind_speed.png)
![](figures/lagged_correlations/lagcorr_pressure_to_wind_direction.png)
![](figures/lagged_correlations/lagcorr_pressure_to_sun_elevation.png)
![](figures/lagged_correlations/lagcorr_rain_rate_to_illuminance.png)
![](figures/lagged_correlations/lagcorr_rain_rate_to_wind_speed.png)
![](figures/lagged_correlations/lagcorr_rain_rate_to_wind_direction.png)
![](figures/lagged_correlations/lagcorr_rain_rate_to_sun_elevation.png)
![](figures/lagged_correlations/lagcorr_illuminance_to_wind_speed.png)
![](figures/lagged_correlations/lagcorr_illuminance_to_wind_direction.png)
![](figures/lagged_correlations/lagcorr_illuminance_to_sun_elevation.png)
![](figures/lagged_correlations/lagcorr_wind_speed_to_wind_direction.png)
![](figures/lagged_correlations/lagcorr_wind_speed_to_sun_elevation.png)
![](figures/lagged_correlations/lagcorr_wind_direction_to_sun_elevation.png)
### Interprétation
Ces graphiques montrent la corrélation signée et tracent des zones colorées symétriques pour les relations négatives/positives. Ils mettent en évidence la force, le sens et le décalage temporel entre deux variables.
Ainsi, il est clair qu'il existe une corrélation forte et immédiate entre la température et l'humidité relative.
La corrélation entre température et luminance est également forte, mais elle est décalée : le pic de luminance précède le pic de température de près de deux heures.
Comme ces deux corrélations sont fortes, on en déduit que l'on devrait logiquement observer une corrélation forte et décalée entre la luminance et l'humidité relative (et c'est bien le cas, comme en témoigne le graphique correspondant).
Un rapport similaire, quoique moins prononcé, existe entre la température, l'humidité relative et l'élévation solaire, puisque la luminance en dépend directement.
Ces relations pourraient être mieux mises en évidence à travers une matrice de corrélations par coefficient de Pearson.
### Matrices de corrélation avec lag optimal par paire
```shell
python "docs/05 - Corrélations binaires avancées/scripts/plot_lagged_correlation_heatmap_from_data.py"
```
Cette heatmap est construite à partir des CSV `data/lagged_correlations`, en prenant pour chaque paire ordonnée (X → Y) le r maximal en |r| et le lag associé. Les lags (en minutes, signe conservé, y compris 0) sont annotés uniquement pour les corrélations d'intensité au moins « Modérée » (|r| ≥ 0,3).
![](figures/correlation_heatmap_lagged.png)
Cette matrice met en évidence les plus fortes corrélations et leur décalage optimal (exprimé en minutes).
Il est important de souligner que ces décalages ne sont pas transitifs.
Chaque case correspond au décalage qui maximise la corrélation X→Y calculée directement sur les deux signaux ; on nobtient pas un « décalage absolu » que lon pourrait soustraire ou additionner via une troisième variable.
Deux couples peuvent avoir des pics de corrélation à des lags voisins ou différents selon la forme du signal, le bruit, linertie physique ou la résolution (pas de 10 minutes).
Pour connaître le décalage entre deux variables, il faut donc regarder leur case spécifique dans la matrice : on ne peut pas l'inférer des relations entre trois variables.
### Nuages de points
```shell
python "docs/05 - Corrélations binaires avancées/scripts/plot_all_pairwise_scatter.py"
```
On affiche les nuages bruts pour toutes les paires. Si le lag optimal est strictement positif et que |r| ≥ 0,3 (daprès `data/lag_matrix_minutes.csv` et `data/correlation_matrix_lagged.csv`), on ajoute une version décalée Y(t+lag). Les paires qui franchissent ce seuil actuellement :
#### Luminance → Température (lag +130 min)
![](figures/pairwise_scatter/scatter_temperature_vs_illuminance.png)
Sans lag, la luminance croît globalement avec la température (r ~ 0,51), mais le nuage reste étalé avec un gros paquet nocturne à luminance nulle sur une large plage de températures ; la coloration temporelle montre aussi que les points récents (été) concentrent les températures les plus élevées pour une même luminance.
![](figures/pairwise_scatter/scatter_temperature_vs_illuminance_lagged.png)
Décalage +130 min : le nuage se resserre (r ~ 0,59) et la pente croissante devient plus homogène, signe que le réalignement temporel renforce le signal plutôt qu'il ne le déforme.
#### Élévation solaire → Température (lag +150 min)
![](figures/pairwise_scatter/scatter_temperature_vs_sun_elevation.png)
Sans décalage, lélévation solaire et la température montent ensemble (r ~ 0,47), mais le nuage dessine un « 8 » : pour une même élévation modérée, la branche du matin est nettement plus froide que celle du soir, et la coloration temporelle montre que les périodes récentes (été) maintiennent des températures élevées jusquà des élévations plus faibles.
![](figures/pairwise_scatter/scatter_temperature_vs_sun_elevation_lagged.png)
Avec +150 min, la boucle se referme (r ~ 0,56) : les deux branches se rapprochent et la pente positive devient plus lisible, tout en conservant la trace du double trajet matin/soir (forme de « 8 ») et du maintien de températures élevées sur une plage plus large en été.
#### Luminance → Humidité relative (lag +140 min)
![](figures/pairwise_scatter/scatter_humidity_vs_illuminance.png)
L'humidité est élevée dès que la luminance est faible puis baisse quand la lumière augmente (r ~ -0,52), avec beaucoup de points autour de 80100 % pour des luminances proches de zéro.
![](figures/pairwise_scatter/scatter_humidity_vs_illuminance_lagged.png)
Le décalage de +140 min renforce nettement cette anti-corrélation (r ~ -0,63) et fait ressortir deux poches distinctes : luminance < 40 k lux associée à une humidité élevée (médiane ~82 %) et luminance 60100 k lux associée à une humidité nettement plus basse (médiane ~46 %).
#### Élévation solaire → Humidité relative (lag +170 min)
![](figures/pairwise_scatter/scatter_humidity_vs_sun_elevation.png)
L'humidité diminue quand l'élévation solaire augmente (r ~ -0,37), mais la dispersion reste forte, surtout aux basses élévations.
![](figures/pairwise_scatter/scatter_humidity_vs_sun_elevation_lagged.png)
Décaler de +170 min resserre le nuage (r ~ -0,50) et aplatit les courbes arrondies visibles sans lag : la diminution d'humidité se cale plus directement sur la montée de l'élévation, ce qui réduit lasymétrie matin/soir sans inverser le sens de la relation.
#### Élévation solaire → Luminance (lag +10 min)
![](figures/pairwise_scatter/scatter_illuminance_vs_sun_elevation.png)
Luminance et élévation solaire sont presque alignées (r ~ 0,76) : plus le soleil est haut, plus la luminance est forte, avec peu de dispersion hors des périodes nocturnes.
![](figures/pairwise_scatter/scatter_illuminance_vs_sun_elevation_lagged.png)
Le décalage de +10 min ne change quasiment rien (r stable), la synchronisation initiale étant déjà suffisante.
La comparaison de ces graphiques met en évidence l'intérêt de prendre en compte le décalage temporel, au moins dans certains cas.
En réalignant temporellement les points de mesure, on renforce les corrélations précédemment calculées (les nuages de points se resserrent).
#### Autres relations
![](figures/pairwise_scatter/scatter_temperature_vs_humidity.png)
Relation inverse marquée (r ~ -0,60) : le nuage suit presque une diagonale descendante, avec peu de points sécartant fortement, ce qui suggère une structure quasi linéaire malgré le bruit résiduel.
![](figures/pairwise_scatter/scatter_temperature_vs_pressure.png)
Léger biais positif (r ~ 0,16) : la pression reste cantonnée entre 1005 et 1025 hPa tandis que la température oscille largement autour, formant des bandes verticales qui sélargissent dans le temps (couleurs plus récentes), signe que la montée saisonnière des températures se superpose à une pression quasi stable.
![](figures/pairwise_scatter/scatter_temperature_vs_rain_rate.png)
96 % des mesures sont sans pluie ; les 1242 averses recensées se situent entre 0,7 °C et 24,3 °C, aucune au-delà de 25 °C ni sous 0 °C. Les données couvrant marsnovembre, il manque encore un hiver complet pour conclure sur les très basses températures.
![](figures/pairwise_scatter/scatter_temperature_vs_wind_speed.png)
Pas de tendance discernable entre température et vitesse du vent ; la plupart des vitesses restent faibles (médiane ~2,4 km/h) quel que soit le niveau thermique.
![](figures/pairwise_scatter/scatter_temperature_vs_wind_direction.png)
Les températures les plus hautes apparaissent surtout avec des vents de Nord à Ouest, tandis que les flux Sud/Est s'accompagnent de valeurs plus fraîches ; le motif reste toutefois très dispersé.
![](figures/pairwise_scatter/scatter_humidity_vs_pressure.png)
Humidité légèrement plus élevée quand la pression est basse (r ~ -0,13), mais la dispersion domine : on observe aussi des humidités fortes au-dessus de 1020 hPa (médiane ~83 % entre 10201030 hPa), montrant quune haute pression nimplique pas forcément un air sec.
![](figures/pairwise_scatter/scatter_humidity_vs_rain_rate.png)
Nuage très asymétrique : la plupart des observations sans pluie, et les averses (rares) surviennent quand l'humidité est déjà élevée, d' une faible corrélation positive (r ~ 0,15).
![](figures/pairwise_scatter/scatter_humidity_vs_wind_speed.png)
Pas de relation lisible entre humidité et vitesse du vent ; les points restent éparpillés sur toute la gamme.
![](figures/pairwise_scatter/scatter_humidity_vs_wind_direction.png)
Air plus humide sous vents de Sud et Sud-Ouest (moyenne ~7981 %), plus sec sous flux de Nord-Est à Est (~6870 %), même si chaque secteur reste très dispersé.
![](figures/pairwise_scatter/scatter_pressure_vs_rain_rate.png)
Pression légèrement plus basse lors des épisodes pluvieux (r ~ -0,09), mais les 1242 occurrences de pluie sétendent de 977 à 1027 hPa : la plupart entre 990 et 1020 hPa, quelques cas rares au-dessus de 1020 hPa, et très peu sous 980 hPa, ce qui limite linterprétation.
![](figures/pairwise_scatter/scatter_pressure_vs_illuminance.png)
Faible tendance (r ~ 0,14) à associer les hautes pressions aux périodes lumineuses ; la variance reste importante, y compris de nuit. Seul un point atteint ~40 k lux sous ~981 hPa, isolé et insuffisant pour inférer un motif.
![](figures/pairwise_scatter/scatter_pressure_vs_wind_speed.png)
Vents plus rapides quand la pression baisse (r ~ -0,23), avec des vitesses élevées surtout sous 1010 hPa. Les calmes (0 km/h) apparaissent néanmoins à tous les niveaux de pression et même plus souvent au-delà de 1020 hPa, signe quune basse pression ne saccompagne pas systématiquement de vent.
![](figures/pairwise_scatter/scatter_pressure_vs_wind_direction.png)
Pression plus élevée sous vents d'Est/NE (médiane ~10121014 hPa) et plus basse quand le flux vient du Sud-Ouest (médiane ~1009 hPa). La densité de points sous SO reflète surtout un effectif plus grand, pas une pression plus haute.
![](figures/pairwise_scatter/scatter_pressure_vs_sun_elevation.png)
Cycle quotidien faible (r ~ 0,10) : la pression monte légèrement quand le soleil est haut mais reste globalement stable. Sur la période marsnovembre, les médianes mensuelles montrent des pressions plus élevées en septembre (~1018 hPa) quen juillet (~1006 hPa), ce que suggère aussi le gradient temporel de la figure.
![](figures/pairwise_scatter/scatter_rain_rate_vs_illuminance.png)
Comme 96 % des valeurs sont nulles, aucune tendance nette ; les rares précipitations surviennent surtout lorsque la luminance est faible.
![](figures/pairwise_scatter/scatter_rain_rate_vs_wind_speed.png)
Les averses (rares) coïncident avec des vents un peu plus rapides (médiane ~3,2 km/h sous pluie contre ~2,4 km/h), mais la majorité des vitesses reste faible et sans pluie.
![](figures/pairwise_scatter/scatter_rain_rate_vs_wind_direction.png)
Précipitations plus présentes avec des vents d'Ouest à Nord-Ouest (~0,2 mm/h en moyenne sur ces secteurs) que sous flux d'Est/NE, mais le signal reste faible car la plupart des pas de temps sont secs.
![](figures/pairwise_scatter/scatter_rain_rate_vs_sun_elevation.png)
Pas de corrélation avec l'élévation solaire (r ~ 0) : les épisodes pluvieux, rares, sont répartis sur le jour et la nuit. Les fréquences de pluie varient peu selon lélévation (≈34,5 % des points), avec un léger surplus aux basses élévations mais sans tendance nette matin/après-midi.
![](figures/pairwise_scatter/scatter_illuminance_vs_wind_speed.png)
Luminance élevée coïncide légèrement avec des vents un peu plus rapides (r ~ 0,13), mais la plupart des observations restent proches du calme quelle que soit la lumière.
![](figures/pairwise_scatter/scatter_illuminance_vs_wind_direction.png)
Luminance plus forte lorsque le vent vient du Nord/Nord-Ouest (~2829 klx en moyenne), nettement plus faible sous vents de Sud (~5 klx), malgré une dispersion importante.
![](figures/pairwise_scatter/scatter_wind_speed_vs_wind_direction.png)
Vitesse du vent très dépendante du secteur : vents d'Ouest et Sud-Ouest nettement plus rapides (~4,7 km/h en moyenne) alors que les autres directions tournent autour de 12 km/h.
![](figures/pairwise_scatter/scatter_wind_speed_vs_sun_elevation.png)
Légère hausse des vitesses quand le soleil est plus haut (r ~ 0,12), mais une proportion importante de calmes persiste à toutes les élévations.
![](figures/pairwise_scatter/scatter_wind_direction_vs_sun_elevation.png)
Élévation solaire maximale observée surtout avec des vents de Nord/Nord-Ouest, tandis que les flux de Sud coïncident fréquemment avec des élévations négatives (nuit), signe d'une dépendance au cycle journalier plus qu'au secteur lui-même.