Chargement...

Analyse_statistique_creer_modifier

L'onglet statistique d'un site ou d'une station hydrométrique permet de créer/modifier une analyse statistiques.

Il est conseillé de réaliser l'ajustement statistique au site hydrologique plutôt qu'à la station.

La démarche permet la configuration par l'utilisateur, une visualisation et un contrôle à chaque étape du calcul.

  1. choix de la grandeur à analyser (débit moyen ou instantané) et de la période de la chronique à utiliser
  2. contrôle de la chronique de la grandeur
  3. constitution de l'échantillon par extraction d'une valeur par année (période de 12 mois) ou par saison pour la grandeur/variable choisie
  4. visualisation et modification de l'échantillon
  5. ajustement d'une loi statistique/loi de probabilité à l'échantillon.
  6. visualisation des résultats

Le principe est toujours le suivant :

  • choix de la grandeur à analyser (débit moyen ou instantané)
  • choix de la période de la chronique à utiliser
  • constitution de l'échantillon par extraction d'une valeur par année (période de 12 mois) ou par saison pour la grandeur/variable choisie
  • ajustement d'une loi statistique/loi de probabilité à l'échantillon.

La présentation des résultats comprend toujours :

  • le résultat de tests de tendance sur l'échantillon
  • la visualisation graphique et en tableau superposant l'échantillon (fréquences empiriques calculées via ) et la loi ajustée avec l'intervalle de confiance associé
  • les paramètres de la loi ajustée
  • un tableau regroupant les débits aux fréquences théoriques (issus de la loi ajustée) les plus utilisées, avec l'intervalle de confiance associé
  • sur la droite l'ensemble des choix effectués pour aboutir au résultat et le commentaire de l'analyse

Au fur et à mesure de la démarche, la partie droite de l'écran offre un résumé des choix effectués, ce qui permet facilement de revenir en arrière et d'apprécier la pertinence des choix.

Selon l'objectif de l'analyse (toutes eaux, basses eaux, hautes eaux), l'extraction des valeurs ou les lois statistiques utilisables sont différents et adaptés.

Cela mène à la première des six étapes nécessaires pour établir un ajustement statistique.

  1. Choix des données

Cette étape permet à l'utilisateur de définir la période de données, soit en renseignant manuellement la première date ciblée, soit en renseignant manuellement la dernière date ciblée, soit en renseignant les deux dates.

Ensuite, l'utilisateur définit la grandeur destinée à être ajustée par une loi statistique:

  • débits moyens sur n jours (QmnJ ou QnJ), n allant de 1 à 30
  • débits instantanés maximal ou minimal sur n jours (QiXnJ ou QiNnJ), n allant de 1 à 30 pour ces 2 types de grandeurs, l'utilisateur peut spécifier si une seule grandeur est calculée sur n jours : * débits instantanés maximal ou minimal sur n jours (QiXnJ ou QiNnJ), n allant de 1 à 30 pour ces 2 types de grandeurs, l'utilisateur peut spécifier si une seule grandeur est calculée sur n jours :

ou si une grandeur par jour est calculée, en "glissant" la fenêtre de n jours :

Pour des grandeurs calculées sur plusieurs jours, il est en général préférable de travailler sur des grandeurs glissantes, particulièrement lorsque l'on recherche un minimum ou un maximum sur une saison. Penser à cocher la case dédiée. Pour l'analyse de référence des Qm3J-N, c'est pris en compte.

  • débits moyens mensuels (QmM)
  • débits instantanés maximal ou minimal mensuel (QiXM ou QiNM)

L'utilisateur peut choisir d'utiliser tous les statuts des données (brutes, corrigées, pré-validées, validées) ou de restreindre aux données validées ou validées + pré-validées.

Une illustration placée sous les éléments de sélection, présente une synthèse des données disponibles.

Pour plus de renseignements, vous pouvez consultez les pages d'aide sur les calendriers pour les stations ou les sites hydrométriques.

Enfin, l'utilisateur accès à l'étape suivante en cliquant sur

  1. Description des données

A cette étape, l'utilisateur a accès une synthèse de la grandeur définie précédemment, sur la période temporelle cible.

  • Description de l'ensemble des données : minimum, moyenne, médiane, maximum, écart-type, coefficient de variation, quantiles, taille de l'échantillon
  • Qualifications et continuités des données : taux des données par qualification (bonne, douteuse, non qualifiée) et taux de discontinuité.
  • Qualifications et disponibilités annuelles : tableau des qualifications et disponibilité annuelle de la grandeur cible. Le bouton  permet d'accéder à la chronique annuelle. Le commentaire de l'année est accessible avec le bouton

Pour plus de renseignements, vous pouvez consultez les pages d'aide sur les calendriers pour les stations ou les sites hydrométriques.

Il est possible d'exporter ces statistiques descriptives au format csv

La chronique de la grandeur cible peut être également exportée

Ces informations sont à analyser avec attention, car cela influence la constitution de l'échantillon sur lequel l'ajustement statistique sera réalisé.

Enfin, l'utilisateur accès à l'étape suivante en cliquant sur

Si l'utilisateur souhaite redéfinir la sélection des données, il peut revenir à l'étape précédente en suivant le lien

 

 

  1. Extraction des variables

Cette étape permet à l'utilisateur de préciser si l'extraction est réalisée sur

  • l'année hydrologique du site (définie par le producteur de donnée), c'est-à-dire 12 mois centrés sur la période de hautes eaux
  • l'année d'étiage du site (définie par le producteur de donnée), c'est-à-dire 12 mois centrés sur la période de basses eaux
  • l'année civile : du 1er janvier au 31 décembre
  • une sous-période définie par deux dates. Cela est utile si l'utilisateur veut une saison particulière.

Quelques exemples d'utilisation en restreignant la période :

Statistiques que QJ : utilisable pour une analyse des débits moyens sur une durée donnée, annuelle, saisonnière ou mensuelle le plus souvent. Par exemple connaître le débit moyen ainsi que le débit de période de retour 5 ans durant une période de chantier dans le cours d'eau, ou le dimensionnement d'un ouvrage (passe à poisson...).

Statistiques Q3J-N et QM-N: utiles pour l'estimation des débits minimum en lien avec des projets de rejets ou de prélèvements dans le cours d'eau.

Statistiques Q-X : utiles pour l'estimation des débits de crue durant une période de chantier en cours d'eau.

Ensuite, l'utilisateur choisit l'extracteur qui va déterminer l'échantillon à ajuster à partir de la chronique préalablement définie (étape 1), de la saison (année ou sous-période définie à cette étape) en ne conservant qu'une valeur par saison: (moyenne, minimum, maximum, valeur de rang n, durée cumulée, centre de masse)

extracteur description type d'analyse
Min valeur minimale de la grandeur sur la saison basses eaux
Max valeur maximale de la grandeur sur la saison hautes eaux
Valeur de rang n valeur de quantile par saison à spécifier dans l'ordre croissant ou décroissant de la grandeur toutes analyses
durée cumulée durée cumulée de la grandeur au dessus ou au dessous d'un seuil à spécifier, par saison (voir aussi  Extracteurs durée cumulée, centre de masse et valeurs de rang n) hautes et basses eaux
centre de masse le centre de masse est la date à laquelle on atteint x % de la durée sous ou au dessus d'un seuil lien (voir aussi  Extracteurs durée cumulée, centre de masse et valeurs de rang n) hautes et basses eaux

Enfin, l'utilisateur accès à l'étape suivante en cliquant sur

Si l'utilisateur souhaite revoir la description des données, il suffit de suivre le lien 

  1. Visualisation de l'échantillon

A cette étape, l'utilisateur peut visualiser l'échantillon obtenu à partir de la période (étape 1), de la grandeur (étape 1), dans la saison (étape 3) et de l'extracteur (étape 3).

La taille de l'échantillon obtenu est défini dans le cadre  où sont mentionnés:

  • le nombre théorique de valeurs
  • le nombre de valeurs automatiquement exclues par le contrôle de la donnée hydrométrique (discontinuité, qualification, voir l'étape 2) Sont notamment exclues les saisons comportant, dans la base de données nationale, une discontinuité (1) ou une discontinuité (4 ou 8) correspondant au régime recherché (Exemple : une discontinuité faible (4) empêchera le calcul d'analyse de basses eaux ou de régime toutes eaux mais permettra celui des hautes eaux).
  • le nombre de valeurs manuellement exclues (voir ci-après)
  • le nombre de valeurs retenues : la taille de l'échantillon Le bouton  permet d'accéder à la définition de ces quatre éléments.

Un ajustement statistique n'est possible que si l'échantillon contient au moins 7 valeurs. Plus l'échantillon est grand, plus l'ajustement sera robuste.

L'utilisateur peut personnaliser l'échantillon en cliquant sur

Un cadre est ouvert par Hydroportail détaillant les valeurs de l'échantillon, leurs dates, leurs qualifications, leurs discontinuités. Ce tableau peut être exporté au format csv

L'utilisateur peut exclure des valeurs en les sélectionnant via la case à cocher en première colonne du tableau. Une valeur automatiquement exclue est symbolisée par une croix rouge.

La visualisation de l'échantillon repose sur plusieurs illustrations, de haut en bas

  • la série temporelle :

  • la saisonnalité : répartition des dates de l'échantillon au cours d'une année type.

Le graphe de saisonnalité est interactif : vous pouvez voir les effectifs en déplaçant votre souris dans l'histogramme. Dans certains cas, ce graphe de saisonnalité n'a pas de signification ou est plus difficile à interpréter. Il s'agit en particulier :

  • des valeurs moyennes, les valeurs sont systématiquement affectées au dernier jour de l 'année hydrologique,

  • des valeurs multiples, seule la date de première occurrence de la saison est utilisée,

  • durées, la date de première occurrence est utilisée. La valeur nulle (le cas n'a pas été rencontré sur la saison) est affectée au début de la saison retenue (à l'étape 2 : année d'étiage, hydrologique, civile ou définie par l'utilisateur).

  • les effectifs et fréquences cumulées : valeurs rangées en 10 classes, donnant un aperçu de l'ajustement empirique de l'échantillon

  • les périodes de retours : valeurs associées aux temps de retour, obtenues selon l'ajustement empirique de l'échantillon

Ces illustrations peuvent être exportées sous forme de fichier image (format PNG) en cliquant sur

Enfin, l'utilisateur accès à l'étape suivante en cliquant sur

Si l'utilisateur souhaite redéfinir l'extraction des variables, il suffit de suivre le lien

  1. Ajustement statistique

Cette étape permet à l'utilisateur de choisir la loi statistique à ajuster, sa méthode d'ajustement et la méthode de quantification des incertitudes.

L'utilisateur a le choix entre deux méthodologies d'ajustements, "Ajustements conseillés" et "Ajustements avancés"

  1. Ajustements conseillés : le choix des lois statistiques est limité. Un bouton permet d'afficher l'allure type de la loi sélectionnée 

La méthode d'ajustement et la méthode de quantification des incertitudes sont définies sans possibilité de modification. Seule la fréquence de l'intervalle de confiance est libre :

  1. Ajustements avancés : le choix des lois statistiques est plus vaste mais il reste limité par les données et extracteurs choisis précédemment.

La méthode d'ajustement et la méthode de quantification des incertitudes sont également modifiables mais contraintes par le type de statistiques (toutes eaux, basses eaux, hautes eaux) par la loi statistique choisie.

Cette méthodologie s'adresse aux utilisateurs avancés en hydrologie statistique. Un message d'avertissement est affiché.

 

L'intervalle de confiance à X% est l'intervalle dans lequel la variable a une probabilité X/100 de se trouver. Par exemple, cela fournit un estimation de l'incertitude liée à la détermination d'une valeur pour un temps de retour fixé selon les hypothèses retenues (choix de la loi statistique, méthode d'ajustement, indépendance des valeurs de l'échantillon...) L'amplitude de l'intervalle de confiance dépend en particulier de la taille de l'échantillon.

Cas conseillé :

Cas avancé :

Dans le cas de l'extracteur durées, seul le mode avancé est disponible.

Enfin, l'utilisateur accès à la dernière étape en cliquant sur

Si l'utilisateur souhaite revoir l'échantillon, il suffit de suivre le lien

  1. Résultats d'ajustement

A cette étape, l'utilisateur obtient le résultat de l'ajustement statistique.

Des tests statistiques sont appliqués automatiquement pour fournir une information sur la tendance, la rupture et la pertinence de l'ajustement :

Un bouton  permet d'accéder aux détails de chaque test statistique. Une info indique également la présence de doublons dans l'échantillon.

La première illustration présente l'échantillon, son ajustement et l'intervalle de confiance de cet ajustement. Ainsi l'utilisateur peut apprécier la pertinence de l'ajustement

L'utilisateur a ensuite accès aux valeurs associées aux principaux temps de retour, et aux incertitudes associées à leur estimation. **Attention, les temps de retour affichés dépendent de la taille de l'échantillon utilisé pour cet ajustement. L’extrapolation de la distribution au-delà de la plus forte observée nécessite une analyse critique prenant en compte différentes sources d’incertitudes :

  1. sur les débits (associées aux mesures de hauteurs, courbe de tarage, paramétrage de stations débitmétriques... cf charte qualité de l'hydrométrie. https://www.ecologie.gouv.fr/sites/default/files/201701_Schapi_Charte_hydro_P01-84_BDcliquable.pdf) ;
  2. sur l’estimation des paramètres de la distribution (càd. distribution d’échantillonnage et intervalle de confiance) ;
  3. sur le choix de la loi de probabilité (càd. adéquation aux observations).

Contrairement au reste des valeurs de débits présentés par HydroPortail, les valeurs de débits obtenus par ajustement statistique ainsi que leur intervalle de confiance ne sont pas arrondis sinon on aurait 2 effets de bord :

  • les intervalles de confiance ne seraient plus tout à fait ceux demandés (95% par défaut)
  • les graphes prendraient parfois un aspect cabossé pour les très faibles et très fortes valeurs. Par exemple :

Des études plus poussées sont recommandées lorsque les enjeux opérationnels sur les quantiles sont importants. Recouper régionalement – spatialement les estimations, et comparer différentes méthodes d’extrapolation. En particulier pour les crues, il est recommandé d’utiliser les méthodes exploitant l’information pluviométrique (Gradex, Shyreg, Schadex…) ou les crues historiques.**

Le dernier tableau détaille les paramètres de l'ajustement.

 

Attention, ici, les valeurs des paramètres sont valables pour des débits en litres par seconde ou des durées en jours. L'utilisateur peut voir les expressions mathématiques de la loi et de ses paramètres en cliquant sur

Un bouton  permet d'obtenir la définition de l'intermittence

Si l'utilisateur souhaite redéfinir l'ajustement statistique, il suffit de suivre le lien

 

Pour mieux comprendre les notations utilisées, connaître la liste des variables disponibles et la correspondance avec Hydro2, voir la page d'aide:

Données et noms des variables