Statistiques d'utilisation de Hub'Eau

L'analyse des statistiques d'utilisation des APIs de Hub'Eau présentée ci-après concerne le second semestre de l'année 2019 (du 1er juillet au 31 décembre 2019)

Elle est divisée en 4 parties :

 

1. Analyse des appels aux APIs

1.1. Accès par API et endpoint

Le tableau ci-dessous détaille les nombres d'accès aux APIs en fonction des différents endpoints et format de données utilisés.
Durant la seconde moitié de l'année 2019, les APIs de Hub'Eau ont été appelées plus de 76 millions de fois et ont délivré 9 téra-octets de données.

L'API Hydrométrie est de loin la plus utilisée avec plus de 3 appels par seconde en moyenne. Viennent ensuite les APIs qualite_rivieres et qualite_nappes avec plus de 1 million d'appels par mois puis l'API niveaux_nappes (piézométrie). Ces 4 APIs représentent 99,7% de l'utilisation de Hub'Eau.
Les 4 autres APIs utilisées de façon plus marginale sont les prélèvements en eau, les indicateurs des services, la température de l'eau en continu et enfin l'état piscicole.

Le graphique de répartition des accès par API montre la part prépondérante de l'API hydrométrie (plus de 2/3 des appels).

 

1.2. Types de données demandés

Logiquement, ce sont les données de type observations qui sont les plus demandées (débits, niveaux, analyses), loin devant les référentiels (stations, codes) et la documentation.

 

1.3. Formats de données demandés

Le format de données demandé est presque exclusivement le JSON. 1% des demandes concerne le format XML et encore moins pour le format CSV.

 

1.4. Sites utilisateurs des APIs Hub'Eau

La plupart des appels à Hub'Eau ont lieu directement (98%). Les autres ont lieu via des sites web tiers qui appellent les APIs de Hub'Eau. Les principaux sites qui utilisent ainsi Hub'Eau sont :

 

2. Analyse de l'évolution temporelle des appels

L'API hydrométrie a été appelée environ 150 000 fois par jour en moyenne de juillet à octobre 2019. Après un fort pic de fréquentation en novembre 2019 (jusqu'à 1,8 million d'appels journaliers), la fréquentation s'établit actuellement autour de 400 000 appels par jour.

Au total, les 8 APIs de Hub'Eau sont actuellement appelées environ 500 000 fois par jour, après plusieurs pics journaliers : en septembre pour l'API qualite_rivieres (2,5 millions d'appels le 04/09), en octobre pour l'API qualite_nappes (600 000 le 25/10), en novembre pour l'API hydrometrie (1,8 million le 15/11).

De juillet à octobre 2019, Hub'Eau a délivré un volume de données d'environ 30 Go par jour. Depuis novembre 2019, ce volume est proche de 100 Go / jour.

Le mois de novembre 2019 est celui qui a enregistré le plus d'appels aux APIs. Bien que le nombre d'appels ait diminué en décembre, le volume de données fournies par Hub'Eau continue d'augmenter (plus de 3000 Go soit 3 Téra-octets de données fournies par Hub'Eau en décembre 2019).

 

3. Analyse des critères de recherche (paramètres des requêtes)

Cette analyse concerne les critères de recherche passés comme paramètres dans les requêtes. Elle est encore provisoire. Durant le second semestre de 2019, 188 millions de critères de recherche ont été comptabilisés dans les 76 millions d'appels aux APIs de Hub'Eau, soit entre 2 et 3 critères par requête en moyenne.


Sans surprise, les 2 types de critères les plus requêtés sont les dates d'opération (observation, mesure ou prélèvement) et les lieux de mesure (stations, piézomètres, ouvrages, déjà connus de l'utilisateur ou récupérés via un endpoint de type référentiel).

Quelque soit le type de critère, on constate que les codes sont plus utilisés que les libellés pour construire les requêtes.
Après les dates d'opération et les lieux de mesure, vient ensuite la "grandeur" scientifique recherchée, pouvant être la grandeur hydrométrique (débit ou hauteur d'eau), un paramètre physico-chimique, une espèce de poisson ou un indicateur.
On trouve ensuite la recherche par circonscription administrative, très majoritairement la commune.
Ce sont ensuite les statuts qui sont requêtés (critères de type oui/non décrivant l'état d'un objet tel qu'une station en service ou un prélèvement de type "écrasant") puis les entités aquatiques (entités hydrogéologiques de type BDLisa, cours d'eau, masses d'eau). On constate qu'il y a très peu de recherches par masses d'eau (mais ce critère n'est pas toujours disponible) et encore moins par entité hydrographique.

Enfin, il y a très peu de requêtes utilisant les coordonnées géographiques et très peu de recherches par qualification des données. Attention car les données ne sont pas toutes validées !

 

4. Analyse des valeurs recherchées par types de critères

4.1. Type de critère Dates d'observation - Toutes APIs sauf hydrométrie

L'analyse sur les dates a pris en compte toutes les APIs à l'exception de l'API hydrométrie, API temps réel qui ne dispose que d'une profondeur de temps de 1 mois.
On constate que la grande majorité des dates recherchées concerne l'année 2018.
A noter qu'il y a plus de recherches concernant 2017 que 2019. Ceci est dû au fait que les données 2019 ne sont pas encore toutes disponibles.

 

4.2. Type de critère Grandeurs

4.2.1. Critère Grandeurs hydrométriques - API hydrométrie

Un peu moins de 40% des recherches via l'API hydrométrie concerne à la fois les données de débit (Q) et les données de hauteur d'eau (H). Quand un seul type de données est demandé, ce sont les débits qui sont le plus recherchés (33% des recherches), suivis des hauteurs d'eau (28% des recherches).

 

4.2.2. Critère Paramètres physico-chimiques - APIs Qualité

Un peu plus de 80 millions de paramètres physico-chimiques ont été recherchés via les APIs qualité de Hub'Eau durant le second semestre 2019 (ce nombre est supérieur aux 12 millions de requêtes sur les paramètres physico-chimiques affiché dans le tableau des types de paramètre car une requête peut concerner plusieurs paramètres d'une part et peut interroger un groupe de paramètres d'autre part).

Les 5 substances les plus recherchées sont : Nitrates, Température de l'Eau, Chlorures, Sulfates et Cuivre.
En classant les substances par grandes familles, on constate que les recherches concernent d'abord les métaux (Cuivre, Zinc, Chrome, Plomb, ...) pour un peu plus de la moitié des recherches puis les paramètres de minéralisation (Chlorures, Sulfates, Fluor, Magnésium, Sodium, ...) pour environ un quart des recherches puis les pesticides (un peu plus de 10% des recherches).
Viennent ensuite les nutriments azotés et phosphorés (Nitrates, Phosphore total, Ammonium, Orthophosphates, Nitrites) et la Température de l'Eau pour environ 4% des recherches.
Enfin, les autres micropolluants organiques - catégorie comprenant entre autres les HAP (Hydrocarbures Aromatiques Polycycliques), les OHV (composés Organo-Halogénés Volatils), les PCB (PolyChloroBiphényles) et les composés benzéniques - représentent un peu plus de 2% des recherches.


Le tableau ci-dessous détaille les éléments les plus recherchés à l'intérieur de chaque famille.
Les métaux principaux (Cuivre, Zinc, Chrome, Plomb, Arsenic, Cadmium, Nickel, Mercure, Sélénium, Baryum, Antimoine, Chrome hexavalent) sont très souvent recherchés tous ensemble, ils ont donc tous un nombre voisin de recherches.
Les pesticides les plus recherchés sont Dioxation, Chlorpyriphos-éthyl et Lambda-cyhalothrine, le Glyphosate n'arrivant qu'en 4e position.

 

4.3. Type de critère Circonscriptions administratives - Toutes APIs

Les recherches par circonscription administrative (commune, département ou région) ont été agrégées par département afin de pouvoir cartographier les zones recherchées :

Il y a globalement plus de recherches dans la moitié nord que dans la moitié sud de la France. Les zones les plus recherchées couvrent les Hauts de France, les Pays de la Loire, la Bourgogne-Franche-Comté, le Grand Est et le bassin aquitain. A l'inverse, les régions Provence Alpes Côtes d'Azur, Ile de France et les DROM sont moins concernées par les recherches.

 

4.4 Type de critère Lieux de mesure

4.4.1. Points d'eau souterraine - APIs Eaux Souterraines

Les APIs niveau des nappes (piézométrie) et qualité des eaux souterraines ont comptabilisé 9,6 millions de recherches par code point d'eau (piézomètre, forage, puits ou source). 90% de ces recherches ont été effectuées avec les codes points d'eau sous l'ancienne syntaxe (ex. 10155X0010/P) et seulement 10% avec la nouvelle (ex. BSS002JBAA), signe que les utilisateurs sont encore attachés à l'ancien système de codification des points d'eau.

70806 points d'eau ont été interrogés au moins une fois. Parmi eux, 9 points d'eau ont été appelés plus de 100 000 fois, totalisant plus de 1,3 millions d'appels soit 14% du total. 8 de ces points d'eau sont localisés en Picardie, le 9e étant en Vendée. Le point d'eau le plus recherché est le Puits de Huppy (Somme) avec 161 262 appels. La carte ci-dessous montre la localisation des recherches, avec un cercle de rayon proportionnel au nombre de recherches :

Il apparaît que plusieurs zones sont activement recherchées en ce qui concerne les eaux souterraines : les Hauts de France, les départements de Loire-Atlantique et Vendée, la plaine d'Alsace, le bassin aquitain, les départements Aude et Pyrénées-Orientales, Rhône-Alpes, le département de la Marne, le cap Corse, ...

4.4.2. Stations en cours d'eau ou plans d'eau - APIs Eaux Superficielles

4.4.2.1. Stations qualité - APIs Poisson, Qualité des cours d'eau, Température en continu des cours d'eau

Les recherches concernant la qualité des eaux continentales superficielles sont réparties de façon plus homogène que pour les eaux souterraines. Elles concernent tout le territoire, avec cependant une fréquence moindre dans les bassins Adour-Garonne et Artois-Picardie.
Deux stations dépassent les 10 000 recherches : l'Evre à Saint Florent le Vieil (Maine et Loire) et la Sèvre Nantaise à Vertou (Loire Atlantique). Parmi les 20 stations les plus recherchées, 8 sont situées en Loire Atlantique, 4 dans le Rhône et 3 en Maine et Loire.

 

4.4.2.2. Stations hydrométriques - API Hydrométrie

Les recherches sur l'hydrométrie (débits et hauteurs d'eau dans les cours d'eau) concernent l'ensemble du territoire mais un département est particulièrement concerné : la Vendée, qui concentre les 17 stations les plus recherchées (plus de 150 000 recherches chacune). Les 3 dernières stations composant le top 20 sont situées en région PACA dans les départements des Bouches du Rhône, des Alpes de Haute Provence et du Var.

 

4.4.3. Synthèse par département - Toutes APIs

En regroupant toutes les recherches par département (lieux de mesure eaux souterraines §4.4.1 et eaux superficielles §4.4.2, en y ajoutant les recherches par circonscriptions administratives §4.3 et également les recherches par ouvrages et points de prélèvement de l'API Prélèvements en eau), on obtient la carte ci-dessous :

Le département le plus sollicité est de loin la Vendée, avec plus de 3 millions de recherches. Viennent ensuite la Somme, la Loire Atlantique, l'Aude, la Seine et Marne, le Maine et Loire, le Finistère et la Côte d'Or avec plus d'1 million de recherches.
Le grand Ouest, les Hauts de France, les anciennes régions de Languedoc-Roussillon, Alsace et Bourgogne concentrent le plus de recherches.
Parmi les DROM, la Réunion est le territoire le plus sollicité, surtout à propos des eaux souterraines.