Aller au contenu principal
Il y a présentement des items dans votre panier d'achat.
Ha-Loan Phan, Wikimédia Canada

En 2019, nous nous sommes engagés dans un projet audacieux : libérer un ensemble complet de données structurées provenant d’une institution gouvernementale dans les projets Wikimedia, afin de maximiser sa diffusion et sa réutilisation. Environnement et Changement climatique Canada, qui relève du Gouvernement du Canada, a accepté de financer notre projet pour deux ans, soit jusqu’au 31 mars 2021. Nous désirons vous partager le fruit de plusieurs mois de travail

Ha-loan Phan
Station météorologique de Haines Pass, située dans le territoire canadien du Yukon, 2018. Crédits : Erik Stevens.

[Le présent article a été publié initialement dans le blogue du mouvement Wikimédia, sous le titre de 100 ans de données météorologiques d'Environnement et Changement climatique Canada dans Commons - Wikimédia Canada.]

100 ans de données météo?

Oui, vous avez bien lu. Les relevés météo les plus anciens au pays remontent à 1840, soit plus de 170 ans. En 2021, le Service météorologique d’Environnement et changement climatique Canada (ECCC) fête ses 150 ans, ce qui en fait l’une des plus vieilles institutions canadiennes. Tout un patrimoine météorologique! La complétude des relevés des 8 756 stations météorologiques dispersées d’un océan à l’autre de notre territoire rendent ces informations scientifiques intéressantes et précieuses dans un contexte de données ouvertes et de sensibilisation de la population aux changements climatiques. Ces données sont déjà en accès libre sur le site Internet d’ECCC, mais nous tenions à mettre en valeur cette mine d’informations brutes.

Le projet

La première phase (2019-2020) consiste en l’import massif des données météo d’ECCC dans Commons. On parle de dizaines de paramètres relevés (température, vitesse des vents, précipitations, etc.). En tout, quatre jeux de données météo sont rendus disponibles par ECCC : l’almanach (soit les records), les données mensuelles, les données quotidiennes et les données horaires. C’est un énorme volume de données et cet import massif n’a pas de précédent dans le projet Commons, où l’on retrouve habituellement des images, des vidéos et des enregistrements audio. Pour ne pas se mettre à dos la communauté, il a été décidé durant cette première phase d’importer uniquement les données d’almanach et les données mensuelles. On parle de plus de 26 millions de données en tout! Cet import massif de données gouvernementales est une première mondiale à notre connaissance.

La deuxième phase (2020-2021) consiste à trouver des idées pour mettre en valeur ces données et les disséminer au travers des projets Wikimedia, comme Wikipédia, qui reste de loin le projet le plus connu et le plus consulté de la famille de projets Wikimedia. Wikimédia Canada a donc collaboré avec deux institutions et réseaux scientifiques ayant à coeur notre mission : l’Acfas et IVADO. Nous avons organisé une première présentation, le 27 janvier 2021. C’était la première fois que nous évoquions le projet en dehors de notre petite équipe. Pourtant, ce fut un véritable succès. Sur notre invitation, plus de 60 personnes issus de différents organismes (privés, gouvernementaux, paragouvernementaux, OBNL,…) se sont jointes à nous. Quelques semaines plus tard, nous réunissons 12 personnes d’horizons divers pour tenir une séance de remue-méninges et bénéficier de l’intelligence collective.

Nous voulons répondre à trois questions :

Les résultats

  • Comment utiliser ces données et les disséminer au travers des projets Wikimedia pour leur donner un sens et les rendre accessibles au plus grand nombre?
  • Comment influencer le reste du monde à importer des jeux de données similaires pour les mettre en accès libre dans les projets Wikimedia?
  • Comment ces données peuvent nous aider à adresser certaines questions sur les changements climatiques?

L’import de données a nécessité la création de quatre outils (un outil de téléversement, un outil de fusion, un outil de discrimination et enfin, un outil de conversion). Il a fallu passer d’un modèle de données en format XML au format JSON, plus restrictif, mais qui est utilisé globalement par les projets Wikimedia.

Phan
Carte de toutes les stations météo du Service météorologique du Canada ayant déjà existé. Miguel Tremblay. CC BY 4.0. Crédits : Image des stations météorologiques : Miguel Tremblay.

Le remue-méninges a donné quatre grands axes pour disséminer les données :

  1. la visualisations de données;
  2. la valorisation descriptive des données météo pour “augmenter” des informations relatives à des événements, des lieux ou des personnes;
  3. la valorisation prescriptive des données météo pour aider à la décision dans différents secteurs et d’autres pays;
  4. la création de pages Meta-Wiki (pages servant à coordonner les projets) pour inviter les Wikimédiennes et Wikimédiens partout dans le monde à reproduire le projet.

Le rapport final et autres liens utiles

Le rapport final et autres liens utiles :

  • Ha-Loan Phan
    Wikimédia Canada

Vous aimez cet article?

Soutenez l’importance de la recherche en devenant membre de l’Acfas.

Devenir membre Logo de l'Acfas stylisé

Commentaires