simplifiez votre edi en l'externalisant
+33 4 81 91 79 99

Qu’est-ce que le Fair Data et comment l’intégrer dans mon organisation?

Qu’est-ce que le Fair Data et comment l’intégrer dans mon organisation?
03/12/2021

Le concept de Fair Data est né dans les années 2014 afin d'harmoniser la publication des données scientifiques et faciliter leur accessibilité. En effet, avec le BigData, la digitalisation des connaissances, le volume des données numériques disponibles croit de façon exponentielle et désordonnée. De fait rechercher dans cette masse d’informations ce qui peut être utile, devient de plus en plus difficile. C'est pour remédier à ces difficultés, que le monde de la recherche scientifique a mis en place, avec succès, le concept de Fair Data.

Découvrez dans cet article ce qu’est le Fair Data, ses origines et ses enjeux. Et aussi pourquoi et comment l’intégrer ce mode de gestion des données dans l’entreprise et en obtenir des bénéfices.

Les quatre principes du Fair Data

Publier, partager des données de recherche ont toujours été des principes de base du travail collaboratif dans le monde scientifique. Le besoin de stocker de façon pérenne des informations dans des formats numériques pour qu’elles soient facilement accessibles et réutilisables, est primordial. De plus de nombreuses études ont démontré que 80% des données scientifiques sont perdues ou devenues inaccessibles, 20 ans après avoir été publiées.

Il est donc nécessaire d’agir de façon proactive pour que les données soient conservées selon des principes qui garantissent dans le temps leur accessibilité et leur lisibilité.

A l’initiative de Force 11, communauté scientifique internationale, les principes du Fair Data ont été posés dès 2014. L’objectif du Fair Data est de publier et partager des données scientifiques qui puissent être directement réutilisables par les machines et les hommes sans nécessité de traitements préparatoires. Les données publiées doivent suivre quatre principes :

F : Faciles à retrouver,

Chaque donnée doit être identifiable de façon unique, décrite avec des métadonnées, des mots-clés et accessible par des moteurs de recherche.

A : Accessibles,

Les données sont accessibles mais pas nécessairement libre d’accès, un identifiant peut être nécessaire et obligatoire pour les consulter et les télécharger.

I : Interopérables,

Les données et leurs métadonnées respectent les standards et les formats internationaux en vigueur afin que tous Système d’Information puisse les lire et les comprendre.

R : Réutilisables

Les données sont réutilisables en état soit de façon libre soit sous licence pour toute autre utilisation et que leur origine soit connue et vérifiable. des données Fair Data seront toujours techniquement lisibles et utilisables. On parle dès lors de FAIRisation des données scientifiques.

Source : DoRANum. Données de la recherche : apprentissage numérique. France : DoRANum; 2019. Les principes FAIR : https://doranum.fr/enjeux-benefices/principes-fair/

Fair Data vs Open Data

Il est important de préciser que le Fair Data n’est pas l’Open Data. L’Open Data sont des données libres d’accès et utilisables par tous pour n’importe quel objet. Le Fair Data sont des règles de mise en forme et d’accessibilité technique. Des données respectant les principes Fair Data ne sont pas nécessairement des données Open Data. Des données Fair Data peuvent être confidentielles.

Comment intégrer le Fair Data dans mon organisation ?

Les avantages que procurent le Fair Data pour rendre toutes les données plus facilement accessibles et réutilisables par les machines et par l’homme sont clairement établis. Est-il possible de faire de même dans une entreprise ? Et d’en obtenir des bénéfices.

Quelle démarche suivre pour intégrer le Fair Data ?

Une gouvernance de données ou Data Governance devra mettre en œuvre les principes du Fair Data :

  • Enrichir les données de métadonnées afin de les décrire de façon unique et claire. Comme le photographe qui ajoute des tags à ses photos pour les trier et les rechercher : la photo d’une voiture sera non seulement datée et géolocalisée mais aussi sera taguée de la marque, du type de voiture, du modèle, de la couleur, etc.…
  • Mettre les données dans des formats normalisés lisibles et interprétables par tous,
  • Stocker les données dans un entrepôt de données facilement accessible,
  • Si des tiers à l’entreprise ont accès à ces données, les règles d’utilisation seront clairement établies, libre ou sous licence avec mention de la source.

Quelles méthodes et quels outils ?

Pour atteindre cet objectif de « FAIRisation » de ses données, l’entreprise dispose de méthodes et d’outils :

Le Data Management pour organiser et gérer en place une politique de gestion des données dans l’entreprise. Le MDM permet de préciser des règles de contrôle et de nommage des données dans l’entreprise.

L’entrepôt de données ou Data Warehouse pour stocker les données de l’entreprise et partager avec toutes les applications métiers. L’entrepôt de données est le lieu unique dans lequel toutes les données de l’entreprise sont stockées après avoir été validé et mise en forme.

L’ETL, Extract Transform Load, pour extraire les données des applications de l’entreprise, les nettoyer, les enrichir, les mettre dans un format standard puis les stocker dans l’entrepôt de données pour être analysées.

Quels bénéfices pour l’entreprise ?

Dans une économie digitale les données sont la richesse de l’entreprise mais cette richesse n’est tangible que si les données sont exploitables comme le filon d’une mine.

Disposer de données « FAIR », Faciles à trouver, Accessibles, Interopérables, Réutilisables, garantit à l’entreprise que les données stockées seront toujours exploitables. Les principes FAIR s’appliquent à tous les types de données, des données structurées en provenance des logiciels de gestion, de comptabilité, de paie et aussi à tous les formats non structurés : photo, vidéo, publications, contrats que produit une entreprise.

L’entreprise sera en mesure d’en obtenir des bénéfices de trois ordres :

  • Des gains opérationnels :
    • De l’information immédiatement disponible et compréhensible pour être partager et utiliser par des applications métiers,
  • Des gains stratégiques :
    • Une quantité importante de données et classées, enrichies, dans des formats normalisés prêtes pour des outils d’analyse décisionnelle,
  • Des gains humains :
    • Tout le travail produit par les collaborateurs de l’entreprise est classé, documenté et conservé. Et pourra demain être retrouvé et réutilisé en état.

Le Fair Data, pour capitaliser sur les données !

Jusqu’alors les objectifs de la gestion de la donnée en entreprise étaient essentiellement axés sur la qualité de la donnée, sa disponibilité et sa sauvegarde à des fins de sécurité. Avec le Fair Data, de nouveaux objectifs :

  • L’accessibilité de la donnée par des tiers,
  • La conservation de la donnée dans le temps.

Si la gestion de la donnée permet d’optimiser et de sécuriser l’utilisation les données, l’application des principes du Fair Data permet de capitaliser sur les données.

La FAIRisation des données un atout pour que l’entreprise réussisse sa transformation digitale et capitalise sur son patrimoine numérique.

Expert de la gestion de données depuis plus de 30 ans, Tenor propose à ses clients des solutions de Data Management, des solutions d'échange de données informatisé et de facture électronique. Prenez le temps de faire un tour sur le Blog de Tenor et de parcourir nos meilleurs articles sur le Data Management.