Définition de Open data
⌚: 4 minutes
L’Open Data sont des informations numériques qui font l’objet d’une licence de manière à ce qu’elles soient accessibles à tous, avec peu d’autorisations nécessaire. Les données sont généralement soit publiques, soit ouvertes, soit attribuées. Toute donnée ou contenu libre d’utilisation et distribué relève de la notion d’Open Data. Allons plus loin et répondons à cette question : qu’est-ce qu’une donnée ouverte ?
Voici quelques exemples de données ouvertes :
- Les données financières des gouvernements
- Les informations boursières que vous voyez défiler sur votre flux d’informations.
- Les statistiques sur les données du marché auxquelles vous pouvez accéder via un moteur de recherche.
- Les recherches universitaires publiées.
En revanche, les données « fermées » limitent souvent leur utilisation, les liant à l’obtention d’une licence pour des raisons de sécurité ou de confidentialité. Un exemple de données fermées pourrait inclure des informations financières auxquelles seul le propriétaire d’une marque peut avoir accès. Il peut s’agir de données sur les ventes aux consommateurs propres à une entreprise à but lucratif ou d’autres informations sur les consommateurs ou les entreprises qui sont jugées « sensibles » comme les données détaillés de patients.
Pourquoi les données de l’Open Data ont-elles de la valeur ?
La technologie nous a permis de saisir des données d’une manière et dans des volumes que beaucoup plus importantes. Des outils d’analyse de données de plus en plus sophistiqués nous permettent d’analyser les données d’une nouvelle manière afin de découvrir les tendances et les résultats qui ont façonné des décisions commerciales cruciales. Ces outils nous permettent de voir des liens entre des données qui n’ont jamais été explorées.
Le débat s’intensifie sur la question de savoir qui doit contrôler ces données : les entreprises et les gouvernements qui les collectent, ou le public qui en bénéficie ?
En d’autres termes, la connaissance est un pouvoir. Le partage des connaissances permet la dispersion du pouvoir d’une manière qui profite au plus grand nombre, et non à quelques-uns. C’est le fondement philosophique qui sous-tend le concept de données ouvertes.
Quels sont donc les avantages les plus courants des données ouvertes ?
1. Responsabilité
Des données ouvertes peuvent permettre aux actionnaires de comprendre les décisions prises au niveau de l’entreprise. Elles peuvent aider les citoyens à voir comment l’argent de leurs impôts influe sur l’amélioration des infrastructures municipales. La transparence financière et éthique du gouvernement renforce la démocratie. L’ouverture des données favorise la responsabilisation des entreprises, des cultures et des pays.
2. Autonomisation
Les données ouvertes peuvent permettre aux individus de mener leurs propres recherches conduisant à des changements de comportement qui améliorent leur santé. Les données ouvertes que l’on trouve sur Internet ont été un outil incroyable pour éduquer et responsabiliser les consommateurs en matière de comportements d’achat. L’accès aux données ouvertes a un impact sur la prise de décision personnelle en permettant aux individus de rassembler tous les faits avant d’agir.
3. Mesure de l’impact
Les données ouvertes permettent aux décideurs politiques de comprendre l’impact de leurs décisions. Elles peuvent aider les spécialistes du marketing à discerner les modèles de vente qui leur permettent d’ajuster leurs stratégies commerciales en fonction des nouvelles tendances. Elles peuvent également influencer de manière proactive les décisions de planification futures en mesurant les tendances historiques, ce qui a un impact sur tout, de la préparation aux catastrophes aux taux d’intérêt.
4. Les progrès scientifiques et technologiques
La méthode scientifique repose sur l’élaboration d’une hypothèse, puis sur l’essai de divers concepts pour prouver ou réfuter la théorie. Chaque expérience devient une donnée qui alimente la recherche à suivre. Les percées scientifiques et technologiques, trop nombreuses pour être citées, sont le résultat de cette construction progressive des connaissances basée sur la recherche partagée.
Dans le domaine de la technologie, les données ouvertes sont utilisées par les entrepreneurs pour créer des entreprises, comme Development Seed, qui utilise des API de données ouvertes pour résoudre des problèmes d’ingénierie. Ou le projet Open Bank qui crée les API de données ouvertes à l’usage des banques.
Il est clair que tout le monde, des citoyens aux fonctionnaires, en passant par les chercheurs et les entrepreneurs, peut bénéficier des données ouvertes. Mais quelle est la différence avec les données fermées ?
En quoi les données ouvertes diffèrent-elles des données fermées ?
Toutes les données se situent sur une échelle entre les données fermées et les données ouvertes car il existe des différences dans la manière dont les informations sont partagées entre les deux points du continuum (de données fermées à ouvertes). Les données fermées peuvent être partagées avec des personnes spécifiques dans le cadre d’une entreprise. Les données ouvertes peuvent nécessiter l’attribution de permission de la source contributrice, tout en restant entièrement disponibles pour l’utilisateur final.
En général, la pratique acceptée suggère que les données ouvertes diffèrent des données fermées de trois façons principales :
- Les données ouvertes sont accessibles, généralement via un entrepôt de données sur Internet.
- Elles sont disponibles dans un format lisible.
- Elles sont sous licence de source ouverte, ce qui permet à quiconque d’utiliser les données ou de les partager à des fins non commerciales ou commerciales.
- Les données qui sont ouvertes au public par le biais d’un droit de licence ou d’une autre condition préalable.
Les données fermées restreignent l’accès à l’information de plusieurs façons possibles :
- Les données sont brevetées ou propriétaires.
- Les données sont semi-restreintes à certains groupes.
- Elles ne sont accessibles qu’à certaines personnes au sein d’une organisation.
- Les données qui sont difficiles d’accès, comme les dossiers papier qui n’ont pas été numérisés.
L’exemple parfait de données fermées pourrait être des informations qui nécessitent une autorisation de sécurité, des informations relatives à la santé collectées par un hôpital ou une compagnie d’assurance ou, à plus petite échelle, vos propres déclarations d’impôts personnelles.
Quels sont les secteurs/industries qui utilisent des données ouvertes ?
Les données alimentent l’innovation. L’innovation est le moteur de la croissance économique. Les partisans des données ouvertes affirment que l’accès à l’information est la clé d’une société en évolution. Les données ouvertes peuvent aider les citoyens à demander des comptes à leur gouvernement. Elles peuvent également constituer la clé de la résolution de certains de nos problèmes planétaires les plus difficiles, tels que le changement climatique et la pollution ou la pauvreté et la famine.
Les entreprises, les gouvernements ou les communautés peuvent tirer parti des données ouvertes pour créer de nouveaux services ou produits. Les données ouvertes profitent aux entités à but lucratif et non lucratif, ainsi qu’à l’économie et aux particuliers. Voici quelques-unes des entités qui profitent actuellement de l’exploitation des données ouvertes.
1. Culturel
Les musées, les bibliothèques et les archives ont désormais numérisé d’importants objets culturels et les ont stockés sur le web sous forme de données ouvertes. Ces efforts soutiennent le discours scientifique et éduquent les populations sur nos données culturelles historiques les plus précieuses.
2. Environnement
Des données ouvertes sont utilisées pour surveiller et conserver les zones humides d’Europe et la biodiversité de ces environnements fragiles dans le cadre d’un projet appelé LifeWatch, qui rassemble des données recueillies dans huit pays européens.
Aux États-Unis, l’université d’État de l’Oregon utilise des données ouvertes pour suivre les changements du niveau de la mer sur la côte ouest. Le Chesapeake Conservancy et le Chesapeake Bay Project ont récemment publié les données ouvertes de leur projet afin de suivre la façon dont la pollution affecte les plantes, les animaux et les personnes qui entourent cette ressource naturelle.
3. Finance et banque
Des données ouvertes peuvent aider les institutions financières à utiliser l’analyse prédictive pour se préparer aux fluctuations du marché. Elles peuvent utiliser les statistiques pour modifier leur offre de produits afin de s’adapter aux tendances démographiques et à l’évolution des préférences des clients. Les données ouvertes peuvent également aider à détecter et à arrêter plus rapidement les activités frauduleuses. Un exemple de données ouvertes dans ce secteur est la publication par Fannie Mae de données sur 700 000 prêts individuels en 2010. Ces données ont été publiées pour aider les investisseurs à comprendre la performance des titres de l’agence.
4. Gouvernement
Au gouvernement, la transparence des données est de plus en plus un problème. Les militants réclament plus d’informations sur tous les sujets, des finances personnelles des candidats à la présidence aux comptes rendus sur la façon dont l’argent des contribuables est dépensé. La transparence des données permet aux organismes civiques de communiquer plus efficacement avec les citoyens, ce qui peut renforcer le concept de gouvernement « par le peuple et pour le peuple ».
Certaines administrations avant-gardistes ont adopté le concept de données ouvertes. À Raleigh, en Caroline du Nord, des responsables de la ville et du comté se sont réunis pour créer le Durham Open Data Portal, un portail web contenant des données pertinentes pour la communauté et ayant un impact sur l’éducation, la criminalité, les finances, les transports, la santé publique, etc. Les citoyens peuvent désormais accéder aux données ouvertes via un portail web qui comprend des tableaux de bord faciles à utiliser, des cartes interactives et un index de données consultable. Les législateurs de Durham affirment que le portail a renforcé l’engagement de la communauté dans le processus décisionnel du gouvernement, en favorisant une communication ouverte entre le gouvernement et les personnes qu’il sert.
À plus grande échelle, en 2013, les États-Unis et d’autres dirigeants du G7 ont créé la Charte des données ouvertes pour créer des données gouvernementales accessibles et transparentes. Les données peuvent être utilisées pour promouvoir la responsabilité, accroître l’efficacité et favoriser l’innovation dans les secteurs scientifique et privé.
5. La recherche et la science
Nous avons discuté de la manière dont les données ouvertes utilisées dans la méthode scientifique s’appuient sur les recherches antérieures pour créer des innovations médicales, environnementales ou technologiques. Mais le concept de données ouvertes est appliqué pour éliminer réellement les goulots d’étranglement qui ralentissent la recherche sur la maladie d’Alzheimer. Pharmacog est un partenariat entre 32 organisations industrielles et universitaires de sept pays qui partagent des données et accélèrent le rythme des recherches menant à la découverte d’un remède.
6. Technologie
Dans le monde de la technologie, certaines des dernières innovations logicielles sont liées à des données ouvertes. La start-up technologique OpenSensors.io est un fournisseur d’Internet des objets qui relie le matériel sensoriel à une entreprise via Internet. OpenSensors utilise des données ouvertes pour aider les entreprises à se connecter.
Les projets de données ouvertes comme ceux-ci explosent dans le monde des technologies, favorisant l’échange ouvert d’informations, la collaboration et le développement axé sur la communauté.
De la même manière que la communauté des chercheurs a mis en place des couches de recherche pour guérir les maladies, le secteur technologique utilise les données ouvertes pour encourager les progrès dans tous les domaines, des applications téléphoniques à la réalité virtuelle.
Alors, qu’est-ce que l’Open Data ?
L’évolution de la technologie a permis une explosion exponentielle de l’Open Data accessibles par nos appareils numériques. L’ère de l’information est en train de passer à l’économie de la connaissance, car de plus en plus d’entreprises tirent profit des données des consommateurs pour stimuler leur croissance. Dans ce cas, la connaissance est, littéralement, une richesse, car les améliorations de l’analyse des données nous permettent de discerner des modèles de comportement. Les entrepreneurs exploitent alors les données ouvertes pour créer des produits et des services en vue d’un gain financier. Selon McKinsey, l’impact économique des données ouvertes se situe entre 3 et 5 000 milliards de dollars par an.
Les données ouvertes sont une entité autonome, qui évolue constamment en temps réel. Il en va de même pour les avantages de l’utilisation des données ouvertes, car des outils d’analyse de données de plus en plus sophistiqués nous permettent de gérer des données importantes et de tirer de nouvelles idées pour façonner notre monde de demain. Nous savons que le partage ouvert des données entre les entreprises, les chercheurs, les spécialistes du marketing et les gouvernements conduit à l’innovation dans tous ces secteurs. Cela illustre clairement la valeur et l’importance des données ouvertes à l’avenir.