Tout se passe comme si la révolution numérique voyait naître une troisième phase : la révolution des données, aussi différente de la révolution Internet qu’Internet l’avait été de l’informatique des années 70. C’est la révolution des big data, du web social, de l’open data, ce sont de nouvelles stratégies de création de valeur, de nouveaux codes sociaux, de nouveaux rapports entre les individus, c’est la datavisualisation et les API, le cloud computing, etc.
Avec cette révolution, les entreprises, les citoyens, les administrations ou encore les chercheurs se mettent à travailler au niveau élémentaire de la donnée, à manipuler des distributions complètes, à percevoir des signaux faibles, pour, une fois encore, changer en profondeur l’économie et la société. C’est un tout nouveau rapport au savoir, au pouvoir et à l’action qui se dessine.
C’est dans cette révolution que le web des données prend tout son sens. Le web des données et le web sémantique sont les deux facettes de cette nouvelle infrastructure informationnelle, à la recherche d’un web où les données de toutes formes produites par tous les acteurs se trouvent interconnectées, identifiées sans ambiguïté et reliées les unes aux autres. Un web où la création de nouveaux services, de nouveaux usages, de nouveaux croisements des données est grandement simplifiée et où la mise en réseau des moyens de production ouvre la voie à de nouveaux modèles d’innovation.
La France est engagée dans ce mouvement en tant qu’acteur à part entière de cette révolution qui voit le numérique connecter le monde.
Son offre de formations scientifiques de haut niveau, les compétences des chercheurs français et les travaux scientifiques des laboratoires et instituts de recherche français, comme le Laboratoire d’Informatique, de Robotique et de Microélectronique de l’Université de Montpellier II (LIRMM), l’Institut National de Recherche en Informatique et en Automatique (INRIA), le Centre national de la recherche scientifique (CNRS) ou le Laboratoire de Recherche en Informatique d’Orsay (LRI), sont largement reconnus à l’international.
La communauté du web sémantique français rassemble des entreprises performantes et innovantes – comme Antidot, Atos, Exalead, Logilab, Mondeca, Pearltrees, Semsoft ou Temis – ainsi que des associations comme la FING et le GFII qui diffusent activement les nouveaux usages que permet le web des données.
Les démarches d’ouverture des données publiques initiées par l’Etat ou les collectivités territoriales – comme Montpellier avec l’initiative Montpellier Territoire Numérique – contribuent également à l’émergence du web sémantique. La diffusion la plus large de données publiques, les vagues technologiques de l’Open Data ou du Big Data, les nouveaux métiers des data-scientists ou des data-journalistes contribuent à former une véritable filière industrielle de la donnée et de ses usages.
L’Etat lui-même peut aussi bénéficier des avancées issues de la recherche sur le web sémantique. Pour apporter du sens et rendre interopérables les données hétérogènes de ses systèmes d’information, l’Etat a notamment élevé sémantiquement des données brutes structurées avec la plateforme open-source du
consortium Datalift.
L’application des technologies sémantiques à l’indexation et à la découverte facilite aussi la réutilisation des données de l’Etat. La plateforme française d’Open Data data.gouv.fr est ainsi conçue à partir d’un catalogue sémantique et interopérable
de métadonnées descriptives. La Bibliothèque nationale de France (BNF) diffuse par ailleurs sur cette plateforme les fiches de référence sur les auteurs et les œuvres de son catalogue en formats sémantiques. La plateforme Montpellier Données Publiques Ouvertes exploite elle aussi les dernières avancées en la matière.
Ces technologies appuient également la constitution d’annuaires et de référentiels partagés au sein des services de l’Etat. L’INSEE publie ainsi des versions sémantiques du Code Officiel Géographique qui recense les subdivisions administratives du territoire ou les données du recensement de la population. Etalab a aussi réalisé, avec le concours de la Direction de l’Information Légale et Administrative (DILA), un référentiel sémantique des administrations de l’Etat.
Le 19 Novembre 2012, le ministère de la Culture et de la Communication a signé une convention avec Wikimédia et l’Inria créant la plate-forme collaborative «Sémanticpédia », visant à créer des programmes de recherche et de développement en matière culturelle à partir des données extraites de Wikipédia francophone. La délégation générale à la langue française et aux langues de France soutient également le projet de version sémantique du Wiktionnaire francophone. C’est ainsi plus de deux millions de termes qui viendront s’ajouter au réseau sémantique des articles de Wikipédia.
L’ensemble de ces travaux s’inscrivent dans le cadre des études et des projets de la Commission Européenne – comme Interoperability Solutions for European Public Administrations, Linked Open Data 2 ou la plateforme ENGAGE – et des organismes internationaux tels que le World Wide Web Consortium (W3C).
Etalab, mission du Premier ministre en charge de l’ouverture des données publiques mais aussi de la promotion de l’innovation privée et publique sur ces données, compte s’appuyer sur l’important travail réalisé par la communauté scientifique française du web sémantique, et en attend beaucoup pour le développement d’une véritable
culture de la donnée en France.
C’est pourquoi je me réjouis de vous assurer du soutien d’Etalab à cette 10ème édition de la Conférence Européenne du Web Sémantique, et souhaite de bons travaux aux intervenants et aux participants qui seront réunis à Montpellier du 27 au 30 Mai 2013.
Henri Verdier
Directeur d’Etalab