Project

When we introduced the project, we wrote:

The Web is currently in a transition phase. After having been accessible on personal computers, it is now quickly moving to more and more ubiquity and entering in every part and moment of our lives. New devices and new ways to use them are being created. The ubiquity of the Web also creates an unseen abundance of information. Data is flowing onto the Web, created by users, generated by sensors, and stored in ever growing data farms. New ways to consume these data are still to be invented, allowing us to get only the essence of it. On-demand filtering and processing of this huge data flow is required to provide us with the information we need.

One decisive step in the transition towards an intelligent and ubiquitous Web is the availability of linked and structured data. Structured data is already present in the many databases, metadata attached to medias, and in the millions of spreadsheets created everyday across the world. The recent emergence of linked data radically changes the way structured data is being considered. By giving standard formats for the publication and interconnection of structured data, linked data transforms the Web into a giant database.

However, even if the raw data is there, even if the publishing and interlinking technology is there, the transition from raw published data to interlinked semantic data still needs to be done.

DataLift wants to be a catalyst for a faster transition to the linked data Web. In order to achieve this goal, DataLift can count on the large amount of research conducted for fifteen years towards the development of the semantic Web. Standard languages to represent data and their schema, as well as many tools and programming interfaces allowing to manipulate the data are available. Now that research on the semantic Web is entering an experimental phase, DataLift will gather the most prominent results in ontology selection, data conversion, data interlinking, and semantic storage infrastructures in order to provide a comprehensive experimental platform able to accelerate the process of lifting raw published data towards interlinked semantic data.

In the course of the project, the DataLift platform will actually be used to lift existing datasets originating from a large variety of sources. DataLift will build a community of users that will test the platform on their data and give feedback on its usage. DataLift will also demonstrate the benefit of lifting data by developing innovative applications based on the usage of the data published through the platform.

Lorsque nous avons présenté le projet, nous avons écrit :

Le Web est actuellement dans une phase de transition. Après avoir été accessible sur les ordinateurs personnels, il est en train de devenir de plus en plus omniprésent et d’entrer dans chaque partie et chaque moment de nos vies. De nouveaux dispositifs et de nouvelles façons de les utiliser sont créés. L’omniprésence du Web crée également une abondance invisible d’informations. Les données affluent sur le web, créées par les utilisateurs, générées par des capteurs et stockées dans des fermes de données en constante expansion. De nouvelles façons de consommer ces données restent à inventer, ce qui nous permet de n’en tirer que l’essentiel. Le filtrage et le traitement à la demande de cet énorme flux de données sont nécessaires pour nous fournir les informations dont nous avons besoin.

Une étape décisive dans la transition vers un Web intelligent et omniprésent est la disponibilité de données liées et structurées. Les données structurées sont déjà présentes dans les nombreuses bases de données, les métadonnées attachées aux médias et dans les millions de feuilles de calcul créées chaque jour dans le monde. L’émergence récente des données liées change radicalement la façon dont les données structurées sont considérées. En donnant des formats standards pour la publication et l’interconnexion des données structurées, les données liées transforment le Web en une base de données géante.

Cependant, même si les données brutes sont là, même si la technologie de publication et d’interconnexion est là, la transition des données brutes publiées vers des données sémantiques interconnectées reste à faire.

DataLift veut être le catalyseur d’une transition plus rapide vers le Web des données liées. Pour atteindre cet objectif, DataLift peut compter sur les nombreuses recherches menées depuis quinze ans pour le développement du Web sémantique. Des langages standards pour représenter les données et leur schéma, ainsi que de nombreux outils et interfaces de programmation permettant de manipuler les données sont disponibles. Maintenant que la recherche sur le Web sémantique entre dans une phase expérimentale, DataLift rassemblera les résultats les plus importants en matière de sélection d’ontologies, de conversion de données, d’interconnexion de données et d’infrastructures de stockage sémantique afin de fournir une plateforme expérimentale complète capable d’accélérer le processus d’évolution des données brutes publiées vers des données sémantiques interconnectées.

Au cours du projet, la plateforme DataLift sera effectivement utilisée pour lever des ensembles de données existants provenant d’une grande variété de sources. DataLift créera une communauté d’utilisateurs qui testeront la plateforme sur leurs données et donneront leur avis sur son utilisation. DataLift démontrera également l’avantage de lever des données en développant des applications innovantes basées sur l’utilisation des données publiées par la plateforme.