Presentation

We are producing increasingly datasets. Their formats are heterogeneous and not always easy to handle. The needs are not only to exchange datasets, but also to link them in order to extract the particular value for our own business.

Datalift is an original platform dedicated to the exploitation of data. In Datalift, the input data are raw data coming from multiple heterogeneous formats (databases, triplestores, CSV, XML, RDF, RDFa, GML, Shapefile, …). The output data produced are « Linked Data », they are also named semantic and interconnected data. The Datalift platform is actively involved in the Web mutation to the Linked Data.

The originality of Datalift fonds of its architectural, functional and technological characteristics, but also to the nature of the treated data. This « data lift » is derived from a research and development project launched in the last quarter of 2010 and supported by the National Research Agency (ANR). The objective of the project was to promote the emergence of Web data by industrializing and facilitating the structuration, the publication, the interconnection and the use of a critical mass of data.

Today, the project goal is reached: develop a platform to publish and interlink datasets on the web of data. Datalift is now a solution that allows the publication of valued datasets including from a network of partners and provides a set of tools to facilitate the process of publishing linked datasets.

Nous produisons de plus en plus de jeux de données. Leurs formats sont hétérogènes et pas toujours faciles à manipuler. Les besoins ne sont pas seulement d’échanger des jeux de données, mais aussi de les relier afin d’en extraire la valeur particulière pour notre propre activité.

Datalift est une plateforme originale dédiée à l’exploitation des données. Dans Datalift, les données d’entrée sont des données brutes provenant de multiples formats hétérogènes (bases de données, triplestores, CSV, XML, RDF, RDFa, GML, Shapefile, …). Les données de sortie produites sont des données liées, des ” Linked Data “. Elles sont aussi appelées données sémantiques et interconnectées. La plateforme Datalift participe activement à la mutation du Web vers les Linked Data.

L’originalité de Datalift tient à ses caractéristiques architecturales, fonctionnelles et technologiques, mais aussi à la nature des données traitées. Ce ascenseur de données (” data lift “) est issu d’un projet de recherche et développement lancé au dernier trimestre 2010 et soutenu par l’Agence Nationale de la Recherche (ANR). L’objectif du projet était de favoriser l’émergence du Web data en industrialisant et en facilitant la structuration, la publication, l’interconnexion et l’utilisation d’une masse critique de données.

Aujourd’hui, l’objectif du projet est atteint : développer une plateforme pour publier et interconnecter des jeux de données sur le web de données. Datalift est désormais une solution qui permet la publication de jeux de données valorisés, y compris à partir d’un réseau de partenaires, et fournit un ensemble d’outils pour faciliter le processus de publication de jeux de données liés.