Communiqué de presse : "Projet DATALYSE"

Communiqué de presse | Mardi 01 juillet 2014
Découvrir, expérimenter, mettre en œuvre et appliquer le Big Data : Les partenaires industriels et universitaires associés dans Datalyse font le point à l’issue d’une année de travaux en commun.

Datalyse est un projet financé dans le cadre du Programme d’Etat des Investissements d’Avenir, Développement de l’Economie Numérique, Appel à projets « Cloud Computing » n°3 – Big Data, labellisé par les centres de compétitivité MINALOGIC et PICOM. Il a été lancé le 1er mai 2013 pour une durée de 42 mois.

Logos partenaires Datalyse

Business & Decision, sa filiale Eolas, le Groupement des Mousquetaires, le Laboratoire Informatique de Grenoble (LIG) avec ses équipes SLIDE (ScaLable Information Discovery and Exploitation), ERODS (Efficient and Robust Distributed System) et TYREX (TYpes and REasoning for the Web), le Laboratoire d'Informatique Fondamentale de Lille (LIFL) avec l'équipe-projet SPIRALS, l'Inria Saclay avec l'équipe OAK, et le Laboratoire d'Informatique, de Robotique et de Microélectronique de Montpellier (LIRMM) ont présenté les premiers prototypes devant la DGCIS au bout d’une année d’un travail collaboratif au sein du programme Datalyse.

Datalyse est un projet de recherche en Big Data aux objectifs ambitieux.

L’objectif de Datalyse est de créer une méthodologie Big Data et une collection de prototypes et d’outils de traitement de données, les datalyseurs, qui permettent le passage à l’échelle des gros volumes de données rencontrés dans la pratique. Datalyse définit plusieurs étapes nécessaires dans l’exploitation efficace des Big Data : la préparation, la transformation, l’extraction de valeur et la visualisation.

La première phase est la création du concept de datalyse et de datalyseurs. Dans l’ère du Big Data, le sésame appartient à celui qui sait transformer le volume, la variété, la véracité et la vitesse en valeur. Une datalyse est définie comme un processus dynamique donnant une information raffinée, enrichie et agrégée par une ou plusieurs sources de données. Ces données peuvent être produites par des traitements, des analyses, des élargissements appliqués et choisies avec un angle particulier pour en tirer ou en partager de nouvelles connaissances, des décisions et des actions afférentes.

Les solutions scientifiques qui permettent la production de datalyses sont appelées des datalyseurs. Datalyse a pour objectif la formalisation et la réalisation de datalyseurs qui transforment, en mode juste-à-temps, des données brutes créées par des humains ou par des machines en information actionnable. Tout comme lacatalyse est l'action d'une substance sur une transformation chimique dans le but d'augmenter sa vitesse de réaction, une datalyse est l’action d’opérations d’analyse et de transformation de données dans le but d’augmenter leur qualité et leur vitesse de traitement et de diffusion.

Datalyse introduit plusieurs innovations. Le premier objectif est de faire évoluer positivement le développement d'applications Big Data afin de bénéficier des possibilités nouvelles qu'elles offrent. La seconde phase est l’utilisation de ces datalyseurs pour faire évoluer le développement d’applications Big Data avec la création d’interfaces dans le cadre d’une architecture dédiée.

La méthode de création de datalyseurs part des besoins des traitements intelligents pour Big Data hétérogènes, en particulier dans les domaines de l'Open Data, du commerce de détail, du marketing digital, du pilotage de Datacenter. Dans un premier temps, les datalyseurs nécessaires à chaque cas d’usage ont été identifiés. Ensuite, dans un effort d’unification, une architecture générique pour le traitement des Big Data a été proposée.

L’architecture de Datalyse, d’un point de vue aussi bien conceptuel que logiciel, est la toute première proposée en la matière, tant dans le domaine de la recherche que dans le domaine industriel. Elle témoigne d’une véritable collaboration entre Business & Decision Eolas, le Groupement des Mousquetaires et les partenaires académiques. Enfin, cette architecture dicte une méthodologie de traitement de données Big Data dont l’applicabilité va au-delà des cas d’usage étudiés.

Datalyse présente ses premiers prototypes devant la DGCIS

Les premiers prototypes d’applications Big Data utilisant des datalyseurs, issus de la première année de travaux, sont présentés à la Direction générale de la compétitivité, de l'industrie et des services (DGCIS). Ils sont au nombre de quatre.

Prototype Pilotage de Datacenter dédié à l’analyse du réseau et du trafic, ainsi qu’à l’efficience énergétique :

  • statistiques de trafic de centres de données,
  • données de fonctionnement du Datacenter par la collecte, le traitement et l’analyse des données issues des nombreux points de mesure (capteurs),
  • données : les MBD (Monitoring Big Data) sont de gros volumes de données générées par des machines

Prototype Linked Open Data (LOD) :

  • accéder à des données ouvertes, propres et enrichies (application testée au Musée dauphinois de Grenoble lors de Museomix),
  • utiliser les données UBD (User Big Data), des règles sémantiques et les connecter avec d’autres solutions Open Data,
  • produire les interfaces d’accès aux données (API) et des outils de visualisation.

PrototypeDigital Marketing :

  • fouiller les données de navigation issues des applications hébergées,
  • utiliser les données UBD (User Big Data),
  • produire des statistiques centrées clients pour l’optimisation des sites marchands en ligne.

PrototypeCommerce de détail (retail) :

  • déterminer les mécanismes qui conduisent à un comportement d’attrition,
  • utiliser les données UBD (User Big Data),
  • soutenir les offres promotionnelles,
  • challenger les approches BI conventionnelles.

Datalyse est une architecture Big Data et une modélisation de datalyseurs

Les datalyseurs créés ont porté sur les trois niveaux de l’architecture : Data Preparation pour la collection, le nettoyage (cleaning, enrichment, segregation, linkage) et la transformation ; Data Exploitation pour les applications et prototypes analytiques et statistiques ; Data Visualisation pour mieux comprendre les données.

Architecture Datalyse

Les premiers retours d’expérience ont confirmé l’approche novatrice de Datalyse qui a nécessité un important travail de coordination initiale pour créer la méthodologie liée avec, d’une part, la richesse et la diversité des besoins des différents cas d’usage et, d’autre part, l’hétérogénéité des données.

Les partenaires de Datalyse poursuivent leurs travaux.

Les travaux du groupe se poursuivent durant la seconde année du projet et portent sur des thèmes principaux suivants :

  • extension de la méthodologie de développement d’applications Big Data (infrastructure, architecture, élasticité, streaming),
  • datalyseurs (couplage plus fort des parties stockage et indexation avec les parties transformation et fouille),
  • interface d’applications et de datalyseurs,
  • montée en charge d’acquisition des données Big Data, en volume et en variété.

- Téléchargez le communiqué de presse

- En savoir plus sur le site dédié au projet Datalyse