Thèse de Doctorat CIFRE : Interrogation et analyse d'entrepôts de données massives basées sur des systèmes de prédiction.

May 24, 2019

Notre DataLab, le CBI² dirigé par Fatma Abdelhedi, en collaboration avec l'IRIT (Institut de Recherche en Informatique de Toulouse), propose chaque année des opportunités de Thèse de doctorat CIFRE sur des thématiques autour de la Business Intelligence, ou comme ici le Big Data et Analyse Prédictive ! 

En voici un exemple de sujet. 

 

Présentation du sujet :

    

Les entrepôts de données actuels sont principalement élaborés à partir de bases de données relationnelles. Or les besoins d’analyses évoluent et exigent de plus en plus la prise en compte de nouvelles sources de données, peu ou pas structurées, issues de capteurs, d’applications internet ou du Web mobile. Il convient donc d’extraire le plus de valeur possible du Big Data, c’est-à-dire d’ensembles de données répartis représentant un volume considérable avec des types et des formats extrêmement variés.

Les systèmes NoSQL permettent de gérer des Big Data en apportant de bonnes performances et une grande souplesse en matière de stockage de données structurées et non structurées. Mais ces systèmes présentent des caractéristiques (schéma de données variable, langages non standard) qui rendent inopérants les modèles et langages de bases de données actuels.

    

Pour effectuer des analyses et des prédictions, les décideurs doivent pouvoir accéder à de grandes masses de données en toute autonomie, sans avoir recours à des informaticiens ou bien à des logiciels et langages complexes.

    

Le projet que nous développons vise à mettre à la disposition des professionnels du droit (analystes juridiques) un outil de prédiction de l’issue d’un contentieux. Selon la nature du tribunal saisi, la durée estimée du procès, la nature du défendeur et les arguments avancés, le résultat d’un jugement peut varier.

L’objectif est de pouvoir prédire l’issue d’un contentieux (ou du moins son pourcentage de réussite), la durée de la procédure ainsi qu’un montant probable des indemnités. Cette prédiction qui s’appuiera sur la jurisprudence, pourrait prendre en compte des critères complexes tels que l’évolution des préjudices entre le moment où la procédure sera engagée et l’établissement du jugement.

    

Pour répondre à la problématique, il est nécessaire d’étendre les processus existants et de faire appel à de nouveaux modèles et techniques de gestion de données et de prédiction. Notamment des connaissances complémentaires doivent être déduites des données et des comportements des utilisateurs. Des modèles et algorithmes issus de l'apprentissage automatique seront utilisés et évalués dans le cadre de l’application.

    

Pour répondre à cette problématique de recherche, plusieurs points doivent être étudiés. Il conviendra d’analyser les données de l’application pour en isoler les caractéristiques essentielles, notamment la dimension temporelle, puis les modéliser au plan sémantique. Pour prédire les décisions, il sera utile d’étudier des modèles prédictifs basés sur l’apprentissage automatique ; ceux-ci seront appliqués sur les masses de données juridiques. Au plan de l’autonomie, le décideur devra être capable d’exprimer des requêtes complexes afin d’extraire les données des sources, ceci sans faire appel à un informaticien.

 

 

Profil du candidat :

 

Diplômé d’un master ou d’une école d’ingénieur en informatique avec un bon niveau académique.

Certains acquis parmi les compétences suivantes seront appréciés :

 

-          Modèles et langages de bases de données.

-          Connaissances et expériences dans les Big Data (NoSQL : Hadoop, MongoDB).

-          Connaissances en Machine Learning.

-          Bonnes compétences en programmation (Java, R, Python, etc.).

-          Bonnes qualités rédactionnelles (précision, synthèse, clarté).

-          Un bon niveau en anglais (écrit et oral).


 

Dates :

 

    -   Candidature : le plus tôt possible.

    -   Début de thèse : septembre/novembre 2019.

 

 

Modalité de candidature :

 

Laboratoire : Institut de Recherche en Informatique de Toulouse (IRIT)

Entreprise : Société TRIMANE – Laboratoire CBI²

Localisation : TRIMANE – Saint Germain-en-Laye

Candidature : CV détaillé + lettre de motivation + relevés de notes licence et master + deux personnes référentes (ou lettres de recommandation) à l’adresse mail : liengie.nal@trimane.fr , avec en objet la référence du poste « TMECIFRE0519 »

 

Share on Facebook
Share on Twitter
Please reload

Posts à l'affiche

TRIMANE à la conquête de Montréal !

June 16, 2017

1/2
Please reload

Posts Récents

April 3, 2019

Please reload

Archives
Please reload

 Siège social -  3-5 Place Royale, 78100 Saint Germain en Laye - Standard : +33 1 72 55 00 55 

  • LinkedIn - Black Circle
  • 49598-viadeo-logo-icon-vector-icon-vector-eps
  • Twitter - Black Circle

www.trimane.fr © Copyright 2018 - Tous droits réservé - Mentions Légales