Stage Machine Learning (Machine Learning Internship) - Réf: R

Nantes, France
Engineering / R&D – Data Quality
Internship
WHO WE ARE:

Talend is a leader in cloud data integration and data integrity.
 
We are a global company with offices in Redwood City, Paris, London, Bonn, Beijing, Tokyo, Singapore, Sydney, and Bangalore.  Our customers are pioneers/innovative leaders in their market when it comes to data and cloud projects. We are proud to count Domino’s, the world’s largest pizza company, Euronext, the #1 stock exchange in Europe, and HP Inc., a leading IT company, as Talend customers.
 
We enable companies to transform their business by delivering trusted data at the speed of business. Talend offers a suite of apps for data integration and integrity that brings data, people and technology together by generating end-to-end data pipelines.
 
Customers can collect data; transform it to power analytics; govern it from end-to-end; and share it across internal and external stakeholders. They can work across systems and across environments: in the cloud and on-premises.
 

Apprentissage par renforcement : application à la préparation de données

Mots clés: reinforcement learning, data cleaning, q-learning, machine learning

Encadrant: Raphaël Nedellec rnedellec@talend.com

Profil candidat(e):
           BAC +5 en fin de cycle école d’ingénieur ou Master 2 en université, spécialisé(e) en statistiques, en informatique et/ou mathématiques appliquées.
           Une expérience pratique en apprentissage automatique (de préférence avec Python) est requise. La maîtrise de l’anglais est exigée.
           Compétences souhaitées : Python, Apprentissage statistique, Reinforcement Learning
           Début du stage souhaité : Février-Avril 2020.
           Durée : 5-6 mois.

Contexte:
La société Talend développe des outils cloud pour la manipulation et la préparation de données, comme Talend Data Preparation, Talend Data Stewardship, ou Talend Pipeline Designer. Ces outils permettent à l’utilisateur de manipuler et nettoyer efficacement de multiples sources de données, de façon à qualifier et transformer des données brutes et les rendre disponibles pour les utilisateurs métiers et les différentes applications de nos clients. Le nettoyage d’un jeu de données de grande taille est parfois un défi technique. Des outils comme Talend Data Preparation permettent la construction de pipeline de traitement de données dans cet optique. Etant donné un jeu de données non nettoyées, un utilisateur doit choisir parmi un ensemble de fonctions de nettoyage lesquelles appliquer et dans quelle ordre, dans le but d’obtenir un jeu de données le plus propre possible.
Le but du stage est d’investiguer les techniques d’apprentissage par renforcement (RL - Reinforcement Learning) pour entraîner des agents à construire des automatiquement des pipelines de nettoyage de données pour suggérer une stratégie de nettoyage pour chaque dataset.

Objectif:
Les méthodes d’apprentissage par renforcement ont été développées depuis plusieurs décennies par plusieurs communautés distinctes, allant de l’intelligence artificielle, de la statistique ou encore de la psychologie ou des neurosciences. L’apprentissage par renforcement consiste à entraîner des agents à interagir avec leur environnement. Etant donné un état, les agents doivent sélectionner la meilleure action qui leur permettra d’atteindre leur but, et d’obtenir la plus grande “récompense”.
L’objectif du stage est :
           De réaliser une étude bibliographique sur le RL appliqué à la manipulation de données
           De formuler la création d’une succession de traitement comme un problème de RL. L’état initial est le jeu de données brut, et l’état final/terminal sera le jeu de données “nettoyé”
           D’étudier les interactions possibles entre les agents entraînés et l’utilisateur

Candidature:
Un CV et une lettre de motivation sont requis. Lors de l’entretien, il sera demandé une présentation orale (avec ou sans support) critique de 15 minutes du papier de (Berti-Équille 2019). Cette présentation sera préparée avant l’entretien.

Bibliographie:
Berti-Équille, Laure. 2019. “Learn2Clean: Optimizing the Sequence of Tasks for Web Data Preparation.” In The World Wide Web Conference, WWW 2019, San Francisco, ca, Usa, May 13-17, 2019, 2580–6. https://doi.org/10.1145/3308558.3313602.
Mnih, Volodymyr, Koray Kavukcuoglu, David Silver, Andrei A Rusu, Joel Veness, Marc G Bellemare, Alex Graves, et al. 2015. “Human-Level Control Through Deep Reinforcement Learning.” Nature 518 (7540). Nature Publishing Group: 529.
Sutton, Richard S, and Andrew G Barto. 2018. Reinforcement Learning: An Introduction.
AND NOW, A LITTLE ABOUT US:

Talend has received some pretty impressive accolades along the way:
- "2018 Best Public Cloud Computing Companies To Work For" by Glassdoor
- Named a Leader for Data Integration Tools in the Gartner Magic Quadrant
- Named a Leader in Big Data Fabric for the Forrester Wave
- Ranked in the DBTA “100 Companies that Matter Most in Data”
- Listed in the CRN Big Data 100 Companies

We are passionate about helping companies become more data driven; and, if we can be honest, we are all geeks at heart who pride ourselves on the vibrant company culture that we have built.


As a global employer, at Talend, we believe our success depends on diversity, inclusion and mutual respect among our team membersWe seek to recruit, develop and retain the most talented people from a diverse candidate pool. We are committed to making all employment decisions on the basis of business need, merit, capability and equality of opportunity. All qualified applicants will receive consideration for employment without regard to race, color, religion, sex, sexual orientation, gender identity, or national origin.