Stage Développement d’applications Big Data (Software Engineer Intern)

Suresnes, France
Engineering / R&D – Data Quality
Internship
WHO WE ARE:

Talend is a leader in cloud data integration and data integrity.
 
We are a global company with offices in Redwood City, Paris, London, Bonn, Beijing, Tokyo, Singapore, Sydney, and Bangalore.  Our customers are pioneers/innovative leaders in their market when it comes to data and cloud projects. We are proud to count Domino’s, the world’s largest pizza company, Euronext, the #1 stock exchange in Europe, and HP Inc., a leading IT company, as Talend customers.
 
We enable companies to transform their business by delivering trusted data at the speed of business. Talend offers a suite of apps for data integration and integrity that brings data, people and technology together by generating end-to-end data pipelines.
 
Customers can collect data; transform it to power analytics; govern it from end-to-end; and share it across internal and external stakeholders. They can work across systems and across environments: in the cloud and on-premises.
 

Sujet de stage : Développement d’indicateurs statistiques en Big Data 
Localisation : SURESNES, FRANCE 
Département : ENGINEERING / R&D – DEVELOPMENT 
Équipe : Data Quality 
 
Le domaine du Big Data est en pleine évolution et change à une rapidité impressionnante. Après Hadoop Map/Reduce, Spark, d’autres plateformes d’exécution comme Flink, Google Dataflow offrent d’autres alternatives pour exécuter des traitements sur les données massives. 
Le premier objectif de ce stage est de développer des algorithmes pour calculer des indicateurs de qualité de données et des analyses statistiques et sémantiques. Ces algorithmes doivent pouvoir fonctionner sur de très grosses volumétries dans des environnements distribués. En collaboration avec l’équipe Big Data et des membres de la communauté Apache.

Missions :
- Rechercher et comparer différentes solutions possibles (comme par exemple Apache DataSketches1) pour le calcul de ces statistiques pendant l’exécution des pipelines, que ce soit en mode Batch ou Streaming.
- Développer des bibliothèques qui permettront l’intégration de ce calcul dans des produits Talend. Vous devrez vous familiariser avec les frameworks développés à Talend, frameworks autour de la qualité de données et framework de processeurs s’intégrant dans le produit Pipeline Designer2.  
- Le deuxième objectif du stage est de participer à la conception de nouvelles fonctionnalités dans les produits, en proposant des maquettes affichant les statistiques dans les produits Talend, en particulier dans Pipeline Designer.  
 
Profil recherché :
- Vous êtes étudiant(e) en Master 2 
- Vous êtes à l’aise avec les technologies Java et/ou Scala 
- Vous avez un bon niveau d'anglais à l’oral et à l’écrit 
- Vous avez déjà une expérience de développement sur des environnements distribués 
- Connaître le fonctionnement de Hadoop, Spark, Flink ou d'autres solutions Big Data est un plus. 
- Vous êtes autonome mais savez également travailler en équipe 

AND NOW, A LITTLE ABOUT US:

Talend has received some pretty impressive accolades along the way:
- "2018 Best Public Cloud Computing Companies To Work For" by Glassdoor
- Named a Leader for Data Integration Tools in the Gartner Magic Quadrant
- Named a Leader in Big Data Fabric for the Forrester Wave
- Ranked in the DBTA “100 Companies that Matter Most in Data”
- Listed in the CRN Big Data 100 Companies

We are passionate about helping companies become more data driven; and, if we can be honest, we are all geeks at heart who pride ourselves on the vibrant company culture that we have built.


As a global employer, at Talend, we believe our success depends on diversity, inclusion and mutual respect among our team membersWe seek to recruit, develop and retain the most talented people from a diverse candidate pool. We are committed to making all employment decisions on the basis of business need, merit, capability and equality of opportunity. All qualified applicants will receive consideration for employment without regard to race, color, religion, sex, sexual orientation, gender identity, or national origin.