Machine Learning Engineer (Contents Understanding)
Seoul
Hyperconnect – AI/ML /
Full-time /
Hybrid
[AI Lab 소개]
하이퍼커넥트 AI Lab은 사람과 사람 사이를 연결하는 제품에서 기존의 기술로는 접근하기 어렵지만 머신러닝 기술을 통해 풀 수 있는 문제들을 찾아내고 해결하여 사용자 경험을 혁신합니다.
이를 위해 영상/음성/자연어/추천 등을 포함하여 다양한 도메인의 수많은 모델을 개발하고, 모바일 및 클라우드 서버를 통해 안정적으로 제공하면서 마주하는 문제들을 해결하여 AI Lab이 만들어 내는 기술이 실제 제품의 성장에 기여하는 것을 목표로 합니다.
이러한 목표 아래 하이퍼커넥트 AI Lab은 아자르를 포함한 하이퍼커넥트의 제품에 기여하는 머신러닝 기술들을 수년간 발전시켜나가고 있습니다.
[ML Engineer 직무 소개]
AI Lab의 ML Engineer는 최첨단 모델을 연구하고 개선하는 과학자로서의 연구 능력과, 현실적인 제약사항들을 종합적으로 고려해 기술적 의사결정을 하는 공학자로서의 역량이 필요합니다.
이러한 역량을 바탕으로 실제 제품에서 겪는 문제를 발견/청취하고 이를 AI 문제로 치환해 문제를 해결합니다.
이 과정에서 백엔드/프론트엔드/DevOps/ML소프트웨어 엔지니어, 데이터 분석가, PM 등 다양한 전문조직과 적극적으로 협업하며 도움을 받습니다. 일하는 모습에 대한 조금 더 자세한 이야기는 다음의 내용을 참고하시면 좋습니다.
ML Engineer는 제품의 문제 해결 과정을 일종의 연구 과정으로 바라봅니다. 문제 정의, 이해관계자 설득, 목표 설정, SotA 모델 도출, 일정 관리, 성과 분석, 향후 전략 설정까지 문제 해결 과정의 A-Z를 주도적으로 담당합니다.
사용자의 요구와 비즈니스 임팩트를 고려해 우선순위를 정의하고, 장기적인 안목으로 제품을 성장시키는 데 AI 관점에서 기여합니다.
AI로 비즈니스 문제를 해결하기 위해서는 딥러닝 학습을 위한 인프라도 제대로 갖추어져야합니다. 하이퍼커넥트에서는 ML Engineer들이 충분히 모델 개발 및 실험을 진행할 수 있도록 자체적인 딥러닝 연구용 클러스터를 구축하여 활용하고 있습니다.
총 160대의 A100 GPU 및 다수의 H100 GPU를 포함한 다양한 on-premise 장비들을 연구개발에 활용할 수 있습니다. 추가적으로, 데이터 수집, 전처리를 포함한 자체적인 데이터 파이프라인을 클라우드 서비스를 활용하여 구축 및 운영하고 있습니다.
[Contents Understanding 업무 소개]
AI Lab의 contents understadning 업무에서는 영상이나 이미지, 음성 및 자연어로 구성된 비정형 데이터를 입력으로 받아 비즈니스에 유용한 정보를 추출하는 데 집중하며, 모더레이션을 통한 신뢰와 안전(Trust & Safety) 업무에 기여하는 것을 주 목표로 합니다(인터뷰). 하이퍼커넥트 및 Match Group 브랜드에서 생성되는 컨텐츠를 이해하는 데 기여하며 글로벌 신뢰와 안전 기준을 충족하기 위해 Match Group과 협력하여 다양한 과제를 수행합니다. 이를 위해 다음과 같은 AI 문제들을 다루는 데 관심이 많습니다.
- 모바일 및 웹 환경에서 짧은 레이턴시와 낮은 전력 소비를 유지하면서도 높은 정확도를 달성할 수 있는 경량 모델 설계 및 최적화 기법
- noise와 imbalance가 심한 데이터에서 레이블 품질을 추적 및 관리하고, 최소한의 라벨링으로 성능을 확보하기 위한 액티브 러닝, core-set selection, semi-/self-supervised 학습 방법
- multi-task 또는 multi-label 분류를 제한된 파라미터 budget 내에서 최적화하고, 텍스트, 이미지, 영상 등 multi-modal 정보를 통합하는 모델링 기법
- 도메인 간 분포 차이를 극복하는 도메인 적응, 서비스 확장성을 위한 meta-learning 기법
- 국제 AI 기준을 맞추기 위한 Fairness 및 Privacy 보장을 위한 학습 방법
- 사용자 행동 로그와 콘텐츠 분석 정보를 활용하여 스팸, 가짜 계정 등 이상 행위를 실시간으로 탐지하거나 사전 예측하는 스트리밍 기반 모델링
- ML 프로덕션 프로세스를 혁신하기 위한 LLM 활용 방법
Requirements
- AI/ML 도메인 전반에 대한 이해와 적어도 한 개 이상의 특정 도메인에 대한 깊이 있는 지식을 갖춘 분
- AI 기술의 제품화에 관심이 많으신 분
- AI를 통한 문제 해결 역량 및 이를 위한 프로젝트 관리 역량을 갖춘 분
- Tensorflow, PyTorch, CatBoost, JAX 등 오픈소스 프레임워크 기반 개발역량을 포함한 파이썬 개발역량이 충분하신 분
- 강한 오너쉽을 발휘해 프로젝트의 A-Z를 책임지고 완수하실 수 있는 분
- 여러 직군의 이해관계자와 협업할 수 있는 강력한 커뮤니케이션 능력을 갖추신 분
- ML 시스템의 소프트웨어 개발 구조와 내용을 이해하고 기능을 기획할 수 있는 엔지니어링 역량이 있는 분
- 데이터의 통계적 특성과 패턴을 발견하고 이를 AI 문제 해결에 반영하실 수 있는 분
- A/B 테스트 실험 기획 및 타겟 KPI 지표를 정의하고, SQL기반 데이터 분석을 진행한 경험이 있으신 분
- 학위나 국적은 무관하되 한국어로 원활한 의사소통이 가능한 분
Preferred Qualifications
- 기계학습 관련 탑티어 학회 및 저널(NeurIPS, ICLR, ICML, CVPR, ICCV/ECCV, KDD, …) 게재 실적 혹은 AI 관련 대회 수상 실적이 있으신 분
- AI/ML 도메인 전반에 대한 방대한 지식을 자랑할 수 있으신 분
- 실제 서비스에 AI 기술을 통합하고 주요 지표를 유의미하게 향상시켜 본 경험이 있으신 분
- PO/PM 혹은 그에 준하는 경험이 있으신 분
- 영어로 원활한 의사소통이 가능하신 분
- 인과관계 분석(DID, RCT, Causal Inference 등), 다변량 테스트, Sequential Testing 등에 대한 이해가 깊으신 분
고용형태/채용절차
- 고용 형태: 정규직
- 채용 절차: 서류전형 > 코딩테스트/과제전형 > 1차 면접 > Recruiter Call > 2차 면접 > 최종합격 (* 필요 시 전형이 변경 진행될 수 있습니다.)
- 서류 전형의 경우 합격자에 한하여 개별 안내드릴 예정입니다.
- 지원 서류: 자유 양식의 상세 경력기반 영문이력서(PDF)
- 이 포지션은 전문연구요원 현역 편입/전직, 전문연구요원 보충역 편입/전직 채용이 가능합니다. 병역특례요원의 경우, 병역특례 관련법에 따라 복무관리를 진행합니다.