주요업무
[Contents Understanding 업무 소개]
AI Lab의 contents understadning 업무에서는 영상이나 이미지, 음성 및 자연어로 구성된 비정형 데이터를 입력으로 받아 비즈니스에 유용한 정보를 추출하는 데 집중하며, 모더레이션을 통한 신뢰와 안전(Trust & Safety) 업무에 기여하는 것을 주 목표로 합니다. 하이퍼커넥트 및 Match Group 브랜드에서 생성되는 컨텐츠를 이해하는 데 기여하며 글로벌 신뢰와 안전 기준을 충족하기 위해 Match Group과 협력하여 다양한 과제를 수행합니다. 이를 위해 다음과 같은 AI 문제들을 다루는 데 관심이 많습니다.
- 모바일 및 웹 환경에서 짧은 레이턴시와 낮은 전력 소비를 유지하면서도 높은 정확도를 달성할 수 있는 경량 모델 설계 및 최적화 기법
- noise와 imbalance가 심한 데이터에서 레이블 품질을 추적 및 관리하고, 최소한의 라벨링으로 성능을 확보하기 위한 액티브 러닝, core-set selection, semi-/self-supervised 학습 방법
- multi-task 또는 multi-label 분류를 제한된 파라미터 budget 내에서 최적화하고, 텍스트, 이미지, 영상 등 multi-modal 정보를 통합하는 모델링 기법
- 도메인 간 분포 차이를 극복하는 도메인 적응, 서비스 확장성을 위한 meta-learning 기법
- 국제 AI 기준을 맞추기 위한 Fairness 및 Privacy 보장을 위한 학습 방법
- 사용자 행동 로그와 콘텐츠 분석 정보를 활용하여 스팸, 가짜 계정 등 이상 행위를 실시간으로 탐지하거나 사전 예측하는 스트리밍 기반 모델링
- ML 프로덕션 프로세스를 혁신하기 위한 LLM 활용 방법
- 모바일 및 웹 환경에서 짧은 레이턴시와 낮은 전력 소비를 유지하면서도 높은 정확도를 달성할 수 있는 경량 모델 설계 및 최적화 기법
- noise와 imbalance가 심한 데이터에서 레이블 품질을 추적 및 관리하고, 최소한의 라벨링으로 성능을 확보하기 위한 액티브 러닝, core-set selection, semi-/self-supervised 학습 방법
- multi-task 또는 multi-label 분류를 제한된 파라미터 budget 내에서 최적화하고, 텍스트, 이미지, 영상 등 multi-modal 정보를 통합하는 모델링 기법
- 도메인 간 분포 차이를 극복하는 도메인 적응, 서비스 확장성을 위한 meta-learning 기법
- 국제 AI 기준을 맞추기 위한 Fairness 및 Privacy 보장을 위한 학습 방법
- 사용자 행동 로그와 콘텐츠 분석 정보를 활용하여 스팸, 가짜 계정 등 이상 행위를 실시간으로 탐지하거나 사전 예측하는 스트리밍 기반 모델링
- ML 프로덕션 프로세스를 혁신하기 위한 LLM 활용 방법