주요업무
Lunit은 "Learning Unit"을 줄여 만든 이름으로, 암 진단 및 치료에 기여하는 인공지능 솔루션을 개발하고 제공하는 의료 AI 기업입니다.
루닛은 인공지능 기술을 통해 더 정확한 암 진단과 치료 효과 예측이 가능해지고, 환자를 위한 신속한 맞춤형 치료가 가능해지는 시대를 열고자 합니다.
💭 About the Team
1. What do we do? (Department Mission)
AI Platform Department는 전 세계 환자의 진단과 치료에 실제로 사용되는 의료 AI 모델이 안정적으로 동작하도록 데이터·학습·운영·서빙 전반을 아우르는 기반 플랫폼을 구축합니다. 우리는 기술을 통해 암의 조기 발견과 정확한 치료라는 목표에 기여하고자 합니다.
2. How do we work? (Work Style)
• 빠르게 시도하고 실사용자 피드백을 바탕으로 지속적으로 개선하는 개발 문화
• 문제 정의 단계부터 PM, AI 연구자, 엔지니어가 함께 참여하는 강한 협업 구조
• 품질을 지키면서 속도를 높이기 위해 AI 기반 개발·자동화 도구 적극 활용
• 명확한 설계와 코드 리뷰를 통한 투명한 기술 의사결정
3. What kind of problems do we solve? (Design Philosophy)
• TB~PB 규모의 의료 데이터를 다루는 대규모 데이터 인프라 문제
• 데이터 보안·프라이버시 규제를 충족하는 엔터프라이즈 아키텍처
• 연구자가 수천 건의 실험을 수행할 수 있도록 지원하는 대규모 ML 파이프라인 자동화
• 글로벌 병원 인프라와 연결된 데이터 연동·모니터링 시스템
4. Who will I spend 8+ hours/day with? (Co-workers)
• 글로벌 인재로 구성된 AI 연구자, SW 엔지니어, MLOps 엔지니어 등 전문성 높은 동료들
• 영어와 한국어가 자연스럽게 공존하는 팀 환경
• 서로의 지식과 배경을 존중하며 함께 성장하는 문화
💭 About the Position
1. What will I build? (Scope of Work)
• 의료 데이터 수집·정제·변환 파이프라인
• AI 학습 데이터셋 생성 및 버전 관리 시스템
• 대규모 ML 워크플로우 자동화
• Data Lineage, Metadata, Quality 관리 체계
• 규제·보안이 중요한 의료 데이터 거버넌스 인프라
• 글로벌 SaaS 형태의 의료 AI 데이터 플랫폼
2. What design/engineering challenges will I face? (Focus Area)
• PB 규모 의료 데이터 파이프라인 설계
• 멀티클라우드(AWS/GCP/Azure) 운영
• 의료 규제 준수 + 자동화를 동시에 만족하는 구조 설계
• GPU 학습 환경과 연동되는 고성능 데이터 공급 문제 해결
• 글로벌 연구자와 함께 사용하는 공용 ML 플랫폼 구축
• 제품–연구–엔지니어링 요구를 조율하는 협업 중심의 문제 해결
3. What kind of engineer fits well here? (Ideal Profile)
• 데이터 시스템의 “전체 흐름”과 “구조”를 설계하는 일을 좋아하는 분
• 복잡한 문제를 구조화하고 실용적인 해결책을 제시할 수 있는 분
• Data Quality, Security, Lineage 에 높은 기준을 가진 분
• '의료 AI'라는 어려운 도메인에서 의미 있는 변화를 만들고 싶은 분
4. How will I grow? (Opportunities)
• 복잡한 AI·데이터 시스템을 총괄적으로 설계하는 경험
• 글로벌 의료 AI SaaS 플랫폼 구축 경험
• Research–MLOps–Engineering이 맞물린 대규모 조직 구조에서의 성장
• 플랫폼 아키텍처 전반에 영향을 미치는 핵심 기술 결정 기회
🚩 주요업무
우리가 구축하는 데이터 인프라와 파이프라인은 의료 AI 모델의 정확도·재현성·신뢰성을 결정하는 핵심 요소입니다. Data Engineer의 한 줄 코드, 하나의 파이프라인 개선은 결국 전 세계 환자의 진단 결과에 직접적인 영향을 미칩니다.
• TB~PB 규모의 의료 영상·진단 데이터를 안정적으로 처리하기 위한 데이터 파이프라인을 설계·자동화·운영
• 통합된 데이터 포맷에 대한 Governance 를 수립하고 지속적으로 관리하여 데이터 표준화와 품질을 보장
• 데이터 수집–정제–변환–검증–배포까지 이어지는 End-to-End DataOps 워크플로우를 구축하여, AI 연구자와 MLOps 엔지니어의 생산성을 극대화
• 의료 규제(HIPAA, GDPR, EU AI Act 등)를 충족하는 보안·접근제어·감사 체계(RBAC, Audit Trail)를 설계
• GPU 대규모 학습 환경과 연동되는 학습 데이터 관리 파이프라인(Data Versioning, Lineage, Quality Check)을 구성
• Airflow·Prefect 등 Workflow Orchestrator 기반의 스케줄링·모니터링·장애 대응 자동화를 구축
• AI 기반 개발도구(Cursor, Codex, ChatGPT, Claude Code 등)을 적극 활용해 파이프라인 생성·테스트·문서화를 자동화하며 팀 전체의 생산성을 향상
• 플랫폼을 사용하는 연구자·엔지니어와 긴밀하게 협업하여, 실제 문제를 해결하는 운영 친화적 데이터 인프라를 구축
🚩 Tech Stack
AI Platform Department는 AI를 활용해 품질을 유지하면서 생산성을 극대화하는 엔지니어링 문화를 지향합니다.
1. Core Technologies
• Python 기반 데이터·워크플로우 개발
• Prefect, Airflow 기반 ETL/ML 파이프라인
• PostgreSQL, BigQuery, Athena
• S3/GCS 기반 대용량 데이터 처리
• Kubernetes, Docker
• MLflow, DVC, LakeFS
• Kafka, Redis (필요 시)
2. Security / Governance
• 의료 데이터 및 모델에 대한 Governance/Lineage
• RBAC 기반 안전한 데이터 접근
• 데이터 품질 검증 및 정책 기반 접근 관리