[합류하게 될 팀에 대해 알려드려요]
• MLOps Engineer 은 ML Platform 팀에 소속되며, 다양한 도메인에 소속된 ML Engineer들과 함께 일해요.
• ML Platform 팀은 전사적으로 사용되는 ML 플랫폼을 개발하고 운영하는 팀이에요. 모든 ML 개발과 운영이 원활하게 이루어질 수 있도록 기반 인프라부터 ML 제품까지 폭넓게 책임지는 팀이에요.
• ML Platform 팀의 MLOps Engineer 는 GPU 인프라, 학습/실험을 위한 개발 환경, 모델 저장소, Feature Store, 서빙 시스템 등을 설계하고 운영하는 핵심적인 역할을 해요. 개인화 추천, 광고 최적화, Vision 모델 서빙, 생성형 AI 서빙 등 다양한 도메인에서 활용되는 모델들의 End-to-end 파이프라인을 제공하고, 효율적이고 확장 가능한 ML 플랫폼를 지속적으로 고도화하고 있어요.
주요업무
• Kubernetes 기반의 ML 클러스터 환경에서 워크로드에 맞게 그리고 리소스 효율적이게 컨테이너 오케스트레이션 시스템을 설계하고 운영해요.
• ML Engineer 들이 더 나은 실험과 개발을 할 수 있도록 개발 및 실험 환경을 구축하고 개선해요.
• 다양한 워크로드를 지원하는 확장 가능하고 안정적인 배치 시스템을 구축하고 유지보수해요.
• 초고속 대용량 데이터 처리를 위한 스토리지 시스템을 설계하고 운영해요.
• 복잡한 네트워크 환경에서 대규모 모델 학습 및 데이터 처리를 위한 자동화된 파이프라인을 설계하고 구현해요.
• 분산 학습 및 추론 시스템을 구축하고, 대규모 스케일을 안정적으로 운영할 수 있도록 지속적으로 개선해요.
자격 요건
• Kubernetes 환경에서의 시스템 운영 경험이 있으며, Linux 기반의 리소스 관리 (cgroups), 서비스 메쉬 (envoy, istio) 등 Kubernetes 생태계의 핵심 컴포넌트에 대한 깊은 이해를 갖추신 분을 원해요.
• ML/DL 파이프라인 구축에 대한 실무 경험을 보유하신 분을 찾고 있어요.
• ML 생태계 전반에 대한 이해와 경험이 있으신 분이면 잘 맞아요.
• 복잡한 기술적 문제를 명확하게 설명할 수 있는 좋은 커뮤니케이션 능력을 가진 분이면 좋아요.
• 다양한 문제 상황에서 다양한 해결 방안을 고민하고 최적의 해법을 도출하는 문제 해결 역량을 갖추신 분이면 더욱 환영이에요.
우대사항
• On-premise 환경에서 Kubernetes 클러스터를 직접 구축하고 네트워크 인터페이스 (calico, cilium) 등 깊은 이해를 바탕으로 운영해본 경험이 있는 분이면 좋아요.
• GPU 기반의 대규모 모델 학습 및 최적화 경험이 있으신 분이면 더욱 잘 맞아요.
• ML/DL 파이프라인의 CI/CD 자동화 시스템을 설계하고 고도화한 경험이 있는 분이면 더욱 좋아요.
• 대용량 데이터를 활용한 분산 학습 혹은 대규모 모델 운영 경험을 보유하신 분을 환영해요.
채용절차
• 서류 접수 > 직무 인터뷰 > 문화적합성 인터뷰 > 레퍼런스 체크 > 처우 협의 > 최종 합격
• 직무 인터뷰에서는 심층 기술 면접과 ML 시스템 설계를 주제로 면접이 진행될 예정이에요.
기타안내
[이력서는 이렇게 작성하시는 걸 추천해요]
• 진행했던 과제가 조직에 큰 영향력을 미쳤다면 그 내용을 자세히 작성해 주세요.
• 단순히 어떤 언어, 플랫폼, 프레임워크, 기술 등을 사용했는지보다는, 어떤 목적을 가진 과제였는지, 이를 해결하기 위해 무엇을 사용했는지, 어떻게 문제를 해결했는지에 대해 자세히 작성해 주세요.
• 플랫폼을 운영하면서 발생한 치명적인 장애를 해결해 보았거나, 성능/리소스 최적화를 해 본 경험이 있다면 작성해 주세요.
• 오픈소스 사용 중에 발생한 버그나 이슈를 해결해 보았거나, 부족한 기능을 개선하기 위해 오픈소스에 기여했던 경험이 있다면 작성해 주세요.
[함께할 동료를 위한 한마디]
"프로덕션에서 동작하는 ML 솔루션을 만들고, 각종 최적화 도구와 플랫폼을 직접 구축하고 고도화 해나가는 것, 토스에서는 가능해요!"
• 저희는 토스에서 추천 / 타겟팅 서비스, ML 파이프라인 구축, Feature Store, Monitoring System, Vector DB 등을 효율적으로 구축하고 무결하게 운영하는 것을 목표로 업무에 몰입하고 있어요.
• MLOps End-to-End 파이프라인을 구축함에 있어 과도한 복잡함을 피하고 간단하고 명확한 방식으로 견고한 구조를 설계하는 과정을 동료들과 함께 할 수 있습니다.
• 아직 밝혀지지 않은 문제를 정의하고, 심층적이면서 다면적인 해법을 찾아가는 과정을 즐기는 분을 기다리고 있습니다.
• 다양한 금융 데이터와 머신러닝 기법을 적용한 결과물을 End-to-End로 함께 경험하실 분을 기다릴게요!