[부서소개]
저희 부서는 대규모 언어 모델(LLM)의 추론 시스템을 개발하고 최적화하여 고성능 API 서비스를 제공하는 것을 목표로 합니다.
저희는 vLLM, TRT-LLM 등 오픈소스 인퍼런스 엔진을 활용하여 효율적인 모델 서빙을 구현하고, 최신 하드웨어(H100, A100, Gaudi2 등)와 소프트웨어 스택을 통합하여 안정적이고 확장 가능한 시스템을 구축합니다.
이를 통해 다양한 서비스에 고품질의 LLM 기능을 제공하고자 합니다.
주요업무
- LLM 기반 LLM 추론 엔진의 성능 최적화 및 기능 개발
- Tensor Parallelism, FlashAttention, Speculative Decoding 등 최신 기법을 활용한 추론 성능 향상
- GPU 클러스터(K8s, Helm, LWS 등) 환경에서의 대규모 LLM 서비스 운영 및 최적화
- LangChain, RAG 등 최신 프레임워크를 활용하여 다양한 LLM 기반 응용 서비스 개발 및 기존 시스템 통합
- Llama Stack 기반의 Application SDK 개발 및 API 서비스화
자격 요건
- 최소 1년 이상의 유관 경력
- 대규모 LLM 모델의 추론 또는 학습 시스템 개발 경험을 보유하신 분
- LLM 추론 최적화 기법에 대한 이해 및 적용 경험을 보유하신 분
- C/C++ 및 Python에 대한 숙련도와 메모리 관리에 대한 이해를 갖추신 분
- 복잡한 문제를 체계적으로 분석하고 해결할 수 있는 능력을 보유하신 분
- Kubernetes 기반의 클러스터 환경에서의 서비스 운영 경험을 보유하신 분
우대사항
- LLM, TRT-LLM 등 LLM 추론 엔진 개발 경험을 보유하신 분
- Speculative Decoding, FlashAttention 등 최신 추론 최적화 기법에 대한 이해를 갖추신 분
- H100, A100, Gaudi2 등 최신 AI 가속기 하드웨어에 대한 경험을 보유하신 분
- LLM 기반 API 서비스 개발 및 운영 경험을 보유하신 분
- LLM 추론 최적화에 대한 연구 또는 오픈소스 기여 경험을 보유하신 분
채용절차
서류 전형(기업문화적합도 검사 및 직무 테스트 포함) ▶ 직무 인터뷰 ▶ 레퍼런스체크 및 종합 인터뷰 ▶ 처우협의 ▶ 최종합격
※ 직무에 따라 서류전형시 직무테스트가 포함될 수 있습니다.
※ 전형 절차는 일정 및 상황에 따라 변동 될 수 있으며, 전형 별 결과에 따라 절차(추가 인터뷰 등)가 추가될 수 있습니다.
※ 정해진 결과 발표 일정은 없으며, 지원서 검토 후 면접 일정은 대상자에게 개별로 안내 드릴 예정입니다.
기타안내
[기타사항]
- 본 공고는 중복지원이 불가능하며, 기진행한 포지션에 대한 전형이 모두 마무리 되면 다른 포지션으로 지원이 가능합니다.
- 해외 출장에 결격 사유가 없는 분만 지원 가능합니다.
- 병역 의무를 필한 자 혹은 면제된 자에 한 해 입사지원이 가능합니다.
- 지원서 상 허위 기재가 있거나 제출 서류가 허위인 경우 합격이 취소될 수 있습니다.
- 제출된 지원서는 [My page- 지원현황]에서 확인 가능하며, 공고 마감 전까지 홈페이지에서 수정 및 지원 철회가 가능합니다.
- 본 공고는 인재 선발 완료 시 조기 마감될 수 있으며, 필요 시 모집 기간이 연장 될 수 있습니다.
- 국가유공자 및 장애인 등 취업보호 대상자는 관계법령에 따라 우대합니다.
- 국가유공자의 가산점 부여를 받기 위해서는 본인이 '취업지원 대상자 증명서'를 회사에 제출해야 합니다.
- 제출해 주신 지원서의 검토 결과 발표는 지원서에 등록하신 이메일로 개별 안내 드립니다.
- 입사 후 3개월의 수습 기간을 적용하며 평가에 따라 수습 기간이 연장되거나 채용이 취소될 수 있습니다.
- 문의사항은 NAVER Cloud 채용 홈페이지 1:1 문의로 접수해주시기 바랍니다.