글로벌 금융기관 B2B용 Private/On-prem 환경에서 LLM 인프라의 비용, 보안, 성능 과제를 해결하여 제품 신뢰성을 확보하고 비즈니스 스케일업을 주도하는 포지션입니다.
채용회사는 월스트리트의 초대형 금융기업들이 선택한 AI 파트너입니다.
주요업무
- 글로벌 배포 아키텍처: 고객사 VPC 및 On-prem(폐쇄망) 환경의 설치·운영 체계 설계
- LLM/RAG 운영 고도화: GPU 스케줄링, 레이턴시 및 토큰 비용 최적화
- 자동화 및 CI/CD: Terraform 기반 IaC 관리 및 안정적 릴리즈 파이프라인 구축
- 관측 가능성(Observability): 모니터링 기반 장애 탐지 및 복구 체계 강화
- 보안 및 컴플라이언스: 글로벌 보안 기준(SOC2 등) 대응 및 데이터 보호 설계
자격 요건
- 프로덕션 장애 해결 및 포스트모템을 통한 재발 방지 경험
- 주요 클라우드(AWS/GCP/Azure) 및 Kubernetes 운영 숙련
- VPC Peering, PrivateLink 등 네트워크 토폴로지 및 폐쇄망 트러블슈팅 역량
- 배포 안정성을 위한 CI/CD 설계 및 개선 경험
- 해외 팀 및 글로벌 고객과의 기술 협업 가능 수준의 영어 활용 능력
우대사항
- AI 워크로드 운영: RAG, 모델 서빙, Vector DB 운영 및 비용·성능 최적화 경험
- 엔터프라이즈 딜리버리: Helm Chart, Operator 등을 통한 제품 패키징 및 배포 경험
- 도구 전문성: IaC(Terraform 등) 및 Observability(Datadog, ELK 등) 도구 숙련
- 기술 협의: 고객사 보안·인프라팀과의 기술적 요구사항 조율 능력