company logo
(주)엘리스

[엘리스] 인프라 SRE 엔지니어

시리즈 C
누적 투자 300억↑
1-50명
  • 공고소개
  • 주요업무
  • 자격요건
  • 우대사항
  • 채용절차
  • 기타안내
이 포지션에 합격해 입사하시면 리멤버에서 합격 보상금 50만원을 드립니다
(주)엘리스 조직 이미지
기업 브리핑 by AI
Beta
AI 솔루션 'AI헬피챗' 출시, IT 에듀테크 기업
소프트웨어 & 인공지능 교육 혁신 플랫폼 제공
자체 기술력으로 입증한 IT 교육 전문성
"Empowering AI, Elice." 엘리스는 공공·기업 전 영역의 AI 전환을 이끌고, 모두가 AI 시대의 주역이 되도록 돕는 글로벌 AI 기업입니다. /*AI 인프라 혁신을 통한 AI 에코시스템 구축*/ • 최신 GPU(B200·H200) 및 국산 NPU를 탑재한 AI PMDC 통해 고성능 AI 인프라 구축 및 서비스 제공 • 국내 최고 수준의 전력 효율로 자체 구축한 AI 전용 데이터센터와 'AI 인프라-플랫폼-모델-콘텐츠' 통합 AI 생태계를 조성 • 정부 및 공공기관에 안정적인 클라우드 환경 제공이 가능한 보안인증(CSAP) 획득 /*한국어 특화 AI 모델로 교육 혁신을 선도*/ • AI SaaS 솔루션 '엘리스LXP'로 6,200여 기업·기관과 260만 명 학습자 지원 • 자체 개발한 한국어 특화 생성형 AI 모델 라이브러리로 목적별 맞춤 모델 제공 • 전국 초중고 AI 디지털교과서(AIDT)의 인프라·콘텐츠·플랫폼을 통합 공급 /*엘리스 인프라팀을 소개합니다*/ 인프라팀은 AI 인프라의 새로운 기준을 직접 설계하고 구현하는 팀입니다. 국내에서 유일하게 AI PMDC(AI Portable Modular Data Center)를 자체 설계·구축·운영하는 기업으로서 ECI(Elice Cloud Infrastructure)와 AI PMDC를 기반으로 빠르고 안정적이며 유연한 AI 환경을 제공하며, 연구와 개발이 최적의 성과를 낼 수 있도록 지원합니다. 인프라팀은 국내 최초로 수랭식 B200 GPU를 InfiniBand 400G 네트워크로 연결한 초대형 클러스터 구축에 성공했습니다. AI 서버, Ceph 스토리지, 병렬 파일시스템, Kubernetes, 방화벽과 IPS, DDoS 대응, 그리고 PMDC의 물리적 인프라까지 하드웨어부터 소프트웨어, 보안, 네트워크, 데이터센터 설계까지 모든 계층을 직접 다룹니다. 팀에 합류한다면 AI 학습 환경을 위한 A100, H100, 그리고 다양한 NPU 서버까지 다루며, 100G급 서버 네트워크, 400G 스토리지 네트워크, 100G급 ISP 회선을 처음부터 끝까지 설계하고 운영할 수 있습니다. 수백 노드 규모의 GPU 클러스터를 직접 운영하고, SW(Ceph, Kubernetes), HW(InfiniBand)에 걸친 대규모 분산 인프라 설계 및 자동화, 글로벌 PMDC 프로젝트 참여도 경험할 수 있습니다. 이런 스케일의 인프라를 직접 다뤄볼 수 있는 기회는 오직 엘리스그룹뿐입니다. 지금 지원하신다면 남이 만들어 놓은 인프라를 단순히 운영하는 사람이 아닌 AI 세대를 위한 새로운 인프라의 기준을 설계하는 팀의 구성원이 될 수 있습니다. /*엘리스 인프라 SRE 엔지니어는 뭐가 특별할까요?*/ SRE 엔지니어는 데이터와 소프트웨어 엔지니어링 원칙을 기반으로 서비스의 신뢰성(Reliability)을 구축하는 핵심 역할을 수행합니다. 단순히 장애가 발생했을 때 대응하는 것을 넘어, SLI/SLO(서비스 수준 지표/목표)를 정교하게 설계하고 모니터링 및 알림 체계를 자동화하여 운영 효율을 근본적으로 개선합니다. 클라우드 및 컨테이너 환경 전반에서 잠재적 장애를 예측 및 예방하고, '운영을 코드로(Operations as Code)' 정의함으로써 서비스가 안정성을 유지하며 지속적으로 성장할 수 있는 기반을 만듭니다.

주요업무

• SLI/SLO 기반 신뢰성 운영 서비스의 핵심 지표(Latency, Error Rate 등)를 정의하고 SLO 달성을 위한 운영 전략 및 프로세스 설계 • Observability 스택 운영 Prometheus, Grafana, ELK 등 모니터링, 알림, 로그 플랫폼을 구축하고 지속적으로 최적화 • 장애 대응 체계 및 Incident Response 리딩 서비스 장애 발생 시 신속한 복구(MTTR 단축)를 위한 대응 프로세스(IR) 주도 및 개선 • RCA 및 구조적 개선 발생한 장애의 근본 원인을 철저히 분석하고, 시스템 아키텍처, 배포 파이프라인 등 구조적 결함에 대한 개선 사항을 도출 및 적용 • 운영 자동화 및 효율화 반복적인 수동 업무(Toil)를 식별하고, 스크립팅 및 IaC(Infrastructure as Code)를 활용하여 자동화 및 제거

자격 요건

• Linux 시스템, Kubernetes 클러스터, 네트워크(TCP/IP)에 대한 깊은 기본 지식 및 운영 경험 • 모니터링, 알림, 로그 플랫폼 등 Observability 스택 구축 또는 운영 경험 • Python 또는 Shell 등 스크립팅 언어를 활용한 시스템 운영 및 자동화 경험 • 서비스 장애 발생 시 침착하게 원인을 분석하고 대응할 수 있는 문제 해결 능력

우대사항

• Prometheus, Grafana, ELK/Loki 등 오픈소스 Observability 스택 심층 운영 경험이 있으신 분 • GitOps 또는 CI/CD 파이프라인을 활용한 배포 안정성 개선 경험을 하신 분 • Chaos Engineering 도입 또는 실행 경험이 있으신 분 • 클라우드 환경(AWS, Azure, GCP) 기반 인프라 운영을 경험하신 분

채용절차

서류 전형 > 미니 프로젝트 > 대면 인터뷰 > 레퍼런스 체크 > 처우 협의 > 최종 합격

기타안내

[커리어 성장 기회] • SRE 기술 리더로 성장 서비스 신뢰성 아키텍처를 정의하고 팀의 기술 방향성을 제시하는 SRE Technical Lead로 커리어 발전할 수 있습니다. • 서비스 안정성 구조 설계 Owner SLI/SLO를 바탕으로 서비스의 안정성을 근본적으로 담보하는 아키텍처 및 플랫폼 설계의 주도적인 역할 수행할 수 있습니다. • DevOps/플랫폼 아키텍처로 확장 SRE의 경험을 바탕으로, 효율적인 서비스 개발 및 운영을 위한 통합 플랫폼 아키텍처 설계 전문가로 도약할 수 있습니다. [그 외 복지] 1. 엘리서가 일잘러로 성장할 수 있도록 적극 지원합니다. • 웰컴키트와 효율적인 업무를 위한 최신형 디바이스 제공 • 전자도서관 서비스를 통한 도서 무제한 지원 • 엘리스 강의 무료 수강 및 직무 역량 교육 지원 • 저녁 식대 및 야근 택시비 지원 • 간식, 커피 무제한 제공 2. 엘리서는 동료를 존중하며 수평적이고 투명하게 소통합니다. • 엘리스의 사업 방향과 팀 현황을 공유하는 전사 미팅 진행(게더링) • 빠르고 투명한 정보 공유(M365/Teams/Outlook) • 의미있는 피드백을 위한 팀 스크럼 운영 • 편안한 자율 복장과 수평적인 '님' 호칭 사용 3. 엘리서의 노력에 보답하기 위해 끊임없이 고민합니다. • 반기별 성과급 지급 및 월별 베스트 엘리서 선정 • 팀워크 강화를 위한 팀 디너 지원 • 경조사에 따른 화환 및 휴가 지원 • 백신 접종 및 건강검진을 위한 휴가 제공 4. 팀 커뮤니케이션 활성화를 지원합니다. • 팀 간 교류로 유대감을 강화하는 점심 소통 프로그램 운영(밍글런치) • 신규 입사자 온보딩을 위한 버디 프로그램 운영 • 팀 내 소통 강화를 위한 리더비 지원
이 포지션에 필요한 전문분야/기술
CI/CD
Kubernetes
Ansible
Linux
Terraform
회사 로고
(주)엘리스
정보 보기
누적 투자 금액
333억원 이상
투자사
버텍스그로쓰, 알토스벤처스, 삼성벤처투자, 엘비인베스트먼트, 한국산업은행, 네이버 D2SF, 카이트창업가재단
리멤버에서 수집한 기업 정보입니다. 정보 수정이 필요할 경우, 아래 경로로 요청해 주세요.
리멤버 앱 > 더보기 > 1:1 문의
먼저 입사한 실무자에게 조언을 구해보세요
사용자가 커넥트에 입력한 정보를 기반으로 제공됩니다
company logo
(주)엘리스

[엘리스] 인프라 SRE 엔지니어

시리즈 C
누적 투자 300억↑
1-50명
연봉협의
근무지서울특별시 강남구
경력2년~20년 차
학력전문학사 이상
마감일
채용 시 마감
이 공고를
주변에도 알려주세요