company logo
(주)엘리스

[엘리스] 시니어 인프라 시스템 엔지니어

시리즈 C
누적 투자 300억↑
1-50명
  • 공고소개
  • 주요업무
  • 자격요건
  • 우대사항
  • 채용절차
  • 기타안내
이 포지션에 합격해 입사하시면 리멤버에서 합격 보상금 50만원을 드립니다
(주)엘리스 조직 이미지
기업 브리핑 by AI
Beta
AI 솔루션 'AI헬피챗' 출시, IT 에듀테크 기업
소프트웨어 & 인공지능 교육 혁신 플랫폼 제공
자체 기술력으로 입증한 IT 교육 전문성
"Empowering AI, Elice." 엘리스는 공공·기업 전 영역의 AI 전환을 이끌고, 모두가 AI 시대의 주역이 되도록 돕는 글로벌 AI 기업입니다. /*AI 인프라 혁신을 통한 AI 에코시스템 구축*/ • 최신 GPU(B200·H200) 및 국산 NPU를 탑재한 AI PMDC 통해 고성능 AI 인프라 구축 및 서비스 제공 • 국내 최고 수준의 전력 효율로 자체 구축한 AI 전용 데이터센터와 'AI 인프라-플랫폼-모델-콘텐츠' 통합 AI 생태계를 조성 • 정부 및 공공기관에 안정적인 클라우드 환경 제공이 가능한 보안인증(CSAP) 획득 /*한국어 특화 AI 모델로 교육 혁신을 선도*/ • AI SaaS 솔루션 '엘리스LXP'로 6,200여 기업·기관과 260만 명 학습자 지원 • 자체 개발한 한국어 특화 생성형 AI 모델 라이브러리로 목적별 맞춤 모델 제공 • 전국 초중고 AI 디지털교과서(AIDT)의 인프라·콘텐츠·플랫폼을 통합 공급 /*엘리스 인프라팀을 소개합니다*/ 인프라팀은 AI 인프라의 새로운 기준을 직접 설계하고 구현하는 팀입니다. 국내에서 유일하게 AI PMDC(AI Portable Modular Data Center)를 자체 설계·구축·운영하는 기업으로서 ECI(Elice Cloud Infrastructure)와 AI PMDC를 기반으로 빠르고 안정적이며 유연한 AI 환경을 제공하며, 연구와 개발이 최적의 성과를 낼 수 있도록 지원합니다. 인프라팀은 국내 최초로 수랭식 B200 GPU를 InfiniBand 400G 네트워크로 연결한 초대형 클러스터 구축에 성공했습니다. AI 서버, Ceph 스토리지, 병렬 파일시스템, Kubernetes, 방화벽과 IPS, DDoS 대응, 그리고 PMDC의 물리적 인프라까지 하드웨어부터 소프트웨어, 보안, 네트워크, 데이터센터 설계까지 모든 계층을 직접 다룹니다. 팀에 합류한다면 AI 학습 환경을 위한 A100, H100, 그리고 다양한 NPU 서버까지 다루며, 100G급 서버 네트워크, 400G 스토리지 네트워크, 100G급 ISP 회선을 처음부터 끝까지 설계하고 운영할 수 있습니다. 수백 노드 규모의 GPU 클러스터를 직접 운영하고, SW(Ceph, Kubernetes), HW(InfiniBand)에 걸친 대규모 분산 인프라 설계 및 자동화, 글로벌 PMDC 프로젝트 참여도 경험할 수 있습니다. 이런 스케일의 인프라를 직접 다뤄볼 수 있는 기회는 오직 엘리스그룹뿐입니다. 지금 지원하신다면 남이 만들어 놓은 인프라를 단순히 운영하는 사람이 아닌 AI 세대를 위한 새로운 인프라의 기준을 설계하는 팀의 구성원이 될 수 있습니다. /*엘리스 시니어 인프라 시스템 엔지니어는 뭐가 특별할까요?*/ AI 인프라의 핵심인 대규모 GPU 클러스터를 최적화하고 고도화하는 기술 총괄 역할입니다. 수천 노드 이상의 GPU 서버가 유기적으로 작동해야 하는 환경에서, 극한의 성능과 가용성을 보장하는 고성능 시스템 아키텍처를 설계합니다. 기존 운영 방식의 효율화를 넘어, 아키텍처 레벨에서 성능 병목과 안정성 문제를 해결하고, 확장성을 갖춘 차세대 인프라 모델을 제시할 수 있는 주도적인 엔지니어를 모십니다.

주요업무

• 대규모 Linux 서버 운영 아키텍처 설계 확장성, 고가용성, 보안성을 만족하는 GPU 클러스터 및 서버 인프라의 표준 아키텍처 설계 및 구축 • GPU 클러스터 및 HPC 인프라 운영 최적화 OS 커널 튜닝, 시스템 파라미터 최적화, 워크로드 분산 등 성능 극대화를 위한 심층적인 작업 주도 • OS 이미지·배포·구성 자동화 프레임 설계 전체 인프라를 아우르는 통일된 OS 이미지 관리, 배포(Deployment), 구성(Configuration) 자동화 시스템 설계 및 고도화 • 장애 RCA 리딩 및 구조적 개선 중요 장애 발생 시 근본 원인 분석(RCA)을 리딩하고, 시스템 아키텍처와 프로세스의 구조적 결함을 찾아 개선안 도출 및 적용 • Capacity Planning 및 로드맵 설계 AI 서비스 성장에 따른 인프라 로드맵과 용량 계획을 수립하고, 기술 정책 및 표준화 작업을 주도 • 인프라 기술 평가 및 도입 최신 서버 하드웨어, 관리 툴, 운영 기술을 선제적으로 평가하고 도입을 결정하여 기술적 우위를 확보

자격 요건

• Linux 기반 시스템 운영 경력 5년 이상 및 대규모 인프라 아키텍처 설계 경험 필수 • 시스템 성능 분석, 병목 현상 진단 및 튜닝(Tuning)을 주도적으로 수행할 수 있는 능력 • 자동화(IaC, Infrastructure as Code) 기반의 시스템 배포 및 운영 체계 구축 경험 • 뛰어난 문제 해결 능력과 복잡한 시스템 장애의 근본 원인을 파악하는 분석적 사고

우대사항

• 대규모 GPU 서버 또는 HPC(High Performance Computing) 클러스터 운영 및 설계 경험 • 스토리지, 네트워크 등 인접 인프라 스택에 대한 깊은 이해 • 대규모 서버 인프라를 위한 보안 아키텍처 설계 경험

채용절차

서류 전형 > 미니 프로젝트 > 대면 인터뷰 > 레퍼런스 체크 > 처우 협의 > 최종 합격

기타안내

[커리어 성장 기회] • 시스템 아키텍처 Owner 회사의 AI 인프라 전반의 시스템 아키텍처를 정의하고, 기술 로드맵을 주도하는 최고 기술 책임자로 성장할 수 있습니다. • PMDC/HPC 인프라 설계 리딩 참여 차세대 데이터센터 구축 시 인프라 설계 단계부터 참여하여 기술적 의사결정을 리딩할 수 있습니다. • 인프라 기술 혁신 주도 시스템 엔지니어링 분야의 핵심 기술 연구 및 선행 도입을 주도하고, 전체 AI 인프라의 기술 표준과 로드맵을 제시하는기술 리더로 성장할 수 있습니다. [그 외 복지] 1. 엘리서가 일잘러로 성장할 수 있도록 적극 지원합니다. • 웰컴키트와 효율적인 업무를 위한 최신형 디바이스 제공 • 전자도서관 서비스를 통한 도서 무제한 지원 • 엘리스 강의 무료 수강 및 직무 역량 교육 지원 • 저녁 식대 및 야근 택시비 지원 • 간식, 커피 무제한 제공 2. 엘리서는 동료를 존중하며 수평적이고 투명하게 소통합니다. • 엘리스의 사업 방향과 팀 현황을 공유하는 전사 미팅 진행(게더링) • 빠르고 투명한 정보 공유(M365/Teams/Outlook) • 의미있는 피드백을 위한 팀 스크럼 운영 • 편안한 자율 복장과 수평적인 '님' 호칭 사용 3. 엘리서의 노력에 보답하기 위해 끊임없이 고민합니다. • 반기별 성과급 지급 및 월별 베스트 엘리서 선정 • 팀워크 강화를 위한 팀 디너 지원 • 경조사에 따른 화환 및 휴가 지원 • 백신 접종 및 건강검진을 위한 휴가 제공 4. 팀 커뮤니케이션 활성화를 지원합니다. • 팀 간 교류로 유대감을 강화하는 점심 소통 프로그램 운영(밍글런치) • 신규 입사자 온보딩을 위한 버디 프로그램 운영 • 팀 내 소통 강화를 위한 리더비 지원
이 포지션에 필요한 전문분야/기술
데이터센터
Terraform
Linux
HPC
서버
회사 로고
(주)엘리스
정보 보기
누적 투자 금액
333억원 이상
투자사
버텍스그로쓰, 알토스벤처스, 삼성벤처투자, 엘비인베스트먼트, 한국산업은행, 네이버 D2SF, 카이트창업가재단
리멤버에서 수집한 기업 정보입니다. 정보 수정이 필요할 경우, 아래 경로로 요청해 주세요.
리멤버 앱 > 더보기 > 1:1 문의
먼저 입사한 실무자에게 조언을 구해보세요
사용자가 커넥트에 입력한 정보를 기반으로 제공됩니다
company logo
(주)엘리스

[엘리스] 시니어 인프라 시스템 엔지니어

시리즈 C
누적 투자 300억↑
1-50명
연봉협의
근무지서울특별시 강남구
경력5년~15년 차
학력학사 이상
마감일
채용 시 마감
이 공고를
주변에도 알려주세요