주요업무
[조직소개]
우리는 빗썸의 기술 조직 중에서도 운영 자동화와 시스템 신뢰성 확보라는 고유한 기술 문제에 집중하는 독립적인 핵심 기술 조직입니다. 일반 서비스 개발 조직과는 분리되어, 오직 입출금, 월렛 보안, R&D 등 ‘블록체인 코어’ 기술을 안정적으로 지원하는 운영 플랫폼을 구축합니다.
우리의 핵심 과제는 수백 개에 달하는 블록체인 노드를 안정적이고 효율적으로 운영하고, 금융 수준의 무결성이 요구되는 미션 크리티컬 시스템이 24/7 중단 없이 동작하도록 보장하며, 이 모든 과정을 개발자들이 빠르고 안전하게 배포하고 관측할 수 있도록 지원하는 것입니다.
이를 위해 우리는 자동화, 표준화, 플랫폼화를 핵심 전략으로 삼아, 개발자 경험(DX)을 극대화하고자 합니다. 이를 통해 개발 생산성과 시스템 안정성을 높이는 내부 플랫폼을 구축하고 SRE 문화를 팀에 도입하고 정착시키는 데 기여하게 됩니다.
• 미션 크리티컬 서비스에 적합한 CI/CD(GitOps 등) 파이프라인을 구축하고 운영을 안정화하여, 개발자들이 신속하고 안전하게 배포할 수 있는 환경을 제공합니다.
• 수백 대의 멀티체인 노드의 배포, 업데이트, 장애 복구를 자동화하는 안정적인 시스템을 구축하며, 이 과정에서 업계 최고 수준의 노드 운영 전문성을 쌓을 수 있습니다.
• 단순한 장애 대응을 넘어, SLI/SLO 정의를 시도하고 데이터 기반의 의사결정을 지원하며 팀에 SRE 문화를 도입하고 정착시키는 기반을 마련합니다.
• Prometheus, Grafana, ELK 등을 활용하여, 개발자들이 쉽게 자신의 서비스 상태를 모니터링하고 로그를 추적할 수 있는 표준화된 관측 가능성 환경을 구축합니다.