합류하게 될 팀에 대해 알려드려요
- 데이터 마트 플랫폼팀은 토스의 다양한 제품들의 데이터에 대해 표준화된 Data Warehouse를 구축하여 데이터 사일로화를 방지하고 전사 Data Maturity 개선을 위해 노력하는 팀이에요.
- 구성원은 업무성격에 따라 Data Analytics Engineer (Platform)와 Data Analytics Engineer (Product)으로 나뉘어요.
- DAE(Platform) 구성원은 중앙화된 전사 DW Quality 관리 프로세스 고도화, 표준 모니터링, 각 제품데이터와 전사통합마트 연동 및 효율적인 파이프라인 설계, 전사 표준마트 생성 등의 업무를 수행해요.
- DAE(Product) 구성원은 담당 제품 도메인 소속이 되어 전사 DW표준안을 준수하여 표준마트설계, 개발, 운영 업무를 수행하고 제품의 표준마트에 대한 Data Ownership을 가져요.
주요업무
합류하면 함께할 업무예요
- 토스 DW표준안에 대해 숙지하는 온보딩 과정을 거친 이후 Data Mart Platform Team 소속으로 업무를 수행해요.
- Agile 하면서도 관리가 용이한 전사 DW표준안을 유지/관리하고 및 각 도메인의 DAE(Product)와 협업을 통해 전사 관점의 DW Quality 관리의 책임을 가져요. (표준관리 모니터링 개발 및 수행)
- 데이터 신뢰성을 높이기 위한 시스템/프로세스를 기획하고 실행하여 각 테이블의 정합성 개선, DQ rule 고도화, health check 지표화 등의 업무를 수행해요.
- IR, Finance, 제품통합분석 등 전사관점의 마트개발을 담당하고, 각 도메인의 표준마트와 전사통합마트의 통합을 책임지고 효율적인 구조로 연동이 이루어질 수 있도록 데이터 파이프라인 상의 개선을 이뤄요.
- 이 외에도 조직에 데이터가 잘 흐를 수 있도록 data discoverability 개선 등의 업무를 발굴하고 수행해요.
- 토스의 여러 도메인들의 Data Maturity 를 측정할수 있는 플랫폼을 개발하고, 도메인들의 DAE의 생산성을 올릴 수 있는 프로젝트를 발굴하고 고도화 해요.
- 데이터 개발 환경은 Hadoop, Airflow, Python, SQL(Impala) 기반이에요.
자격 요건
- Database 정규화 및 Data Warehouse의 기본적인 특징에 대한 이해가 있어야 해요. (Subject-Oriented, Integrated, Non-Volatile, Time-Variant)
- DW 데이터모델러로서 주요개념을 명확하게 정의하고, 다양한 데이터 관점에서의 이해를 바탕으로 효율적인 데이터 구조를 설계하고 제안할 수 있어야 해요.
- DW 표준관리에 대한 높은 수준의 이해가 필요하고 전사레벨의 표준관리 측면에서 개선안을 제시하고 리딩할 수 있어야 해요
- 데이터 품질, 컴플라이언스 등 데이터 거버넌스 측면에 대해 높은 이해도를 바탕으로 실행안을 제안할 수 있어야 해요.
- SQL 활용능력이 높아야 하고 효율적이면서 가독성을 고려한 형태의 쿼리작성이 가능해야 해요.
- Python은 초급(Airflow를 사용할 수 있는 정도) 수준이어도 업무에 지장은 없으나 다른 사람이 작성한 모듈이나 pyspark코드를 이해하는 수준이면 좋아요.
- 대용량 데이터 처리 경험, AARRR 관점에서 지표를 설계하고 분석한 경험이 있으면 좋아요.
우대사항
- DW구축 프로젝트 및 마트 설계 경험이 있으면 기여한 부분에 대해 구체적으로 언급해 주시면 좋아요.
- Data Maturity 측면에서 고민하고 해결하고자 했던 문제들에 대해서 구체적으로 언급해 주시면 좋아요.
- 데이터 관련 문제를 해결하면서 기여한 부분 및 배운 점을 구체적으로 언급해 주시면 좋아요.