주요업무
1. API 및 서비스 설계
- AI 연구팀이 제공하는 API 명세서를 기반으로 백엔드 서비스의 설계 및 구현
- RESTful API 또는 gRPC 서비스 개발 및 클라이언트와의 통신 최적화
- 모델 입력/출력 처리 로직을 구현하여 안정적인 AI 모델 서빙 환경 제공
2. 서비스 아키텍처 구축 및 최적화
- 고가용성(High Availability) 및 확장성(Scalability)을 고려한 백엔드 아키텍처 설계
- 비동기 처리(Asynchronous Processing)와 대기열 시스템(RabbitMQ, Kafka 등)을 활용하여 효율적인 요청 처리 구조 개발
- CI/CD 파이프라인을 구축하여 빠르고 안정적인 서비스 배포 환경 제공
3. AI 모델 서빙 및 운영
- AI 모델을 효율적으로 서빙하기 위한 서빙 프레임워크(TorchServe, FastAPI 등) 활용
- 배포된 모델의 실시간 성능 모니터링 및 로깅 시스템 구축(Logstash, Elasticsearch 등)
- 모델 요청/응답 시간 최적화를 위한 캐싱(Cache) 및 병렬 처리 기술 도입
4. 데이터 파이프라인 및 저장소 관리
- AI 모델이 사용하는 데이터의 저장 및 조회를 위한 데이터베이스 설계 및 최적화
- Blob Storage(S3 등)와의 연동 및 대규모 데이터 전송 최적화
- 요청 데이터를 기반으로 발생하는 로그, 결과물 및 통계 데이터 관리 시스템 구현
5. 클라우드 환경 기반 서비스화
- 클라우드(AWS, GCP, Azure) 환경에서 AI 서비스 배포 및 운영
- 컨테이너 오케스트레이션 도구(Docker, Kubernetes)를 활용한 서비스 배포 및 관리
- Auto-scaling 및 로드밸런싱을 통해 사용자 요청 증가에 대비한 확장 가능한 서비스 제공
6. 보안 및 사용자 인증
- AI API의 인증(Authentication) 및 권한 관리(Authorization) 구현
- HTTPS 및 API Key, OAuth 등 보안 프로토콜 적용
- 요청 데이터 및 결과물의 암호화 처리 및 데이터 유출 방지 대책 수립
7. 서비스 성능 및 안정성 개선
- AI 모델 연동 서비스의 성능 병목 현상을 분석하고 최적화
- 장애 대응 및 복구를 위한 모니터링 및 알림 시스템 구축(Prometheus, Grafana 등)
- 대규모 요청을 안정적으로 처리하기 위한 Rate Limiting 및 Throttling 구현
8. 협업 및 문서화
- AI 연구·개발팀 및 프론트엔드 팀과 협업하여 통합적인 서비스 제공
- API 명세서(Swagger, OpenAPI) 작성 및 유지보수
- 개발된 서비스의 기술 문서화 및 운영 가이드 제공
9. 백오피스 툴 제작
- 다른 팀을 위해 DB 조작, 인공지능 데모, 결과 생성 등 기타 기능 지원
- 외부 프로그램 관련 업무