주요업무
•고속 드론 및 로보틱스 RL 제어
-초고속 드론 및 기타 로봇 플랫폼을 위한 RL 기반 제어 알고리즘 설계
-최신 RL 기법(예: PPO, SAC, TD3)을 활용한 연속 제어 정책 학습 및 반복 개선
-실제 환경에서의 신뢰성 확보를 위한 안전 제약, 가드레일, 폴백(대체) 컨트롤러 정의
-로버의 내비게이션 및 에너지 효율 개선을 위한 RL 기반 접근 탐색
•시뮬레이션, HITL, 강건성 테스트
-실제 하드웨어 동작을 반영하는 시뮬레이션 환경 구축 및 유지보수(Gazebo, Isaac, -UnrealEngine 또는 커스텀)
-강건한 정책 전이를 위한 RL 시나리오, 커리큘럼 전략, sim-to-real 파이프라인 설계
-엣지 케이스 및 성능 저하 조건에서의 검증을 위한 HITL 및 적대적(adversarial) 테스트 수행
-재현 가능한 실험을 위해 시뮬레이션 출력(롤아웃, 리워드, 메트릭) 표준화
•RL 데이터 워크플로우 (로그 · 센서 · 비디오 · 데이터셋)
-비행 로그, 센서 데이터, 비디오, 시뮬레이션 롤아웃 전반에 걸친 RL 실험 데이터 워크플로우 소유
-데이터셋을 쉽게 찾고 일관되게 사용할 수 있도록 네이밍 규칙, 메타데이터 스키마, 저장 레이아웃 정의
-RL 학습/평가용 데이터셋 큐레이션 및 버저닝(Train/Val/Test 분할, 데이터셋 버전 관리)
-커버리지, 편향, 실패 모드를 면밀히 고려한 데이터셋 전략 설계
•인지/추적을 위한 ML (RL/자율에 필요 시)
-자율/RL을 지원하는 컴퓨터 비전 작업(탐지, 추적 등)을 위한 ML 파이프라인 구축 및 유지
-필요 시 인지 결과를 RL 학습 및 평가 루프에 통합
•엣지 배포 및 모델 최적화
-엣지 하드웨어(예: Jetson / 임베디드 GPU)에 RL 정책 및 ML 모델 배포
-온디바이스 제약을 고려한 모델 최적화: 디스틸레이션, 양자화, 프루닝, 런타임 성능 튜닝
-오프라인 실험과 온디바이스 동작 간 평가/검증의 일관성 확보
•실험 관리 및 크로스펑셔널 협업
-실험 관리 체계 정의: run ID, 설정(config), 메트릭, 아티팩트 저장, 대시보드
-풀스택 엔지니어와 협업하여 로그 탐색 및 실험 추적을 위한 저장 시스템, DB 스키마, 내부 도구 설계/구축
-자율주행 엔지니어와 협업하여 안전한 제어 인터페이스, 공유 시뮬레이션 자산, 전체 자율 스택 통합 추진
-RL 정책을 상위 수준의 “스킬” 또는 도구로 노출해야 하는 경우 LLM 엔지니어와 협업