주요업무
・성공적인 프로덕트 개발을 위한 AI Safety 윈천기술 연구·개발
・아래 업무들을 수행하게 될 예정입니다.
- AI Safety Benchmark 연구 및 개발
(기본/자체 벤치마크, 금융 특화, 멀티턴, 멀티모달, 에이전트 대상, 시의성 반영 벤치마크 등)
- AI Safety Judge 모델 연구 및 실험 설계
(Safety Judge, Security Judge, Multi-modal Judge, Judge Metric 개발 포함)
- 안전성·보안성 평가를 위한 Rubrics 및 산업 도메인 특화 평가 지표 설계
(범용 도메인 Safety Rubrics, 금융·제조·헬스케어 등 산업 도메인별 Rubrics)
- 안전성 평가용 데이터셋 생성 및 자동화 시스템 개발
(Safety Query/Response 생성 모델, Filtering 모듈, Safety 학습 데이터 제작)
- 공격자(Attacker) 기반 Red-teaming 방법론 연구 및 설계
(Prompt Injection, Agent-based Attacker, Pyrit/Garak 기반 Attacker 내재화)
・고객 문제 정의 및 해결을 위한 가설 설정 및 검증