company logo
(주)업스테이지

[전문연구요원 신규편입 & 전직] AI Research Engineer - Vision Language Model

누적투자 100억↑
  • 공고소개
  • 주요업무
  • 자격요건
  • 우대사항
  • 채용절차
*본 공고는 병역특례에 해당하는 ‘전문연구요원’을 희망하는 분들에 한해 지원하실 수 있으며, 병역의무가 없는 분들은 지원대상에 해당되지 않습니다. 업스테이지는 "Making AI Beneficial" 비전과 "Building intelligence for the future of work"라는 미션 아래, 단순히 글자와 문장만 읽는 수준을 넘어 사진·차트·표 등 시각 정보를 함께 파악하고 텍스트와 종합해 이해하는 Vision-Language-Model (VLM) 기반의 차세대 AI 솔루션을 만들고 있습니다. 이는 고객이 보유한 방대한 문서 데이터 속에서 잠들어 있던 정보를 추출하여, 새로운 인사이트와 부가가치를 실현할 수 있는 기회를 제공합니다. 이를 위해 업스테이지의 VLM 팀은 웹스케일의 데이터 수집과 합성, 대규모의 사전/사후 학습, 그리고 다양한 평가 방법에 대한 연구 개발을 진행하고 있습니다. 업스테이지는 누구나 손쉽게 AI 기술을 활용할 수 있도록 ‘사용이 쉬운 AI 솔루션’을 제공하는 것을 목표로 하고 있습니다. 이미 최고 수준의 OCR 기술과 문서 내 의미 있는 정보를 자동으로 추출하는 Key-Value 추출 기술을 보유하고 있으며, 최근에는 다양한 문서 레이아웃을 분석하는 Document Parsing 모델을 공개하였습니다. 이러한 기술들을 바탕으로, 업스테이지는 기업들의 업무 효율과 생산성을 극대화하는 맞춤형 AI 솔루션을 제공하여 AI가 실제 비즈니스에서 큰 가치를 창출할 수 있도록 노력하고 있습니다. 또한 LLM 기술을 비즈니스 환경에 맞게 최적화해 기업들의 업무 효율과 생산성을 높일 수 있는 Private LLM 서비스를 제공하는 등 AI가 세상에 이롭게 쓰이게 하기 위해 세계 최고 수준의 AI 모델을 다양한 분야에서 손쉽게 활용할 수 있는 API 시리즈를 출시하여 기업 고객들의 비즈니스 성공에 기여하고 있습니다. 그 중에서 업스테이지 Document AI는 세계 최고 수준의 OCR 및 정보추출 기술력을 바탕으로 한 제품으로, AI를 통해 번거로운 문서 처리를 자동화하고 효율화하겠다는 목표를 가지고 있습니다. 저희는 이 흥미롭고 도전적인 여정을 함께할 새로운 멤버를 찾고 있습니다. 멀티모달 AI 분야에서 기술을 선도하고자 하는 열정을 가지고, 연구에 그치지 않고 실제 서비스까지 연결되는 End-to-End AI 경험을 바탕으로, 협업을 통해 기술을 확장하고 제품화 과정에서 빠르게 성장하길 원하는 분이라면, 업스테이지 VLM 팀에 꼭 맞는 동료가 될 것입니다.

주요업무

• 데이터 수집 파이프라인 설계 및 구축 • 멀티모달 데이터(문서 이미지, 현장 사진, 차트 등)의 수집 및 필터링을 포함한 데이터 수집 파이프라인 설계 및 구축 • 데이터 품질 향상을 위한 전처리 및 개선 기법의 연구·적용 • 데이터팀과의 협업을 위한 Human-in-the-loop 기반 어노테이션 워크플로우 설계 및 운영 • 모델 학습 • 대규모 Multi-modal representation learning 및 Cross-modal pretraining 기법의 연구 및 적용 • 다양한 질의응답 태스크에 대응하기 위한 Instruction tuning 전략 개발 • 학습과 추론 효율을 고려한 모델 구조 개선 및 최적화 기법 연구 • 평가 • 문서 중심 VLM 모델의 성능을 평가하기 위한 다양한 평가 기법 조사 및 적용 • 실제 사용 환경에 부합하는 새로운 평가 방법의 개발 및 도입 • 지속적인 개선과 확장이 가능한 내부 벤치마크 도구의 설계 및 구현 • 그 외 • 연구 결과를 탑티어 국제 학회 논문 또는 오픈소스 코드 형태로 공유 • 최신 논문 재현 및 기법 도입을 위한 선행 연구 주도 및 팀 내 기술 공유 • 제품팀, MLOps팀 등과의 긴밀한 협업을 통한 모델의 실서비스 적용 및 시스템 통합

자격 요건

• 관련 분야 석사 혹은 박사 학위 • AI 문제를 정의하고 해결하는 능력 • 기초 머신러닝 알고리즘에 대한 깊은 이해 • Python, C++ 등의 언어를 활용한 강력한 프로그래밍 능력 및 Linux/Shell 활용 능력 • 컴퓨터 비전(CV), 자연어처리(NLP), 멀티모달 학습 최신 알고리즘 이해 • 주요 기계 학습 프레임워크에 대한 깊은 이해(예: TensorFlow, PyTorch) • 다양한 협업 환경에서 일할 수 있는 능력 • 훌륭한 의사 소통 능력

우대사항

• 대규모 상용 ML(CV, NLP 등) 제품 개발 경험 • Vision–Language Model 관련 연구 및 논문(e.g. CVPR, ICCV, ACL, EMNLP) 게재 경험 • 최고의 AI 컨퍼런스(e.g. NeurIPS, ICML, ICLR, AAAI, CVPR, ICCV, ECCV, ACL, EMNLP, KDD 등)에서 1저자 혹은 교신저자로 출판 기록 • 국제 혹은 국내 AI 대회(Kaggle 등) 상위권 입상 • 대규모 데이터로부터 AI 모델 학습 및 추론을 위한 data/model pipeline을 개발한 경험 • AI 관련 연구 또는 프로덕트 개발을 리딩한 경험 • 새로운 연구 혹은 개발 방향성을 제시할 수 있는 능력 • 멀티모달 VLM 최적화 및 도메인 적응(fine-tuning) 경험

채용절차

모집 절차 - 전체 온라인으로 진행 • 서류 전형 • 알고리즘 코딩테스트 • 딥러닝 코딩테스트 • 기술 인터뷰 (1차) • 기술 인터뷰 (2차) • 컬처 인터뷰 • 최종 인터뷰 • 최종 결과 발표 *절차는 상황에 따라 조정될 수 있습니다. *최종 인터뷰 후, 레퍼런스 체크 절차가 진행될 수 있습니다.
회사 로고
(주)업스테이지
정보 보기
누적 투자 금액
1416억원 이상
투자사
케이티, 한국산업은행, 아이비케이기업은행, 에스케이네트웍스, 신한벤처투자, 하나벤처스, 미래에셋벤처투자, 소프트뱅크벤처스아시아(SBVA), 프라이머사제파트너스, 컴퍼니케이파트너스, 티비티파트너스, 프리미어파트너스, 스톤브릿지벤처스
리멤버에서 수집한 기업 정보입니다. 정보 수정이 필요할 경우, 아래 경로로 요청해 주세요.
리멤버 앱 > 더보기 > 1:1 문의
company logo
(주)업스테이지

[전문연구요원 신규편입 & 전직] AI Research Engineer - Vision Language Model

누적투자 100억↑
연봉

협의

근무지

경기도 용인시 수지구 경기도 용인시 처인구 경기도 용인시 기흥구

경력

경력 무관

학력

석사 이상

마감일

채용 시 마감

이 공고를
주변에도 알려주세요