L

(Seoul) Senior Data Engineer

Lunit
Full-time
On-site
Remote

This position is open for candidates who reside in Korea and have a Korean proficiency appropriate for working in a Korean business.

"Conquering cancer through AI"

Lunit은 "Learning Unit"을 줄여 만든 이름으로, 암 진단 및 치료에 기여하는 인공지능 솔루션을 개발하고 제공하는 의료 AI 기업입니다.
루닛은 인공지능 기술을 통해 더 정확한 암 진단과 치료 효과 예측이 가능해지고, 환자를 위한 신속한 맞춤형 치료가 가능해지는 시대를 열고자 합니다.

💭 About the team

  • What do we do? (Department Mission)
    AI Platform Department 는 전 세계 환자의 진단과 치료에 실제로 사용되는 의료 AI 모델이 안정적으로 동작하도록 데이터·학습·운영·서빙 전반을 아우르는 기반 플랫폼을 구축합니다. 우리는 기술을 통해 암의 조기 발견과 정확한 치료라는 목표에 기여하고자 합니다.
  • How do we work? (Work Style)
    • 빠르게 시도하고 실사용자 피드백을 바탕으로 지속적으로 개선하는 개발 문화
    • 문제 정의 단계부터 PM, AI 연구자, 엔지니어가 함께 참여하는 강한 협업 구조
    • 품질을 지키면서 속도를 높이기 위해 AI 기반 개발·자동화 도구 적극 활용
    • 명확한 설계와 코드 리뷰를 통한 투명한 기술 의사결정
  • What kind of problems do we solve? (Design Philosophy)
    • TB~PB 규모의 의료 데이터를 다루는 대규모 데이터 인프라 문제
    • 데이터 보안·프라이버시 규제를 충족하는 엔터프라이즈 아키텍처
    • 연구자가 수천 건의 실험을 수행할 수 있도록 지원하는 대규모 ML 파이프라인 자동화
    • 글로벌 병원 인프라와 연결된 데이터 연동·모니터링 시스템
  • Who will I spend 8+ hours/day with? (Co-workers)
    • 글로벌 인재로 구성된 AI 연구자, SW 엔지니어, MLOps 엔지니어 등 전문성 높은 동료들
    • 영어와 한국어가 자연스럽게 공존하는 팀 환경
    • 서로의 지식과 배경을 존중하며 함께 성장하는 문화

💭 About the position

  • What will I build? (Scope of Work)
    • 의료 데이터 수집·정제·변환 파이프라인
    • AI 학습 데이터셋 생성 및 버전 관리 시스템
    • 대규모 ML 워크플로우 자동화
    • Data Lineage, Metadata, Quality 관리 체계
    • 규제·보안이 중요한 의료 데이터 거버넌스 인프라
    • 글로벌 SaaS 형태의 의료 AI 데이터 플랫폼
  • What design/engineering challenges will I face? (Focus Area)
    • PB 규모 의료 데이터 파이프라인 설계
    • 멀티클라우드(AWS/GCP/Azure) 운영
    • 의료 규제 준수 + 자동화를 동시에 만족하는 구조 설계
    • GPU 학습 환경과 연동되는 고성능 데이터 공급 문제 해결
    • 글로벌 연구자와 함께 사용하는 공용 ML 플랫폼 구축
    • 제품–연구–엔지니어링 요구를 조율하는 협업 중심의 문제 해결
  • What kind of engineer fits well here? (Ideal Profile)
    • 데이터 시스템의 “전체 흐름”과 “구조”를 설계하는 일을 좋아하는 분
    • 복잡한 문제를 구조화하고 실용적인 해결책을 제시할 수 있는 분
    • Data Quality, Security, Lineage 에 높은 기준을 가진 분
    • '의료 AI'라는 어려운 도메인에서 의미 있는 변화를 만들고 싶은 분
  • How will I grow? (Opportunities)
    • 복잡한 AI·데이터 시스템을 총괄적으로 설계하는 경험
    • 글로벌 의료 AI SaaS 플랫폼 구축 경험
    • Research–MLOps–Engineering이 맞물린 대규모 조직 구조에서의 성장
    • 플랫폼 아키텍처 전반에 영향을 미치는 핵심 기술 결정 기회

🚩 주요 업무

우리가 구축하는 데이터 인프라와 파이프라인은 의료 AI 모델의 정확도·재현성·신뢰성을 결정하는 핵심 요소입니다. Data Engineer의 한 줄 코드, 하나의 파이프라인 개선은 결국 전 세계 환자의 진단 결과에 직접적인 영향을 미칩니다.

  • TB~PB 규모의 의료 영상·진단 데이터를 안정적으로 처리하기 위한 데이터 파이프라인을 설계·자동화·운영
  • 통합된 데이터 포맷에 대한 Governance 를 수립하고 지속적으로 관리하여 데이터 표준화와 품질을 보장
  • 데이터 수집–정제–변환–검증–배포까지 이어지는 End-to-End DataOps 워크플로우를 구축하여, AI 연구자와 MLOps 엔지니어의 생산성을 극대화
  • 의료 규제(HIPAA, GDPR, EU AI Act 등)를 충족하는 보안·접근제어·감사 체계(RBAC, Audit Trail)를 설계
  • GPU 대규모 학습 환경과 연동되는 학습 데이터 관리 파이프라인(Data Versioning, Lineage, Quality Check)을 구성
  • Airflow·Prefect 등 Workflow Orchestrator 기반의 스케줄링·모니터링·장애 대응 자동화를 구축
  • AI 기반 개발도구(Cursor, Codex, ChatGPT, Claude Code 등)을 적극 활용해 파이프라인 생성·테스트·문서화를 자동화하며 팀 전체의 생산성을 향상
  • 플랫폼을 사용하는 연구자·엔지니어와 긴밀하게 협업하여, 실제 문제를 해결하는 운영 친화적 데이터 인프라를 구축

🚩 Tech Stack

AI Platform Department는 AI를 활용해 품질을 유지하면서 생산성을 극대화하는 엔지니어링 문화를 지향합니다.

  • Core Technologies
    • Python 기반 데이터·워크플로우 개발
    • Prefect, Airflow 기반 ETL/ML 파이프라인
    • PostgreSQL, BigQuery, Athena
    • S3/GCS 기반 대용량 데이터 처리
    • Kubernetes, Docker
    • MLflow, DVC, LakeFS
    • Kafka, Redis (필요 시)
  • Security / Governance
    • 의료 데이터 및 모델에 대한 Governance/Lineage
    • RBAC 기반 안전한 데이터 접근
    • 데이터 품질 검증 및 정책 기반 접근 관리

Requirements

🎯 자격요건

  • 데이터 플랫폼·파이프라인 설계/운영
    • 데이터 플랫폼/파이프라인 설계·운영 7년 이상의 실무 경험
    • DataOps/MLOps 환경 구축 경험
    • Airflow, Prefect 기반 ETL/ML 파이프라인 설계·운영 경험
    • 분산 환경(S3/GCS/HDFS 등)에서의 대용량 파일·메타데이터 처리 경험
    • 데이터 버전 관리(DVC, LakeFS) 및 메타데이터 추적 구현 경험
  • 데이터 품질·보안·거버넌스
    • 데이터 품질, 안정성, 보안, 거버넌스를 고려한 설계 경험
    • RBAC, IAM, 정책 기반 접근제어 시스템 설계 경험
    • 데이터 품질 지표 및 자동화된 테스트·검증 구축 경험
  • AI·의료 도메인 이해
    • 의료 데이터(DICOM, Pathology, PHI 등) 이해 또는 학습 의지
    • AI 모델 개발·임상 워크플로우 등 도메인 지식
  • 플랫폼 아키텍처 및 운영 경험
    • SaaS 기반 데이터 플랫폼 구축 경험
    • 실시간/스트리밍 데이터 처리(Kafka, Flink 등) 경험
    • 클라우드 비용 최적화 및 데이터 카탈로그 구축 경험
  • 협업 및 커뮤니케이션
    • AI Research, MLOps, Backend, 의료 전문가 등과의 협업 능력
    • 요구사항 조율 및 기술적 커뮤니케이션 역량
    • 영어 커뮤니케이션 역량
  • 문제 정의 및 설계 역량
    • 문제를 구조화하고 실행 가능한 설계·로드맵으로 구체화하는 분석력
    • 사용자 중심의 플랫폼 구조 설계 경험
  • 조직 기여 및 기술 성장
    • 주니어 엔지니어 멘토링 경험

🏅 우대사항

  • 의료 데이터 특성(DICOM, Pathology image, PHI 관리 등) 이해
  • 대규모 GPU 학습 환경 및 데이터 공급 파이프라인 구축 경험
  • 데이터 품질 지표(DQ), 자동화된 테스트·검증 시스템 구축 경험
  • 클라우드 비용 최적화 경험
  • 데이터 카탈로그(DataHub, Amundsen 등) 구축 경험
  • 주니어 엔지니어 멘토링 경험
  • 글로벌 협업 경험

📝 제출서류

  • 자유양식의 CV
  • 포트폴리오 또는 기타 관련 자료(선택사항)

🏃‍♀️ 전형 절차

  • Document Screening → Competency-based Interview → Culture-fit Interview → Onboarding
    • 최종 면접 이후, 필요 시 레퍼런스 체크를 진행할 수 있습니다.

🤝 근무 조건 및 근무 환경

  • 근무형태 : 정규직
  • 근무지역 : 루닛본사 (강남구 강남대로 374 케이스퀘어 강남2, 5층)
  • 급여 : 면접 후 결정

🎸 기타사항

  • 입사지원 서류에 허위사실이 발견될 경우, 채용확정 이후라도 채용이 취소될 수 있습니다.
  • 국가 유공자 및 장애인 등 취업보호대상자는 관계법령에 따라 우대합니다.
  • 본 공고는 수시 채용으로, 조기 마감될 수 있습니다.

Benefits

🌻 Benefits & Perks

  • 강남역 3번 출구 도보 1분 거리에 위치한 신규 오피스(언덕 없는 평지)
  • 오피스 근무 시 12,000원의 식비 지원(점심,저녁) 및 무제한 간식 제공
  • 최신 사양의 컴퓨터 장비(Mac, 4K 모니터 등)선택, 3년마다 최신형 장비 지원 
  • 학회 참석, 직무 교육, 도서 구매 지원
  • 정규 사내 인공지능/의료 세미나 개최
  • 원어민 영어 교육 프로그램 수강 지원
  • 대규모 고품질 인공지능 학습 데이터 및 딥러닝 DevOps 시스템 보유
  • 자유롭게 쓸 수 있는 복지 포인트 연간 120만원 지원
  • 명절 선물 및 각종 경조사에 대한 경조사비와 경조휴가 지원
  • 종합건강검진, 임직원 상해 보험 가입 등의 지원