spoonai
TOPOpenAILife SciencesDrug Discovery

OpenAI, 생명과학 전용 모델 'GPT-Rosalind' 던졌어

OpenAI가 생명과학 연구에 특화한 첫 전용 모델 GPT-Rosalind를 Amgen·Moderna·Allen Institute·Thermo Fisher 등 '자격 있는 고객'에게만 제한 공개. 신약 개발에서 의료로 AI 타깃이 옮겨붙는 신호야.

·6분 소요·OpenAIOpenAI
공유
OpenAI GPT-Rosalind 생명과학 연구 모델 런칭 배경 이미지
출처: OpenAI

인트로 훅 — BixBench에서 GPT-5.4를 눌렀어

0.751 대 0.732. GPT-Rosalind가 BixBench(생명정보학 종합 벤치마크)에서 GPT-5.4를 앞질렀어. Grok 4.2(0.698)와 Gemini 3.1 Pro(0.550)는 한참 뒤야.

더 놀라운 수치는 공개되지 않은(uncontaminated) RNA 시퀀스 평가에서 나왔어. OpenAI는 서열-기능 예측 태스크에서 GPT-Rosalind가 인간 전문가 상위 5%(95th percentile) 수준의 답변을 냈고, 서열 생성 태스크에서는 84th percentile에 도달했다고 밝혔어.

OpenAI가 어제(4월 16일) 공개한 이 모델, 이름은 GPT-Rosalind. 20세기 DNA 이중나선 구조를 X선 결정학으로 찍어낸 영국 화학자 Rosalind Franklin에서 따왔고, 공개 대상은 일반 사용자도 아니고 ChatGPT Enterprise도 아냐. 딱 9개 기관만 초대 받은 research preview야.

이게 뭔지 — 한 문장 정의 + 차별점 3개

한 문장 정의: "생명과학 연구 과정의 증거 종합·가설 생성·실험 계획 단계를 압축하기 위해 생화학·단백질 공학·유전체학 도메인으로 튜닝된 OpenAI의 첫 프런티어 수직 특화 모델."

차별점은 세 가지야.

첫째, 범용이 아니야. GPT-5.4 계열과 달리 "기초 추론(fundamental reasoning)"을 생화학, 단백질 공학, 유전체학 세 도메인에 맞춰 최적화했어. 일반 LLM이 자주 환각을 일으키는 분자 수준 인과관계에서 흔들림이 덜해.

둘째, 도구 사용이 기본이야. PubMed 검색, AlphaFold 구조 예측, 분자 시뮬레이션 런너를 모델 오케스트레이션 루프에 꽂으면 GPT-Rosalind가 증거 수집 → 후보 모델링 → 결과 해석을 한 번의 호출로 돌려.

셋째, 트러스티드 액세스(trusted access) 프로그램으로만 열려 있어. 조직이 인간 건강 결과(health outcomes)를 개선하는 합법적 연구를 하고 있는지, 보안·거버넌스 체계가 제대로 갖춰져 있는지를 OpenAI가 직접 심사해. 돈을 내도 기준에 안 맞으면 접근 불가능해.

OpenAI GPT-Rosalind 공식 발표 배너 — 생명과학 추론 모델 출처: marktechpost.com · 공식 프레스 이미지 인용

핵심 스펙 — 경쟁 모델과 직접 비교

OpenAI는 파라미터 수를 공개하지 않았지만, 벤치마크는 여러 개를 풀었어. 정리하면 이래.

벤치마크 GPT-Rosalind GPT-5.4 GPT-5 Grok 4.2 Gemini 3.1 Pro
BixBench (bioinformatics) 0.751 0.732 0.728 0.698 0.550
LABBench2 승률 vs GPT-5.4 6/11 태스크 패밀리 우세
CloningQA 향상폭 최대 gain 기준선
RNA 서열 예측 (uncontaminated) 인간 전문가 95th pct 비공개
RNA 서열 생성 (uncontaminated) 인간 전문가 84th pct 비공개

LABBench2는 2026년에 나온 새 벤치마크로, 11개 생물학 연구 태스크 패밀리에 걸쳐 약 1,900개 과제를 포함해. GPT-Rosalind는 이 중 6개에서 GPT-5.4를 앞섰고, 가장 큰 격차는 유전자 클로닝 질문(CloningQA)에서 나왔어.

실제 과학자 워크플로우 평가에 가까운 "uncontaminated RNA" 실험은 데이터 누출을 막기 위해 공개되지 않은 서열로 평가한 거야. 쉽게 말하면 "인터넷에 없는 문제를 내도 전문가 급 답을 한다"는 입증이야.

기능 해부

핵심 기능 1 — 네 가지 연구 루프

OpenAI는 GPT-Rosalind가 겨냥하는 작업을 네 개로 명시했어.

  • 증거 종합(evidence synthesis) — 논문·데이터셋을 훑어서 어떤 가설이 이미 검증됐고 어떤 게 열려 있는지 맵을 만들어 줘
  • 가설 생성(hypothesis generation) — 현재까지의 결과를 바탕으로 다음 실험의 후보를 제안
  • 실험 계획(experimental planning) — 프로토콜 초안, 대조군 설계, 리스크 포인트 체크
  • 다단계 연구 태스크(multi-step research tasks) — 위 세 개를 이어서 한 번에 처리

OpenAI는 공식 블로그에서 "이 모델은 과학자를 대체하지 않는다(will not replace scientists)"고 강조했어. 대체 대신 "가장 시간이 많이 드는 분석적 단계의 압축"이 설계 목표야.

핵심 기능 2 — Codex Life Sciences 플러그인

GPT-Rosalind와 함께 공개된 두 번째 물건이 있어. Codex Life Sciences 플러그인(GitHub용)이야.

이건 생명과학 연구자들이 자기 코드베이스(예: 시뮬레이션 스크립트, 분석 파이프라인) 안에서 GPT-Rosalind를 직접 호출할 수 있게 해 주는 도구야. 쉽게 말하면 GitHub Copilot의 바이오 특화 버전이야. 연구 파이프라인 전체에서 모델을 꽂아 쓸 수 있게 한다는 전략이야.

Codex 연구 워크플로 - 평가 환경 시각화 출처: onhealthcare.tech · 뉴스 인용 fair use

가격 + 출시 — 접근 자체가 가격이야

항목 상세
가격 비공개 (엔터프라이즈 계약 기반)
출시일 2026년 4월 16일
접근 방식 Trusted Access Program 심사 기반 research preview
지역 미국 엔터프라이즈 고객 한정
일반 API 접근 불가
ChatGPT Enterprise 포함 여부 포함되지 않음 (별도 라인)
자격 조건 합법적 건강 개선 연구 + 보안·거버넌스 심사 통과

론치 파트너는 9곳으로 확인됐어: Amgen, Moderna, Allen Institute, Thermo Fisher Scientific, Oracle Health and Life Sciences, NVIDIA, Benchling, UCSF School of Pharmacy. OpenAI 공식 블로그에 나열된 명단이야.

누구를 위한 제품인지 — 페르소나 + 대체재

페르소나 가치 대체재
대형 제약사 R&D 가설 스크리닝 속도 Isomorphic Labs AlphaFold 3, Insilico Medicine
mRNA 플랫폼 기업 백신 후보 설계 자동화 자체 내부 모델 + DeepMind 파트너십
비영리 연구소 공공 데이터셋 정밀 분석 Hugging Face BioGPT, 학계 오픈 모델
실험실 장비·시약 업체 워크플로 AI 통합 Med-PaLM API, Claude for Life Sciences

파트너 명단이 말해주는 건 하나야. OpenAI는 연구의 프런트엔드(실험 계획·가설 생성)와 백엔드(장비·데이터) 양쪽을 동시에 잡으려고 해. Thermo Fisher는 과학자가 쓰는 "실험실 OS" 포지션이고, Benchling은 바이오 R&D 데이터 플랫폼이야. 여기에 Oracle Health와 NVIDIA가 붙으면 데이터 스토리지·컴퓨트·모델을 한 스택으로 번들할 수 있어.

경쟁사 반응 + 시장 포지션

지금 생명과학 AI 판은 Google이 먼저 깔아둔 상태야.

AlphaFold 3는 2024년에 단백질-리간드 상호작용까지 예측 가능하게 확장됐고, Isomorphic Labs(알파벳 자회사)는 2024–2025년에 Novartis·Eli Lilly와 약 $6억 규모 파트너십을 맺었어. DeepMind 계열에서 나온 Gemini for Biology, Med-Gemini 같은 의료 특화 모델도 이미 임상 파트너에게 공급 중이야.

그런 상황에서 OpenAI가 GPT-Rosalind를 공개한 시점은 공교롭지.

"범용 GPT 하나로 모든 버티컬을 덮는다"는 전략이 끝났어. OpenAI가 수직 특화 모델을 공식 제품 라인으로 여는 신호로 읽어야 해.

4월 16일 발표 직후 AI-bio 미들 플레이어 주가가 흔들렸어. Recursion, Schrödinger, Absci가 하루 종가 기준 일제히 하락. 투자자들이 바로 던진 질문은 이거야: "OpenAI가 직접 들어오면 우리 같은 중간 플레이어의 방어선이 뭔가?"

그래서 뭐가 달라지는데

제약사에게: 연구자 생산성의 병목이 "분석"에서 "검증"으로 이동해. 가설 생성과 증거 종합을 AI가 빠르게 돌려주면, 실험실 벤치에서 돌리는 검증 실험이 진짜 병목이 돼. 파이프라인을 1–2년 단축할 여지가 생기지만, 그 효과를 보려면 사내 실험 플랫폼도 AI가 자동으로 돌릴 수 있게 재설계해야 해.

바이오 스타트업에게: 포지션 재정비 시간이야. OpenAI가 "기초 추론" 레이어를 점유했으니, 스타트업이 의미 있으려면 특정 질병군(희귀 종양·퇴행성 뇌질환) 전문성이나, 실험 자동화 로봇처럼 물리 세계 연결 고리를 들고 가야 살아남아.

일반 개발자·사용자에게: 직접 쓸 일은 거의 없어. 하지만 "도메인 특화 GPT"가 제품 라인이 된다는 신호는 중요해. 법률·재무·재료과학 쪽에서도 12개월 안에 비슷한 모델이 나올 가능성이 높고, 그건 범용 GPT API 하나로 모든 업종을 커버하던 시대가 끝난다는 뜻이야.

참고 자료

관련 기사

무료 뉴스레터

AI 트렌드를 앞서가세요

매일 아침, 엄선된 AI 뉴스를 받아보세요. 스팸 없음. 언제든 구독 취소.

매일 30개+ 소스 분석 · 한국어/영어 이중 언어광고 없음 · 1-클릭 해지