Google DeepMind가 공개한 AI co-clinician 연구 이니셔티브는 의료 AI 담론의 무게중심을 조금 옮긴다. 지금까지 많은 의료 AI 논의는 모델이 의학 시험을 얼마나 잘 푸는지, 의사와 비교해 상담을 얼마나 자연스럽게 하는지에 집중했다. 이번 글은 그 다음 질문으로 간다. 의료 현장에서 AI가 실제 팀원처럼 일하려면 어떤 역할과 제한을 가져야 하는가.
DeepMind가 제시한 핵심 가설은 "triadic care"다. 환자와 의사만 있는 구조가 아니라, AI 에이전트가 환자의 진료 여정에 참여하되 의사의 임상 권한 아래에서 움직이는 3자 진료 모델이다. 이 표현은 중요하다. AI가 독립적으로 판단하는 의사가 아니라, 의사의 reach를 넓히는 보조 임상의로 배치되기 때문이다. 전 세계적으로 의료 인력 부족이 커지는 상황에서, AI가 의료진의 시간을 늘려줄 수 있다면 의미가 크다. 다만 그 시간은 책임을 흐리는 방식이 아니라 판단을 보강하는 방식으로 만들어져야 한다.
평가 방식도 눈에 띈다. DeepMind는 academic physicians와 함께 NOHARM 프레임워크를 조정해 AI co-clinician의 답변을 살폈다. 여기서 본 것은 두 가지다. 틀린 정보를 말하는 오류, 그리고 꼭 필요한 정보를 빠뜨리는 오류다. 98개의 현실적인 1차 진료 쿼리를 대상으로 한 객관 분석에서, 97개 케이스는 critical error가 0건이었다고 설명한다. 의사 블라인드 평가에서도 AI co-clinician 답변은 기존 evidence synthesis 도구보다 더 선호됐다.
약물 관련 질문도 별도로 다뤘다. DeepMind는 OpenFDA 기반 RxQA 질문을 통해 복잡한 medication knowledge와 reasoning을 평가했고, 특히 실제 진료처럼 열린 질문으로 제시했을 때 다른 frontier AI 시스템보다 강한 결과를 보였다고 밝혔다. 이 지점은 의료 AI에서 꽤 현실적이다. 진료실의 질문은 객관식 시험처럼 주어지지 않는다. 의사는 불완전하고 열린 질문을 안전한 근거와 실제 처방 맥락으로 좁혀야 한다.
그래서 이번 발표는 화려한 제품 출시보다 연구 방향 선언에 가깝다. AI co-clinician이 당장 병원의 의사를 대체한다는 이야기는 아니다. 오히려 반대에 가깝다. 의료 AI가 신뢰를 얻으려면 환자와 직접 만나는 능력만이 아니라, 의사가 검토할 수 있는 근거, 오류를 줄이는 평가 체계, 감독 가능한 워크플로를 함께 갖춰야 한다.
의료 AI의 다음 시험대는 더 그럴듯한 대답을 만드는 데서 끝나지 않는다. 환자에게는 더 빠른 접근성과 설명을 제공하고, 의료진에게는 근거를 정리해주며, 동시에 최종 판단의 위치를 흐리지 않아야 한다. AI co-clinician이라는 이름은 그래서 꽤 정확하다. 이 모델은 주연 교체가 아니라 팀 구성의 변화에 가깝다.