Campbell Brown의 새 회사 Forum AI가 던지는 질문은 단순하다. AI가 우리에게 정보를 설명하기 시작했다면, 그 설명이 제대로 된 것인지는 누가 판단할 것인가. Brown은 TV 저널리스트였고, 이후 Facebook의 첫 뉴스 책임자였다. 그래서 플랫폼이 정보를 다루는 방식이 사회에 어떤 파장을 만드는지 가까이서 본 사람이다.
TechCrunch 인터뷰에서 그는 ChatGPT 공개 직후를 떠올린다. AI가 앞으로 정보가 흐르는 핵심 통로가 될 것 같았지만, 동시에 그 통로가 아직 충분히 좋지 않다고 느꼈다는 것이다. 특히 지정학, 정신건강, 금융, 채용처럼 정답이 명확하지 않고 맥락이 중요한 주제에서는 그럴듯한 문장이 오히려 더 위험할 수 있다.
Forum AI의 접근은 모델을 하나 더 만드는 것이 아니라, 모델의 답변을 평가하는 쪽에 가깝다. Niall Ferguson, Fareed Zakaria, Tony Blinken, Kevin McCarthy, Anne Neuberger 같은 인물을 참여시켜 고위험 주제의 벤치마크를 설계하고, AI judge가 인간 전문가 판단과 약 90% 수준으로 맞아떨어지도록 만드는 방식이다. 핵심은 단순 정답률이 아니라 빠진 관점, 누락된 맥락, 편향된 서술, 허수아비식 요약을 잡아내는 데 있다.
Brown이 지적하는 간극은 꽤 현실적이다. 빅테크 리더들은 AI가 세계를 바꾸고 일자리를 재편하고 암을 치료할 것이라고 말하지만, 평범한 사용자는 챗봇에 기본 질문을 던졌다가 여전히 틀린 답과 허술한 요약을 받는다. 기술 업계가 상상하는 AI의 미래와 소비자가 체감하는 현재 사이에는 아직 큰 거리가 있다.
여기서 로컬 우선 AI 작업대라는 관점이 중요해진다. 모든 판단을 모델 제공사의 기본 기준에 맡기는 대신, 조직이 자기 분야의 기준, 전문가 검토, 감사 가능한 로그, 실패 사례를 가까이에 두고 AI를 운영하는 방식이다. 특히 대출, 보험, 채용, 신용평가처럼 책임 문제가 붙는 영역에서는 “대체로 그럴듯함”이 아니라 “왜 이 답을 신뢰할 수 있는가”가 제품의 조건이 된다.
물론 전문가 기반 평가도 완벽한 해법은 아니다. 누구의 전문성을 기준으로 삼을지, 어떤 관점이 빠졌는지, 합의율이 높다는 것이 곧 진실을 뜻하는지에 대한 논쟁은 남는다. 하지만 AI가 정보의 첫 화면이 되는 상황에서, 답변을 생성하는 능력만으로는 충분하지 않다. 다음 경쟁력은 답변을 검증하고, 수정하고, 책임질 수 있는 구조를 만드는 데서 나올 가능성이 크다.