OpenAI가 ChatGPT에 Trusted Contact라는 새 안전장치를 도입했다. 성인 사용자가 계정에 친구나 가족 같은 신뢰 연락처를 미리 지정해두면, 자해 가능성이 보이는 대화에서 ChatGPT가 사용자에게 그 사람에게 연락해보라고 권한다. 상황이 심각하다고 판단되면 OpenAI가 해당 연락처에 짧은 알림을 보낼 수도 있다.
이 기능의 핵심은 AI 대화가 더 이상 브라우저 안의 문장 교환으로만 남지 않는다는 점이다. OpenAI는 자해 관련 신호를 자동으로 감지하고, 이를 인간 안전팀 검토로 넘기는 방식을 쓰고 있다고 설명한다. 회사는 이런 안전 알림을 1시간 안에 검토하려 한다고 밝혔다. 내부 검토 결과 심각한 위험으로 판단되면 이메일, 문자, 인앱 알림 중 하나로 trusted contact에게 확인을 요청한다.
알림 설계는 일부러 제한적이다. OpenAI는 대화의 자세한 내용을 연락처에 넘기지 않고, 사용자를 확인해보라는 짧은 메시지만 보낸다고 설명한다. 자해 관련 대화는 극도로 민감하기 때문이다. 너무 많은 정보를 공유하면 프라이버시 침해가 되고, 너무 적게 공유하면 실제 구조 신호로서 약해진다. Trusted Contact는 그 중간 지점을 찾으려는 시도다.
이 발표의 배경은 가볍지 않다. TechCrunch에 따르면 OpenAI는 챗봇과 대화한 뒤 사망한 사람들의 가족으로부터 여러 소송을 겪고 있다. 일부 가족은 ChatGPT가 자살을 부추기거나 계획을 도왔다고 주장했다. 기존에도 ChatGPT는 자해 주제가 나오면 전문 도움을 권하는 자동 안내를 제공했고, 지난해에는 청소년 계정에 대해 부모 알림 기능도 도입했다. 이번 기능은 그 보호 장치를 성인 사용자와 신뢰 관계 쪽으로 넓힌 것이다.
하지만 Trusted Contact가 곧 완성된 해법은 아니다. 이 기능은 선택 사항이다. 사용자가 직접 켜지 않으면 작동하지 않는다. 또한 사용자가 여러 ChatGPT 계정을 만들 수 있다는 점도 한계로 남는다. 부모 알림 기능과 마찬가지로, 제품 안에 안전장치가 존재한다는 사실과 실제 위험 순간에 그 장치가 켜져 있다는 사실은 다르다.
그래도 이 기능은 중요한 방향 전환을 보여준다. AI 안전은 더 이상 “위험한 답변을 하지 않게 만든다”는 문제에만 머물지 않는다. 위험 신호를 언제 감지할지, 인간 검토를 얼마나 빨리 붙일지, 어떤 정보를 제3자에게 공유할지, 그리고 사용자의 프라이버시를 어디까지 보호할지를 함께 설계해야 한다. Trusted Contact는 그 복잡한 경계가 이제 소비자 AI 제품의 기본 논의가 되고 있음을 보여준다.