애리조나 Glendale Community College 학위수여식 생중계에서, AI 어나운서가 일부 학생의 이름을 잘못 발음하고 또 일부는 통째로 건너뛰었다. 식은 최소 두 번 중단됐고, 학장 Tiffany Hernandez는 무대 위에서 “AI 호명 도구 때문”이라고 사과했다. 처음 그녀는 누락된 학생들에게 “다시 무대 위로 올라올 수는 없다”고 했지만, 영상이 퍼지고 비판이 거세지자 결국 사람 진행자가 이름을 읽어주는 do-over를 따로 마련했다. 4년 짜리 순간 하나가 “시스템 오류”로 정리될 뻔한 사건이다.
흥미로운 부분은 이 사고가 “AI가 한국어/외국어 이름을 어색하게 발음했다”는 옛날 클리셰가 아니라는 점이다. Tassel 같은 플랫폼은 정확한 발음을 가장 큰 셀링포인트로 내세운다. 학생이 직접 자기 이름을 녹음하고, AI는 성우 데이터로 학습된 보이스 모델로 미리 프리뷰까지 생성한다. 호명 텍스트와 졸업장 표기를 맞춰주는 검증도 있다. 그런데 무대 위에서 학생이 걷는 속도, 박수가 길어지는 타이밍, 사회자의 즉흥적인 멘트 같은 라이브 변수가 들어가자 큐가 어긋났고, 시스템은 의심 없이 다음 이름으로 넘어갔다.
같은 시장에 이미 다른 설계가 있다. StageClip의 NameCheck는 발음 데이터를 AI가 수집·정리해 사람 어나운서에게 “이 이름은 이렇게 부른다”고 미리 알려주는 도구다. 즉, 발음의 사전 작업은 자동화하고 마이크 앞은 사람을 남긴다. Arlington의 Washington-Liberty High School은 다음 달 졸업식에서 Tassel 사용 계획을 취소했다. 교사 노조 대표 June Prakash의 말이 이 사건의 본질을 잘 짚는다. “이름을 그 학생을 아는 사람이 불러줄 때 존중과 소속감이 담긴다. 그 책임을 외주화하면, 효율이 정체성보다 중요하다는 메시지를 무심코 보내게 된다.”
분업의 선을 다시 그릴 시점이다. AI가 가장 잘하는 자리는 리허설실이다 — 수천 명 분량의 발음 사전 구축, 표기 검증, 가족이 미리 들어볼 수 있는 프리뷰, 졸업장 인쇄본과 호명 텍스트의 정합성 검사. 반대로 라이브 무대의 마이크는 사람의 자리다. 박수가 길어졌을 때, 학생이 가족 쪽을 바라보며 잠시 멈춰 섰을 때, 사회자가 한 줄 농담을 끼워 넣었을 때 — 큐를 새로 조정하는 건 알고리즘이 아니라 그 자리에 서 있는 사람이다. 오늘 학장이 두 번 사과해야 했던 이유는 AI가 망가졌기 때문이 아니라, 망가졌을 때의 매뉴얼이 비어 있었기 때문이다. 라이브 자동화를 도입할 때 가장 먼저 합의해야 할 건 멋진 보이스 톤이 아니라, 실패 모드를 누가 어떻게 떠안을 것인가다.