Elastic의 Steve Mayzak가 MIT Tech Review Insights에 던진 한 문장이 이 글의 모든 것을 압축한다. "50년 된 은행이라면, 똑같은 한 가지 사안에 대해 60종류의 PDF를 갖고 있을 수 있다." 금융권에서 에이전틱 AI가 어려운 진짜 이유는 모델이 약해서가 아니라, 거래 실행 한 절차를 설명하는 방식이 너무 많아서, 비결정적인 LLM 위에서 결정적인 결과를 강제해야 하기 때문이다. Mayzak의 표현으로는 "incredibly tricky, but not impossible."
자율 에이전트가 조직에 들어오는 순간, 데이터 가용성과 품질이라는 가장 약한 고리가 시스템 전체의 품질이 된다. Gartner는 금융권 팀의 절반 이상이 이미 에이전틱 AI를 도입했거나 계획 중이라고 보지만, Forrester는 같은 산업의 57%가 이를 본격 활용할 내부 역량을 여전히 만들고 있다고 짚었다. 이 갭이 다음 2년의 승부처다. 자연어 비정형 데이터의 정제·인덱싱은 정형 데이터보다 훨씬 비싼 작업이고, 환각 허용도가 0에 가까운 도메인에서 이건 단순한 ETL 이슈가 아니라 거버넌스 이슈로 바뀐다.
글이 새로 정의하는 개념은 "authoritative context store"다. 트랜잭션, 고객 상호작용, 리스크 시그널, 정책 문서, 과거 컨텍스트를 한 곳에서 검색·정합·거버넌스 가능하게 만들고, 에이전트가 어떤 정보를 찾았고 왜 그것이 다음 스텝의 근거였는지까지 감사 가능하게 남겨야 한다는 것. 기존의 데이터 lineage가 "무엇이 들어가서 무엇이 나왔다"였다면, 에이전트 시대의 lineage는 모델이 도달한 논리 자체로 확장된다. 그래야 규제 당국, 고객, 내부 이해관계자의 신뢰가 유지된다.
적용 영역은 추상적이지 않다. 클라이언트 익스포저 모니터링에서는 거래·시장 시그널·외부 데이터를 상시 스캔해 위험을 실시간 에스컬레이션하고, 트레이드 모니터링에서는 서로 다른 포맷 간 불일치를 단계별로 해소하며, 규제 보고에서는 분산 시스템을 가로질러 리포트를 생성하면서 각 출력이 어떻게 만들어졌는지를 추적한다. Mayzak의 권고는 보수적이다. 70단계 프로세스를 한 번에 자동화하려 들지 말고 한 스텝씩 성공을 쌓아라. 모델 성능 곡선이 평탄해질수록 결국 차이를 만드는 건 컨텍스트 데이터 레이어이고, 검색 플랫폼이 RAG 인프라를 넘어 "context와 memory의 권위 있는 저장소"로 재정의되는 흐름이 그래서 의미심장하다.