msitarzewski/agency-agents가 하루 만에 별 828개를 끌어모았다. 표지 카피는 “손끝의 AI 에이전시 — 프론트엔드 마법사부터 레딧 커뮤니티 닌자, 엉뚱함을 주입하는 whimsy injector, 그것을 검증하는 reality checker까지”다. 흔한 에이전트 모음 같지만, 중요한 차이는 한 줄에 들어 있다. 각 에이전트가 ‘성격(personality), 프로세스(processes), 입증된 산출물(proven deliverables)’ 세트로 묶여 있다는 것. 즉, 이 레포는 ‘누가 있는가’가 아니라 ‘누가 무엇을 어떤 절차로 내놓는가’를 카드화했다.
이 포지셔닝은 멀티 에이전트 생태계에서 의외로 드물다. 대부분의 ‘awesome-agents’류는 역할 정의 — 잘하는 분야 한 줄 — 까지만 적고, 사용자가 워크플로를 다시 설계해야 한다. CrewAI나 AutoGen 예제들은 반대로 코드 인프라 학습 비용이 먼저 들고, 페르소나는 옅다. agency-agents는 그 사이에서 ‘카드 자체가 사용 설명서’가 되는 길을 택했다. 게다가 베이스가 Shell이라는 점은, 무거운 오케스트레이터 프레임워크 없이 계약(input/output)만 분명하면 파이프라인이 돈다는 주장에 가깝다.
눈여겨볼 건 라인업의 비대칭이다. frontend wizard처럼 직무 기반의 에이전트와, whimsy injector·reality checker처럼 기능 기반의 에이전트가 같은 보드에 섞여 있다. 이건 한 명을 호출해 답을 받는 사용법이 아니라, 직무 에이전트가 만든 결과물을 기능 에이전트가 깎아내는 ‘릴레이’를 전제한다. Reddit community ninja처럼 채널 특화 에이전트가 따로 존재한다는 점도, 최종 산출물을 곧장 ‘게시 가능한 포맷’까지 끌어내려는 의도를 보여준다.
물론 이런 구조에는 깨지기 쉬운 지점도 분명하다. 페르소나가 강할수록 톤은 일관되지만 사실관계 검증은 reality checker 한 명에게 몰린다. 그 카드가 약하면 라인업 전체가 ‘분위기 좋은 환각 팀’이 된다. 에이전트가 많아질수록 진짜 병목은 모델이 아니라 핸드오프다. 카드 안 deliverable 스펙이 모호하면 다음 에이전트는 입력에서부터 길을 잃는다. 채널 특화 카드는 플랫폼 정책 변경에 가장 먼저 낡는다는 약점도 있다.
그래서 이 레포를 평가하는 가장 정직한 방법은 한 명만 불러보지 않는 것이다. 의도적으로 충돌할 만한 둘 — 예컨대 whimsy injector와 reality checker — 을 릴레이로 묶고, 그 사이를 frontend wizard가 받게 해보자. 톤이 깨지는지, 산출물 포맷이 흐트러지는지, ‘재미있지만 틀린 답’을 누가 끊어주는지가 보일 것이다. agency-agents의 진짜 사용 설명서는 README가 아니라 그 충돌 지점에 있다.