AI 코딩 도구를 쓰다 보면 초반에는 모델 성능이 전부처럼 보인다. 더 긴 컨텍스트, 더 빠른 수정, 더 똑똑한 코드 리뷰가 눈에 먼저 들어온다. 그런데 실제 프로젝트에서 반복해서 굴리기 시작하면 질문이 바뀐다. 이 에이전트가 다음에도 같은 기준으로 움직일까. 이전 작업의 기억을 어디까지 믿어도 될까. 위험한 명령이나 잘못된 맥락은 누가 막을까.
affaan-m/everything-claude-code는 바로 그 층을 겨냥한 저장소다. 설명은 “The agent harness performance optimization system”이고, 대상도 Claude Code 하나에 닫혀 있지 않다. Claude Code, Codex, Opencode, Cursor and beyond를 함께 언급한다. 특정 도구의 사용 팁이 아니라, 여러 에이전트를 가로지르는 하네스와 작업 규율을 다루겠다는 선언에 가깝다.
눈에 띄는 키워드는 skills, instincts, memory, security, research-first development다. 여기서 skills는 반복 가능한 절차를 남기는 방식이고, memory는 다음 작업에 이어질 컨텍스트를 관리하는 장치다. instincts는 매번 새로 설명하지 않아도 되는 작업 습관에 가깝고, security는 그 모든 자동화가 과한 권한이나 잘못된 기억으로 번지지 않게 잡아주는 축이다. research-first development는 에이전트가 손부터 대기 전에 먼저 읽고 조사해야 한다는 태도를 전면에 둔다.
이 조합이 중요한 이유는 AI 개발 도구의 병목이 달라지고 있기 때문이다. 처음에는 “모델이 코드를 잘 고치나”가 핵심이었다. 이제는 “팀의 작업 방식 안에서 안전하게 반복될 수 있나”가 더 자주 문제 된다. 에이전트가 강력해질수록 기억, 권한, 루틴, 조사 순서 같은 운영 요소가 결과 품질에 직접 영향을 준다.
물론 하네스가 답을 모두 해결해주지는 않는다. 설정이 늘어나면 유지보수 비용도 커지고, 팀마다 좋은 memory의 범위와 위험한 자동화의 기준은 다르다. 그래도 이 저장소가 1,011 stars today를 기록한 배경은 분명해 보인다. 개발자들은 이제 AI 코딩을 단발성 생산성 도구가 아니라, 계속 관리해야 하는 작업 시스템으로 보기 시작했다.