중국 A주 데이터를 다루는 개발자에게 익숙한 풍경이 있다. 거래소 공식 피드는 실시간이지만 포맷이 불규칙하고, 증권사 API는 안정적이지만 접근 제한이 있으며, 재무제표 데이터는 크롤링이 아니면 구하기 어렵다. 뉴스 감성 데이터까지 붙이려면 또 다른 소스가 필요하다. 결과적으로 대부분의 프로젝트는 한두 개 소스에 의존하고, 나머지 연결은 사용자 몫으로 남는다.
simonlin1212/a-stock-data는 이 파편화를 아키텍처 수준에서 다룬다. 7개 데이터소스를 6레이어 구조 안으로 감추고, 외부에는 15개 엔드포인트만 노출한다. 핵심은 최상단에 AI Skill 인터페이스를 올린 것이다. LLM 에이전트가 어느 소스에서 데이터가 오는지 몰라도 엔드포인트를 호출하면 레이어가 라우팅을 담당한다. 퀀트 리서치 자동화나 AI 트레이딩 파이프라인에서 데이터 수집 레이어를 직접 구현하는 수고를 덜 수 있다는 의미다.
출시 일주일 만에 979스타를 받은 건 A주 데이터 인프라에 대한 수요가 얼마나 누적되어 있었는지를 보여준다. 중국 금융 데이터 생태계는 영어권 오픈소스 도구가 거의 커버하지 않는 영역이다. 이 프로젝트가 그 틈새를 정확히 짚었다.
단, 7개 소스를 동시에 추상화하는 설계는 유지보수 부담을 낮게 유지하기 어렵다. 소스 하나가 API 포맷을 변경하거나 접근 정책을 바꾸면 레이어 전체에 파급 효과가 생긴다. 아직 일주일된 프로젝트인 만큼, 6레이어 추상화의 내구성은 앞으로 커뮤니티가 얼마나 빠르게 이 부분을 강화하느냐에 달려 있다. 아키텍처 방향성은 분명하지만, 프로덕션 적용 전에 각 소스의 장애 처리 방식을 직접 확인해 볼 필요가 있다.