OpenSRE — AI로 프로덕션 장애를 자동 대응하는 오픈소스 SRE 에이전트
프로덕션 장애 발생 시 로그, 메트릭, 트레이스를 자동으로 수집하고 교차 분석해서 근본 원인을 찾아주는 AI SRE 에이전트 프레임워크입니다.
5단계 자동 워크플로 — 알림 수신부터 Slack/PagerDuty 리포트까지 자동 처리. 런북을 읽고 적용하는 추론 엔진, 증거 기반 근본 원인 분석이 핵심입니다.
60+ 도구 통합 — Grafana, Datadog, CloudWatch 같은 관측 플랫폼부터 Kubernetes, AWS, GCP, Azure 인프라, PagerDuty, Jira 인시던트 관리까지 연결됩니다.
멀티 LLM — Claude, GPT, Gemini, Ollama 등 자유 선택. 로그 데이터가 외부로 유출되지 않는 프라이버시 퍼스트 설계.
합성 인시던트 시뮬레이션으로 분석 정확도를 객관적으로 검증할 수 있습니다.
Python · Apache 2.0 · GitHub ★ 2,100+