점검표

개요

이 체크리스트는 현재 프로젝트가 AI 작업자를 하네스 안에 넣을 준비가 되어 있는지 빠르게 점검하기 위한 것이다.

답이 아니오인 항목이 많을수록, 문제는 모델 품질보다 AI 작업자 하네스 준비 부족일 가능성이 크다.

이 체크리스트는 transition의 진단이 아니라 harness/ai 적용 준비 상태를 빠르게 확인하기 위한 것이다.

각 항목의 상세는 capability boundaries, task contracts, acceptance gates, canonical examples, feedback loop, auto-correction loop, pre-commit hooks, machine-readable failures, trace and observability를 보면 된다. 용어 기준은 용어집, 실제 강제 지점은 실행 통제를 함께 보면 된다.


1. capability boundary 권한 경계

  • write scope가 task와 무관한 파일까지 열려 있지 않은가
  • 위험 명령과 안전 명령이 같은 층에 있지 않은가
  • destructive / external side effect가 별도 승인 경계를 가지는가
  • 권한 경계가 문서가 아니라 실제 시스템에서 강제되는가

2. task contract 작업 계약

  • 수정 가능한 범위가 명시되어 있는가
  • 금지 표면과 canonical path가 같이 보이는가
  • 어떤 check를 통과해야 완료인지 분명한가
  • unrelated refactor를 막는 조건이 있는가

3. acceptance gates 완료 게이트

  • 완료 조건이 command나 rule로 표현되는가
  • gate가 task 범위와 직접 정렬되는가
  • flaky하거나 너무 큰 gate가 종료 조건을 흐리지 않는가
  • 같은 gate를 loop 안에서 반복 확인할 수 있는가

4. canonical examples 정본 예시

  • 가장 자주 참고되는 예시가 실제 canonical path를 쓰는가
  • fixture, scaffold, starter가 bypass를 정본처럼 보여주지 않는가
  • deprecated / exception code가 더 가까운 reference surface에 남아 있지 않은가
  • rule 변경 시 canonical example도 같이 갱신되는가

5. feedback loop 피드백 루프

  • 가장 자주 깨지는 규칙이 가까운 local loop에서 잡히는가
  • failure가 범위를 좁혀주는가
  • warning만 있고 실제 교정은 뒤로 밀리지 않는가
  • canonical path가 같은 signal 안에서 제시되는가

6. auto-correction loop 자동 교정

  • retry budget이 명시되어 있는가
  • 매 반복마다 같은 narrow gate를 다시 돌리는가
  • task boundary 밖으로 범위가 퍼지지 않는가
  • 같은 failure가 반복되면 멈추고 사람에게 넘기는가

7. pre-commit and local gates 로컬 게이트

  • pre-commit 훅이 로컬에서 반복하기 충분히 싼가
  • changed scope와 너무 멀리 떨어진 검사를 하지 않는가
  • 빠르고 결정적인 static rule이 앞쪽에 배치되어 있는가
  • CI에서만 잡히는 규칙 중 앞당길 수 있는 것이 있는가

8. machine-readable failures 기계 판독 실패

  • stable rule id가 존재하는가
  • file / line / symbol 위치가 정확한가
  • 허용되는 대안이 failure와 함께 보이는가
  • lint, pre-commit, runtime에서 같은 규칙 명칭을 공유하는가

9. trace and observability 추적과 관찰성

  • 같은 failure를 stable rule bucket으로 묶을 수 있는가
  • retry budget 소진과 stop reason을 볼 수 있는가
  • 어떤 gate가 가장 자주 실패를 일으키는지 보이는가
  • 관찰 결과가 rule, gate, failure format 개선으로 연결되는가

10. AI coding stress test 운영 점검

  • AI가 가장 자주 건드리는 표면에 가까운 gate가 있는가
  • AI가 failure를 보고 local fix로 수렴할 수 있는가
  • vague한 failure 때문에 broad refactor가 유도되지 않는가
  • 같은 우회가 반복될 때 운영 루프를 먼저 점검하는가

요약

좋은 AI 작업자 하네스는 다음을 만족한다.

  • capability boundary가 행동 반경을 먼저 줄이고
  • task contract가 작업 범위를 고정하고
  • acceptance gate가 종료 조건을 닫고
  • canonical example이 합법 경로를 더 가까운 reference로 만들고
  • 가까운 feedback loop가 있으며
  • bounded auto-correction이 가능하고
  • local gate가 싸고 안정적이며
  • failure format이 machine-readable하고 해석 가능하고
  • trace가 반복 실패를 구조 개선으로 환류시킨다

이 항목들이 약하다면, AI는 규칙을 존중하기보다 가장 가까운 shortcut을 계속 학습하게 된다.