점검표

점검표

개요

이 체크리스트는 현재 프로젝트가 AI 작업자를 하네스 안에 넣을 준비가 되어 있는지 빠르게 점검하기 위한 것이다.

답이 아니오인 항목이 많을수록, 문제는 모델 품질보다 AI 작업자 하네스 준비 부족일 가능성이 크다.

이 체크리스트는 transition의 진단이 아니라 harness/ai 적용 준비 상태를 빠르게 확인하기 위한 것이다.

각 항목의 상세는 capability boundaries, task contracts, acceptance gates, canonical examples, feedback loop, auto-correction loop, pre-commit hooks, machine-readable failures, trace and observability를 보면 된다. 용어 기준은 용어집, 실제 강제 지점은 실행 통제를 함께 보면 된다.

1. capability boundary ^{권한 경계}

write scope가 task와 무관한 파일까지 열려 있지 않은가
위험 명령과 안전 명령이 같은 층에 있지 않은가
destructive / external side effect가 별도 승인 경계를 가지는가
권한 경계가 문서가 아니라 실제 시스템에서 강제되는가

2. task contract ^{작업 계약}

수정 가능한 범위가 명시되어 있는가
금지 표면과 canonical path가 같이 보이는가
어떤 check를 통과해야 완료인지 분명한가
unrelated refactor를 막는 조건이 있는가

3. acceptance gates ^{완료 게이트}

완료 조건이 command나 rule로 표현되는가
gate가 task 범위와 직접 정렬되는가
flaky하거나 너무 큰 gate가 종료 조건을 흐리지 않는가
같은 gate를 loop 안에서 반복 확인할 수 있는가

4. canonical examples ^{정본 예시}

가장 자주 참고되는 예시가 실제 canonical path를 쓰는가
fixture, scaffold, starter가 bypass를 정본처럼 보여주지 않는가
deprecated / exception code가 더 가까운 reference surface에 남아 있지 않은가
rule 변경 시 canonical example도 같이 갱신되는가

5. feedback loop ^{피드백 루프}

가장 자주 깨지는 규칙이 가까운 local loop에서 잡히는가
failure가 범위를 좁혀주는가
warning만 있고 실제 교정은 뒤로 밀리지 않는가
canonical path가 같은 signal 안에서 제시되는가

6. auto-correction loop ^{자동 교정}

retry budget이 명시되어 있는가
매 반복마다 같은 narrow gate를 다시 돌리는가
task boundary 밖으로 범위가 퍼지지 않는가
같은 failure가 반복되면 멈추고 사람에게 넘기는가

7. pre-commit and local gates ^{로컬 게이트}

pre-commit 훅이 로컬에서 반복하기 충분히 싼가
changed scope와 너무 멀리 떨어진 검사를 하지 않는가
빠르고 결정적인 static rule이 앞쪽에 배치되어 있는가
CI에서만 잡히는 규칙 중 앞당길 수 있는 것이 있는가

8. machine-readable failures ^{기계 판독 실패}

stable rule id가 존재하는가
file / line / symbol 위치가 정확한가
허용되는 대안이 failure와 함께 보이는가
lint, pre-commit, runtime에서 같은 규칙 명칭을 공유하는가

9. trace and observability ^{추적과 관찰성}

같은 failure를 stable rule bucket으로 묶을 수 있는가
retry budget 소진과 stop reason을 볼 수 있는가
어떤 gate가 가장 자주 실패를 일으키는지 보이는가
관찰 결과가 rule, gate, failure format 개선으로 연결되는가

10. AI coding stress test ^{운영 점검}

AI가 가장 자주 건드리는 표면에 가까운 gate가 있는가
AI가 failure를 보고 local fix로 수렴할 수 있는가
vague한 failure 때문에 broad refactor가 유도되지 않는가
같은 우회가 반복될 때 운영 루프를 먼저 점검하는가

요약

좋은 AI 작업자 하네스는 다음을 만족한다.

capability boundary가 행동 반경을 먼저 줄이고
task contract가 작업 범위를 고정하고
acceptance gate가 종료 조건을 닫고
canonical example이 합법 경로를 더 가까운 reference로 만들고
가까운 feedback loop가 있으며
bounded auto-correction이 가능하고
local gate가 싸고 안정적이며
failure format이 machine-readable하고 해석 가능하고
trace가 반복 실패를 구조 개선으로 환류시킨다

이 항목들이 약하다면, AI는 규칙을 존중하기보다 가장 가까운 shortcut을 계속 학습하게 된다.

추적과 관찰성

개요

1. capability boundary 권한 경계

2. task contract 작업 계약

3. acceptance gates 완료 게이트

4. canonical examples 정본 예시

5. feedback loop 피드백 루프

6. auto-correction loop 자동 교정

7. pre-commit and local gates 로컬 게이트

8. machine-readable failures 기계 판독 실패

9. trace and observability 추적과 관찰성

10. AI coding stress test 운영 점검

요약