권한 경계

권한 경계

개요

가장 강한 하네스 중 일부는 AI가 무엇을 하게 만들지보다, 애초에 무엇을 할 수 없게 만들지에서 시작한다.

이 문서는 harness/ai 적용 레이어의 가장 바깥쪽 경계로서, AI 작업자가 애초에 어디까지 움직일 수 있는지를 먼저 닫는다.

capability boundary는 AI가 현재 작업에서 접근하고 실행할 수 있는 표면을 제한하는 경계다.

대표적으로 다음을 포함한다.

즉 task contract가 작업 내용을 닫는다면, capability boundary는 행동 가능 공간 자체를 먼저 닫는다.

AI는 비어 있는 권한을 대개 사용 가능한 경로로 해석한다.

그래서 capability boundary는 선택적 안전장치가 아니라, AI 작업자 하네스의 첫 층이다.

현재 task와 직접 관련된 파일이나 디렉터리만 수정 가능해야 한다. 전체 저장소 쓰기 권한은 대부분 과하다.

빠르고 국소적인 검증 명령과, 위험하거나 비용이 큰 명령을 같은 수준으로 두면 안 된다.

배포, 데이터 변경, 외부 write, destructive action은 반드시 별도 gate나 사람 승인을 거쳐야 한다.

도구가 많을수록 문제 해결력이 커질 수는 있다. 하지만 우회 표면도 같이 늘어난다. 필요한 도구만 열어두는 편이 안정적이다.

이 표면은 한 번 잘못 열리면 실수 비용이 훨씬 더 커진다.

둘은 비슷해 보이지만 다른 층이다.

예를 들어 src/feature-a/**만 쓸 수 있는 capability boundary가 있고, 그중에서도 feature-a/service.ts와 feature-a/test.ts만 만지는 task contract가 있을 수 있다.

즉 boundary가 바깥 경계고, contract가 그 안의 현재 작업 경계다.

이런 구조에서는 task contract가 좋아도 행동 반경이 너무 넓어 쉽게 무너진다.

사람은 넓은 권한을 갖고도 자제할 수 있다. AI는 넓은 권한을 더 자주 탐색한다.

그래서 AI 환경에서는 capability boundary가 사실상 prompt보다 먼저 작동하는 control이다.

좋은 capability boundary는 다음을 만족한다.

하네스의 AI 적용에서 capability boundary는 사후 교정 수단이 아니라, 애초에 잘못된 시도를 줄이는 첫 번째 울타리다.