기계가 읽을 수 있는 실패

기계가 읽을 수 있는 실패

개요

AI에게 실패는 텍스트가 아니라 입력이다. 그래서 failure format이 애매하면, AI는 실패를 이해하기보다 주변 코드에서 다른 우회를 추측한다.

좋은 AI 작업자 하네스는 failure를 machine-readable하게 만든다.

이 문서는 harness/ai 적용 레이어에서 failure를 어떻게 수정 가능한 입력으로 바꿀지 본다.

사람은 약간 모호한 에러도 문맥과 경험으로 보완할 수 있다. 하지만 AI는 가장 가까운 문자열과 패턴에 강하게 반응한다.

그래서 failure format은 설명 문장보다 구조가 중요하다.

이 다섯 가지가 있으면 AI는 실패를 보고 다음 행동을 비교적 좁은 범위로 수렴시킬 수 있다.

같은 종류의 failure가 도구마다 다른 말로 나오면 안 된다.

이렇게 흩어지면 사람도 헷갈리고, AI는 더더욱 같은 규칙으로 연결하지 못한다.

가능하면 같은 rule id와 같은 canonical path를 공유하는 편이 좋다.

이런 형식은 failure를 signal이 아니라 잡음으로 만든다.

AI가 local gate를 통과하려면 실패가 곧바로 수정 입력으로 바뀌어야 한다.

즉 failure format은 feedback loop와 correction loop를 이어주는 접점이다.

좋은 machine-readable failure는 다음을 만족한다.

하네스의 AI 적용에서 failure format은 부가 정보가 아니라, loop를 제대로 닫기 위한 핵심 인터페이스다.