프롬프트에서 하네스까지 - AI 에이전틱 패턴 4년의 기록

핵심 요약

이 글의 중심 주장은 AI 개발의 엄밀함이 사라진 것이 아니라, 위치를 옮겼다는 것이다. 2022년부터 2026년까지 에이전틱 AI 개발의 관심사는 Prompt Engineering에서 Context Engineering으로, 다시 Harness Engineering으로 이동했다.

각 시대의 질문은 다르다.

Prompt Engineering: 모델에게 어떤 말을 해야 하나?
Context Engineering: 모델에게 어떤 정보를 넣어야 하나?
Harness Engineering: 모델이 작동할 어떤 시스템을 만들어야 하나?

좋은 프롬프트는 여전히 중요하지만, 이제는 더 큰 시스템의 일부다. 에이전트가 실제로 일을 끝내려면 컨텍스트 구성, 도구 사용, 권한 제어, 테스트, 평가, 관찰성, 실패 복구 루프가 함께 설계되어야 한다.

시대별 흐름

Prompt Engineering, 2022-2024

초기 Copilot, ChatGPT, Chain-of-Thought, ReAct, Reflection, Tool Use 같은 패턴이 등장한 시기다. 이 시기에는 자연어 지시문 자체가 프로그램처럼 여겨졌다. 하지만 프롬프트만으로는 한계가 있었다. 모델이 필요한 파일, 도메인 지식, 기존 설계 의도를 보지 못하면 아무리 좋은 지시문도 실패한다.

Context Engineering, 2025

관심사는 프롬프트 문장 자체에서 컨텍스트 윈도우의 구성으로 옮겨갔다. Cursor, RAG, MCP, 메모리, 스킬, 서브에이전트, 컨텍스트 압축 같은 기술이 중요해졌다. 핵심은 모델이 답을 만들기 전에 무엇을 보게 할 것인가였다.

하지만 컨텍스트도 만능은 아니었다. 컨텍스트 오염, 긴 작업 루프, lost-in-the-middle 문제, 비용 증가, 보안 문제가 남았다.

Harness Engineering, 2026~

하네스는 모델을 둘러싼 실행 환경이다. 도구 호출, 파일 시스템 접근, 테스트 실행, 권한 경계, 로그, 평가자, 사람 승인 흐름까지 포함한다.

이 관점에서는 에이전트를 단순히 모델 하나로 보지 않는다.

Agent = Model + Harness

에이전트가 실수했을 때 모델만 탓하는 대신, 어떤 하네스가 실수를 막거나 회복하게 할 수 있었는지 묻는다.

실무 메모

Quartz나 Obsidian 기반 공개 지식 사이트에 이 글을 반영한다면, 단순 요약보다 아래 구조가 좋다.

Prompt Engineering은 과거 기술이 아니라 하위 모듈로 정리한다.
Context Engineering은 RAG, MCP, 메모리, 문서화 규칙과 연결한다.
Harness Engineering은 실제 Codex/Claude Code/GitHub Copilot Coding Agent 운영 방식과 연결한다.
공개 노트에는 “내 작업 환경에서 어떤 하네스를 만들 것인가?”라는 체크리스트를 붙이면 재사용성이 커진다.

내 작업에 적용할 질문

에이전트에게 항상 제공해야 하는 프로젝트 컨텍스트는 무엇인가?
공개 vault와 private vault 사이의 경계는 어떻게 유지할 것인가?
테스트, 린트, 빌드, preview를 에이전트 루프에 어떻게 넣을 것인가?
상태 변경이 있는 작업은 어디서 사람 승인을 받게 할 것인가?
좋은 결과를 어떻게 평가하고 기록할 것인가?

PARA Publish

탐색기