생성 AI가 코드를 작성하는 것은 이제 놀라운 일이 아니다. 그러나 미국의 OpenAI가 보여주는 것은 그 다음 단계다. 핵심은 AI로 하여금 코드를 쓰게 하는 것이 아니다. AI가 안정적으로 작동할 수 있는 개발 환경을 설계하고, AI 자체가 학습하고 개선하는 것이다. OpenAI의 기술 스태프인 라이언 로포폴로(Ryan Lopopolo)는 이를 '하니스 엔지니어링'이라고 부른다.
'하니스 엔지니어링'과 유사한 개념으로는 '프롬프트 엔지니어링'과 '컨텍스트 엔지니어링'이 있다. 프롬프트 엔지니어링은 AI 모델에 대한 지시문을 효과적으로 작성하는 기술로, 2024년에 널리 보급되었다. 반면, 단일 지시로는 충분하지 않다는 인식에서 2025년에 등장한 것이 컨텍스트 엔지니어링이다. AI 모델이 한 번에 처리할 수 있는 데이터 양을 '컨텍스트 윈도우'라 하며, 그 양에는 한계가 있다. 따라서 AI가 참고하는 관련 문서, 대화 기록, 도구 정의, 검색 결과 등을 최적화하는 것이 컨텍스트 엔지니어링이다.
하니스 엔지니어링은 이 두 가지를 상위 개념으로 포함한다. 프롬프트 엔지니어링이 이메일의 본문을 다듬는 작업이라면, 컨텍스트 엔지니어링은 이메일에 필요한 첨부 파일을 선택하는 작업이다. 하니스 엔지니어링은 그 이상의 목표를 지향하며, 말하자면 사무실 전체를 설계하는 작업이다.
로포폴로는 OpenAI의 공식 블로그를 통해, 그들의 팀이 5개월 동안 손으로 작성한 코드 없이 내부용 베타 제품을 구축하고 운영했다고 밝혔다. 앱의 기본 동작뿐만 아니라, 테스트, 자동 빌드 설정, 문서, 시스템 모니터링, 내부 도구까지 모두 OpenAI의 코드 생성 AI인 'Codex'가 작성했다. 소규모 팀이 100만 행 규모의 코드를 생성하고 실제로 내부 사용자들이 일상적으로 사용하는 제품으로 운영한 실적을 보유하고 있다.
중요한 것은 AI가 뛰어나졌다는 것이 아니라, 엔지니어의 작업 중심이 변화했다는 점이다. 로포폴로는 팀의 주요 작업이 코드 작성에서 환경 설계, 의도 명확화, 개선 시스템 구축으로 이동했다고 설명한다. 초기 개발이 지연된 이유도 모델의 능력 부족보다는 자율적으로 작동하는 AI 에이전트가 작동할 도구와 구조가 부족했기 때문이라고 한다.
결국 AI 시대의 생산성은 모델의 성능뿐만 아니라, AI가 혼란 없이 작업할 수 있는 기반을 얼마나 잘 구축할 수 있는가에 달려 있다. 로포폴로는 이를 500명 규모의 조직을 이끄는 기술 책임자와 같은 감각이라고 표현했다. 개별 코드의 세부 사항에 인간이 간섭하지 않는다는 의미다.