AI·업무운영 · 코딩 에이전트
AI 코딩 에이전트가 자주 망가지는 이유
Karpathy Guidelines로 줄이는 4가지 실수
AI 코딩 도구는 빠르다. 하지만 빠르다는 이유만으로 그대로 믿기에는 위험하다. 요구사항을 추측하고, 간단한 코드를 과하게 설계하고, 주변 코드까지 건드리고, 검증 없이 끝냈다고 말하는 일이 반복되기 때문이다. Karpathy Guidelines는 이 문제를 줄이기 위한 짧은 행동 규칙이다.
Karpathy Guidelines는 새로운 개발 방법론이라기보다 AI 코딩 에이전트의 나쁜 습관을 줄이는 운영 규칙에 가깝다. 핵심은 네 가지다. 먼저 가정을 드러내고, 단순하게 만들고, 필요한 부분만 고치고, 성공 기준을 검증하라는 것이다.
1. 왜 AI 코딩 에이전트에 별도 규칙이 필요한가
최근 AI 코딩 도구는 간단한 함수 작성, 버그 수정, 문서화, 테스트 작성에서 상당히 유용하다. 문제는 작업이 조금만 복잡해질 때 나타난다. 모델은 요구사항이 애매해도 질문하지 않고 한 방향을 골라 진행한다. 사용자가 원하지 않은 기능까지 추가하거나, 지금 필요 없는 확장 구조를 만들기도 한다.
실무에서 더 큰 문제는 변경 범위다. 버그 하나를 고치라고 했는데 주변 파일을 리팩토링하고, 기존 주석을 바꾸고, 사용자가 요청하지 않은 스타일 정리를 해버리면 검토 비용이 커진다. 코딩 에이전트는 작업 속도를 높이기 위해 쓰는 도구인데, 결과적으로 사람이 다시 뒤집어엎어야 한다면 생산성은 오히려 떨어진다.
2. Karpathy Guidelines의 핵심 4원칙
Think Before Coding
구현 전에 가정, 모호함, 선택지를 먼저 드러낸다. 여러 해석이 가능하면 조용히 하나를 고르지 않는다.
Simplicity First
요청받은 문제를 해결하는 최소 코드가 우선이다. 미래 확장성이라는 이유로 지금 필요 없는 구조를 만들지 않는다.
Surgical Changes
고쳐야 하는 부분만 고친다. 주변 코드, 주석, 포맷을 “좋아 보이게” 바꾸지 않는다.
Goal-Driven Execution
작업을 성공 기준과 검증 기준으로 바꾼다. 버그 수정은 재현 테스트와 통과 확인까지 포함한다.
3. 실제로 무엇이 달라지는가
| 상황 | 나쁜 AI 코딩 패턴 | 좋은 운영 방식 |
|---|---|---|
| “검색을 빠르게 해줘” | 캐시, 인덱스, 비동기 구조를 한꺼번에 붙임 | 응답시간·동시처리·체감속도 중 무엇이 목표인지 먼저 확인 |
| “할인 계산 함수 추가” | 전략 패턴, 설정 객체, 추상 클래스를 생성 | 현재 요구에 맞는 단순 함수부터 작성 |
| “이 버그 고쳐줘” | 관련 없는 파일까지 포맷팅·리팩토링 | 버그 재현 테스트를 만들고 해당 범위만 수정 |
| “리팩토링해줘” | 동작 보장 없이 구조를 크게 바꿈 | 수정 전후 테스트 통과를 성공 기준으로 둠 |
좋은 AI 코딩 결과물은 멋진 구조가 아니라 검토 가능한 작은 변경이다. 변경 이유가 명확하고, 테스트나 실행 결과로 확인 가능해야 한다.
4. OpenClaw에서는 Skill로 두는 편이 맞다
이 저장소에는 Agent Skills 형식의 skills/karpathy-guidelines/SKILL.md가 포함되어 있다. OpenClaw에서는 이 파일을 워크스페이스의 skills/karpathy-guidelines/ 아래에 두면 된다. 전역 지침에 길게 붙이는 것보다, 코딩·리팩토링·리뷰 작업에서만 발동하도록 두는 편이 효율적이다.
workspace/
└── skills/
└── karpathy-guidelines/
└── SKILL.md
| 적용 방식 | 장점 | 주의점 |
|---|---|---|
| OpenClaw Skill | 필요한 작업에서만 읽어 토큰 부담이 작다 | 스킬 설명이 명확해야 적절히 발동한다 |
| Cursor Rule | 프로젝트 전체에서 일관 적용된다 | alwaysApply 설정은 단순 작업까지 무겁게 만들 수 있다 |
| CLAUDE.md | 도구 독립적으로 붙이기 쉽다 | 프로젝트별 지침과 충돌할 수 있다 |
5. AI에게 일을 시킬 때는 “작업”보다 “성공 기준”을 줘야 한다
Karpathy Guidelines의 핵심은 AI에게 모든 판단을 맡기지 않는 것이다. “이거 고쳐줘”보다 “이 조건을 만족하면 성공”이라고 말하는 편이 더 안전하다.
목표: 로그인 실패 시 오류 메시지가 정확히 표시되게 수정한다.
성공 기준:
1. 잘못된 비밀번호 입력 테스트가 현재 실패를 재현한다.
2. 수정 후 해당 테스트가 통과한다.
3. 정상 로그인 테스트도 계속 통과한다.
4. 로그인 모듈 외 파일은 수정하지 않는다.
이렇게 요청하면 AI가 인증 구조를 새로 만들거나, UI 전체를 바꾸거나, 관련 없는 파일을 건드릴 가능성이 줄어든다. AI에게 자율성을 주되, 검증 가능한 울타리를 함께 주는 방식이다.
6. 한계도 있다
이 지침은 AI를 더 신중하게 만든다. 그래서 아주 단순한 오탈자 수정이나 한 줄 변경에는 과할 수 있다. 모든 작업에 긴 계획과 테스트를 요구하면 속도가 떨어진다. 중요한 것은 작업 크기에 맞춰 적용 강도를 조절하는 것이다.
이 지침은 코드 리뷰나 테스트를 대체하지 않는다. 역할은 AI가 만든 변경을 더 작고, 단순하고, 검증 가능한 형태로 만드는 것이다.
7. 결론 — AI 코딩의 핵심은 모델보다 운영 규칙이다
AI 코딩 도구를 쓰다 보면 모델 성능에만 관심이 가기 쉽다. 하지만 실무에서는 모델 이름보다 더 중요한 것이 있다. 어떤 범위까지 고치게 할 것인지, 모호할 때 질문하게 할 것인지, 성공 기준을 어떻게 확인할 것인지다.
한 줄 판단
Karpathy Guidelines는 AI 코딩 에이전트의 과잉 행동을 줄이는 안전장치다. 코딩 자동화를 실무에 붙일수록, 이런 작고 명확한 행동 규칙이 더 중요해진다.
출처 및 확인 기준
- forrestchang/andrej-karpathy-skills GitHub Repository: https://github.com/forrestchang/andrej-karpathy-skills
- Andrej Karpathy의 LLM 코딩 에이전트 관련 코멘트: https://x.com/karpathy/status/2015883857489522876
- AgentSkills Specification: https://agentskills.io
- OpenClaw Skills documentation: 로컬 OpenClaw 문서 기준 검토
저장소의 원문 라이선스는 MIT로 표시되어 있으며, 실제 프로젝트 적용 시 기존 프로젝트 지침과 충돌 여부를 확인해야 한다.