AI들끼리 일하게 만들기
Antigravity·Claude Code·Codex·GPT를 나눠 쓰는 멀티 에이전트 워크플로
영상의 핵심은 “AI 도구를 많이 켜는 법”이 아니라 각 AI에게 역할을 나눠 주고, 서로의 산출물을 검증하게 만드는 운영 방식이다. Antigravity를 조율판으로 두고, Claude Code·Codex·GPT·Gemini를 리서치, 구현, 연결, 판단 역할로 분리하면 단일 챗봇보다 훨씬 큰 작업을 병렬로 진행할 수 있다.
먼저 결론
멀티 LLM 에이전트의 성패는 모델 성능보다 업무 분장에 달려 있다. 한 AI에게 “다 해줘”라고 시키는 순간 병목이 생긴다. 반대로 헤드 에이전트, 리서치 에이전트, 구현 에이전트, 검증 에이전트, 문서화 에이전트를 나누면 사람은 모든 로그를 따라가지 않고도 결과물과 증거만 보고 판단할 수 있다.
한 AI가 아니라 팀으로 쓴다
영상은 Antigravity, GPT, Claude Code, Codex, Gemini를 동시에 배치해 하나의 경제·시장 대시보드 작업을 진행한다.
역할을 분리한다
리서치, 데이터 수집, API 구성, 화면 제작, 최종 판단을 각기 다른 에이전트에게 맡긴다.
조율자가 없으면 산만해진다
에이전트가 많아질수록 지시문, 파일명, 산출물 규격, 검증 기준이 없으면 오히려 일이 꼬인다.
1. 영상에서 보여준 장면: 네 개의 AI가 동시에 일한다
영상에서는 Antigravity 안에서 Gemini 계열 에이전트가 조율판 역할을 하고, 외부의 GPT가 헤드 역할을 맡으며, 터미널 쪽 Claude Code와 Codex가 각각 데이터·API·대시보드 작업을 나눠 수행한다. 주제는 글로벌 경제 위기 지표와 증시, 환율, 뉴스 흐름을 정리해 대시보드화하는 작업이다.
중요한 장면은 여러 AI가 단순히 대화하는 것이 아니다. 한 에이전트가 다른 에이전트에게 업무를 나누고, 산출물을 받아 다음 에이전트가 이어받는 구조가 만들어진다는 점이다. 사람은 모든 작업을 직접 타이핑하지 않고, 중간 산출물과 최종 결과를 보며 지시를 조정한다.
2. 왜 Antigravity 같은 조율판이 필요한가
Google은 Antigravity를 단순 편집기가 아니라 여러 에이전트를 생성·조율·관찰하는 agentic development platform으로 설명한다. 특히 Manager Surface에서 여러 에이전트가 서로 다른 워크스페이스에서 비동기적으로 일하고, 결과물은 계획서·스크린샷·브라우저 기록 같은 확인 가능한 아티팩트로 남긴다는 점을 강조한다.
| 구분 | 일반 AI 코딩 | 멀티 에이전트 조율 | 실무 의미 |
|---|---|---|---|
| 작업 단위 | 한 채팅창에서 순차 진행 | 여러 에이전트가 병렬 진행 | 리서치와 구현을 동시에 돌릴 수 있다. |
| 사용자 역할 | 계속 질문하고 답을 복사 | 목표·제약·검증 기준을 정하는 감독자 | 사람은 타이핑보다 판단에 집중한다. |
| 검증 방식 | 대화 로그 확인 | 계획, 코드, 화면, 테스트 결과 확인 | 결과물을 보고 승인·수정 지시가 가능하다. |
| 위험 | 한 모델의 착각에 의존 | 서로 다른 모델 간 불일치 발생 | 역할과 산출물 규격이 필요하다. |
3. 추천 업무 분장: AI 팀을 다섯 역할로 나눈다
영상처럼 여러 도구를 동시에 쓸 때는 먼저 역할표를 만들어야 한다. 도구 이름보다 중요한 것은 책임 범위다.
| 역할 | 맡길 일 | 적합한 도구 예시 | 산출물 |
|---|---|---|---|
| 헤드 에이전트 | 목표 정의, 업무 분해, 우선순위, 최종 판단 | GPT, Gemini | 작업 지시서, 체크리스트, 최종 요약 |
| 리서치 에이전트 | 뉴스, 공식 문서, 데이터 출처 수집 | GPT, Gemini, 검색 도구 연결 | 출처 목록, 요약, 데이터 후보 |
| 구현 에이전트 | 코드 작성, API 구성, 파일 수정 | Claude Code, Codex | 코드 diff, 실행 명령, 테스트 결과 |
| 통합 에이전트 | 데이터와 UI 연결, 대시보드 구성 | Codex, Claude Code | 작동 화면, 라우팅, 연동 코드 |
| 검증 에이전트 | 오류, 출처, UI 깨짐, 논리 누락 확인 | 다른 모델 또는 별도 세션 | 리뷰 리포트, 수정 요청 |
4. 실제 예시: 글로벌 위기 대시보드 만들기
영상에서의 예시는 시장·경제 지표 대시보드다. 사람은 “글로벌 위기 신호를 볼 수 있는 대시보드를 만들라”고 목표를 주고, AI 팀은 이를 뉴스 수집, 지표 수집, API, 화면, 해석으로 쪼갠다.
위기 지표, 증시, 환율, 뉴스 요약을 한 화면에서 본다.
주요 지수, 환율, 변동성 지표, 국가별 증시 흐름을 모은다.
반복 조회 가능한 형태로 데이터 파이프라인을 만든다.
카드, 차트, 뉴스 요약, 위험 레벨을 화면에 배치한다.
출처, 숫자, 화면, 해석 문장을 별도 모델이 점검한다.
5. 멀티 에이전트 지시문은 이렇게 써야 한다
여러 AI에게 동시에 일을 시킬 때는 “잘 만들어줘”가 아니라 역할, 입력값, 산출물, 금지사항, 완료 기준을 적어야 한다. 특히 각 에이전트가 파일을 서로 덮어쓰지 않게 작업 폴더와 출력 파일명을 지정하는 것이 중요하다.
헤드 에이전트용 업무 분장 프롬프트
검증 에이전트용 리뷰 프롬프트
6. 도구별 강점: 한 모델에 모든 일을 맡기지 않는다
Codex는 코드 작성, 기존 코드베이스 이해, 리뷰, 디버깅, 반복 작업 자동화에 강점이 있다. Claude Code는 터미널·IDE·브라우저 환경에서 코드베이스를 읽고 파일 수정과 명령 실행까지 수행하는 에이전트형 개발 도구다. Antigravity는 여러 에이전트를 띄우고 작업을 관찰하는 조율판에 가깝다.
| 도구 | 잘 맡길 일 | 피해야 할 일 |
|---|---|---|
| Antigravity | 여러 에이전트 생성, 비동기 작업 관찰, 결과물 리뷰 | 모든 판단을 자동 승인하는 운영 |
| Claude Code | 코드베이스 분석, 파일 수정, 명령 실행, 버그 수정 | 출처 검증 없이 시장·정책 해석을 단정 |
| Codex | 기능 구현, 리팩터링, 테스트, 코드 리뷰 | 요구사항이 모호한 상태에서 대규모 변경 |
| GPT/Gemini | 업무 분장, 리서치 요약, 전략 판단, 문서화 | 검증 없이 숫자와 사실을 최종 확정 |
7. 실패하는 패턴: 에이전트가 많아질수록 관리 비용도 늘어난다
주의: 멀티 에이전트는 자동으로 생산성을 올려 주지 않는다. 작업 지시가 흐릿하면 여러 AI가 서로 다른 방향으로 달리고, 결과물은 더 복잡해진다.
실패 패턴
- 역할 없이 모든 AI에게 같은 질문을 던진다.
- 파일명과 출력 형식을 지정하지 않는다.
- 중간 산출물을 사람이 확인하지 않는다.
- 서로 다른 에이전트가 같은 파일을 동시에 수정한다.
- 검증 에이전트 없이 결과를 바로 사용한다.
예방 방법
- 작업 전 역할표를 만든다.
- 각 에이전트의 입력·출력 파일을 고정한다.
- 중간 승인 지점을 둔다.
- 작업 브랜치나 폴더를 분리한다.
- 최종 산출물은 별도 모델이 리뷰한다.
8. 업무별 적용 사례
| 업무 | 멀티 에이전트 분장 | 최종 산출물 |
|---|---|---|
| 투자 리서치 | 자료 수집, 재무표 정리, 리스크 리뷰, 글 작성 분리 | 기업 분석 리포트, 체크리스트, 출처표 |
| 블로그 발행 | 초벌 구조, 사실 확인, HTML 작성, 품질 점검 분리 | 검토용 HTML, 발행 파일, 검색 색인 |
| 업무 자동화 | 요구사항 분석, 스크립트 작성, 테스트, 문서화 분리 | 자동화 스크립트, 매뉴얼, 오류 대응표 |
| 대시보드 | 데이터 수집, API, UI, 차트, 검증 분리 | 웹 대시보드, 데이터 업데이트 루틴 |
9. 최종 운영 원칙: 사람은 조율자, AI는 작업자
영상이 보여주는 방향은 분명하다. 앞으로 AI 도구 활용은 “누가 답을 더 잘하나”보다 “어떻게 팀처럼 배치하나”가 중요해진다. 사람은 모든 작업을 직접 수행하는 대신 목표, 제약, 우선순위, 검증 기준을 정한다.
가장 현실적인 시작은 작게 나누는 것이다. 리서치 1개, 구현 1개, 검증 1개만 분리해도 효과가 크다. 멀티 에이전트의 목표는 AI를 많이 켜는 것이 아니라, 사람이 판단해야 할 지점만 남기는 것이다.
출처와 참고 링크
이 글은 공개 영상과 공식 문서를 바탕으로 작성한 AI 업무도구 활용 노트입니다. 도구 명칭, 제공 모델, 요금제, 기능 범위는 서비스 업데이트에 따라 달라질 수 있습니다. 실제 업무에 적용할 때는 사내 보안 정책, API 키 관리, 외부 전송 가능 데이터 범위를 먼저 확인해야 합니다.