맥스를 소비하는 사람과 운용하는 사람은 다르다
예전에는 AI 플랜을 거의 사용량 문제로만 봤다. 한 달 동안 많이 쓰면 좋은 플랜이고, 금방 막히면 아쉬운 플랜이라고 생각했다. 지금은 이 기준이 조금 바뀌었다.
적어도 코딩 에이전트를 계속 굴리는 입장에서는 플랜의 가치를 평소 얼마나 많이 쓰느냐보다 필요할 때 얼마나 크게 터뜨릴 수 있느냐로 보게 됐다. 내가 요즘 더 중요하게 보는 건 사용량 자체보다 버스트 용량에 가깝다.
많이 쓰는 사람과 운용하는 사람은 다르다
같은 상위 플랜을 써도 사용 방식은 꽤 다르다.
어떤 사람은 그냥 많이 쓴다. 결과가 마음에 안 들면 다시 묻고, 잘 안 되면 다른 말을 반복해서 넣는다. usage는 높지만 어디서 얼마나 쓰였는지는 잘 안 본다.
또 어떤 사람은 usage가 높더라도 그걸 생존용으로 쓴다. 평소에도 상한선 가까이 붙어 있고, 플랜의 여유가 없으면 바로 작업이 멈춘다. 이런 경우에는 많이 쓰는 건 맞지만, 운용하고 있다고 보기는 어렵다.
반대로 내가 더 의미 있다고 보는 쪽은 따로 있다. 평소 usage는 관리하면서, 정말 필요할 때만 병렬 작업, 긴 실행, 무거운 reasoning, 비교 실험을 한꺼번에 터뜨리는 방식이다. 이때 상위 플랜은 많이 써도 안 끊기는 상품이라기보다 필요할 때 크게 쓸 수 있는 capacity에 가깝다.
그래서 같은 맥스 플랜을 써도 어떤 사람은 소비하고, 어떤 사람은 운용한다는 생각을 하게 됐다.
왜 버스트 용량이 더 중요해졌나
실제로 무거운 작업은 평소에 계속 돌지 않는다. 대신 특정 시점에 몰린다.
- 긴 리팩터링을 한 번 맡길 때
- 서브에이전트를 병렬로 여러 개 붙일 때
LSP를 켠 상태와 끈 상태를 비교할 때- 하네스 전후 차이를 실험할 때
- 같은 문제를 다른 구조로 다시 검증할 때
이런 날은 usage가 갑자기 크게 튄다. 하지만 중요한 건 오늘 많이 썼다가 아니다. 그 시점에 필요한 실험을 겁내지 않고 끝까지 밀 수 있느냐다.
그래서 내 체감에서는 상위 플랜의 가치가 평시 사용량보다 버스트에 있다. 평소엔 조용하다가도, 필요한 순간에 병렬화와 장기 작업을 감당할 수 있어야 실제 운영이 가능해진다.
왜 20달러 팀 플랜으로는 운영 실험이 어렵다고 느꼈나
이 얘기는 20달러 팀 플랜이 쓸모없다는 뜻은 아니다. 가벼운 질의, 짧은 보조 작업, 맛보기 수준의 체험에는 충분할 수 있다.
문제는 운영 실험까지 가면 성격이 달라진다는 점이다. 장시간 작업을 여러 번 반복해 보고, 설정 전후를 비교하고, 병렬 운용을 해 보고, 무거운 태스크를 다시 검증하려면 여유가 필요하다. 이 여유가 없으면 실험 자체가 소극적으로 바뀐다.
결국 이런 환경에서는 실제로 더 좋은 구조가 무엇인지 검증하는 일보다 일단 돌아가는 선에서만 써보는 일에 머물기 쉽다. 한 번 세게 밀어 보고 결과를 비교해야 할 자리에서도, limits를 먼저 걱정하게 된다.
내가 느낀 한계도 정확히 이쪽이었다. 20달러 팀 플랜은 가벼운 활용에는 쓸 수 있어도, 하네스를 비교하고 운영 방식을 최적화하는 용도로는 금방 답답해진다. 검증 문화보다는 체험용에 더 가깝다고 느꼈다.
결국 내가 보는 건 사용량보다 실험 가능한 환경이다
이 얘기를 하고 나면 종종 결국 많이 쓸 수 있으면 좋은 거 아니냐로 다시 돌아간다. 물론 많이 쓸 수 있으면 좋다. 다만 내가 중요하게 보는 건 총량 자체가 아니다.
내가 보고 싶은 건 이런 것들이다.
- 필요할 때 병렬 작업을 겁내지 않고 돌릴 수 있는가
- 긴 작업을 중간에 끊지 않고 맡길 수 있는가
- 설정 전후 비교 실험을 여러 번 반복할 수 있는가
- 결과를 다시 검증할 여유가 남는가
이게 안 되면 usage 숫자가 조금 높아도 운영하는 느낌이 잘 안 난다. 반대로 이게 되면 평소 사용량이 아주 높지 않아도 플랜의 가치가 분명해진다.
그래서 요즘은 상위 플랜을 많이 쓰는 사람의 사치처럼 보기보다, 필요할 때 큰 실험을 가능하게 하는 인프라에 더 가깝게 본다. 적어도 운영자 관점에서는 그렇다.