IT · · 최윤석

1. 문제 배경
중국 DeepSeek가 5월 31일 종료 예정이던 V4-Pro 모델 75% 할인 프로모션을 영구 가격으로 전환한다고 5월 23일 발표했다. Bloomberg가 보도하고 Engadget·Quartz·Yahoo Finance·Reuters(Investing)·Startup Fortune 등 다수가 같은 흐름을 동시에 정리했다. AI API 가격 전쟁이 다음 단계로 들어선 신호이다. 한국 개발자·기업이 무엇을 챙겨야 할지 정리했다.

*Photo by Martin Martz on Unsplash*
2. 핵심 가격 변화
| 항목 | 이전 가격 | 영구 인하 후 |
|---|---|---|
| 입력 토큰 (백만당) | $0.0145 | $0.003625 |
| 출력 토큰 (백만당) | $3.48 | $0.87 |
| 인하 폭 | 기존 가격의 25% (즉 75% 인하) | — |
| 적용 모델 | DeepSeek V4-Pro (플래그십) | 동일 |
| 시행 시점 | 2026년 5월 31일 15:59 UTC 이후 영구 | — |
출력 1백만 토큰당 $0.87은 GPT-5나 Gemini 3.5 Flash 동급 가격대의 약 1/3~1/4 수준이다.
3. 영구 인하의 배경
DeepSeek는 4월 V4 시리즈(Pro + Flash)를 출시하면서 "비용 효율적인 1M 컨텍스트 길이의 시대"를 표방했다. 5월에 진행된 75% 할인 프로모션은 단기 마케팅으로 출발했지만, 사용량·점유율 데이터를 본 뒤 영구 정책으로 전환했다. 다음 3가지가 결정 배경이다.
- 추론·학습 비용 하락 — 자체 인프라 효율 개선으로 단위 토큰당 원가가 빠르게 떨어졌다
- 글로벌 점유율 확보 목표 — 미국 모델 사용에 부담을 느끼는 신흥국·동남아·유럽 기업의 채택 가속
- Western AI rate limit anger — 미국 모델의 호출 제한·가격 변동에 피로감을 느낀 개발자를 공략
Android Headlines는 이 가격 정책을 "서구 AI 사용자의 rate limit 불만을 무기화한 전략"으로 정리했다.
4. AI 가격 전쟁이 진짜로 시작됐다
DeepSeek 단일 결정만이 아니다. 같은 흐름이 다른 회사에서도 관찰된다.
- Google Gemini 3.5 Flash — Antigravity·API에서 "절반 이하 비용"을 명시
- Anthropic Claude Haiku 4.5 — 빠른·저렴한 라인 강화
- OpenAI GPT-5 mini — 일반 워크플로우 옵션 확대
- Alibaba Qwen / Moonshot Kimi — 중국 진영의 동시 인하
같은 추세 안에서 출력 토큰 단가는 1년 사이 10배 이상 하락한 모델군이 다수 등장했다. 한 모델의 인하가 다른 모델의 인하를 부르는 자기 강화 사이클이다.

*Photo by Steve A Johnson on Unsplash*
5. 한국 개발자가 챙길 점
DeepSeek는 OpenAI 호환 API를 제공해 코드 수정이 적은 편이다. 그러나 다음을 확인해 두면 좋다.
- 데이터 정책 — 입력 데이터의 학습 활용·저장 정책 확인. 기업·금융·의료 데이터는 별도 평가
- 모델 출력 품질 — 한국어 자연어, 코드, 추론에 대한 자체 벤치마크 필요. GPT-5·Claude·Gemini와 같은 프롬프트로 테스트
- 법규·정책 위험 — 중국 회사 API를 기업 시스템에 직접 연결하기 전, 본사 보안 정책·국가별 규제(예: 일부 국방·공공 영역) 확인
- 장애·지연 대응 — 단일 공급사 의존 위험. 멀티 LLM 라우팅(OpenRouter, LiteLLM 등) 구조 고려
- 계약 안정성 — "영구 인하"는 정책이지 계약이 아님. 갑작스러운 가격·정책 변경 위험 대비
6. 같은 작업, 다른 비용 시나리오
월 1억 출력 토큰을 소비하는 가상의 워크플로우 기준으로 단순 비교하면 다음과 같다. (실제 비용은 입력·캐싱·기능별로 다르다.)
| 모델 | 1M 출력 토큰당 가격 | 1억 출력 토큰 비용 (출력만) |
|---|---|---|
| DeepSeek V4-Pro (신규) | $0.87 | $87 |
| Gemini 3.5 Flash (기준값 대략) | $0.6~$3 | $60~$300 |
| GPT-4o-mini (기준값 대략) | $0.6~$3 | $60~$300 |
| Claude Haiku 4.5 (기준값 대략) | $1~$5 | $100~$500 |
| GPT-5 (플래그십, 기준값 대략) | $10~$30 | $1,000~$3,000 |
플래그십 모델 대비 10배 이상의 비용 격차가 일반적이다. 작업 난이도와 정확도 요구치에 따라 모델을 단계적으로 분리하는 라우팅 전략이 표준화돼 가는 중이다.
7. 한계와 시그널
가격이 싸다고 무조건 좋은 건 아니다. 다음 한계를 같이 봐야 한다.
- 추론 품질의 균일성 — 특정 작업(수학·코딩·다국어)에서 다른 모델 대비 격차가 큰 영역이 있을 수 있음
- 컨텍스트 윈도우 vs 실효 정확도 — 1M 컨텍스트를 광고해도 후반부 토큰 활용도가 떨어지는 패턴이 흔함
- 장기 가용성 — 가격 인하가 단기 점유율 확보 목적이라면 영구 정책이라도 향후 조정 가능성
- 글로벌 규제 변수 — 미·중 기술 갈등 영향으로 일부 시장 접근이 제한될 수 있음
다음 시그널로는 ① OpenAI·Anthropic·Google의 후속 가격 정책 ② Qwen·Kimi 등 중국 진영의 동시 대응 ③ 엔터프라이즈 계약 패턴(연간 약정·SLA) 변화 ④ AI 학습용 GPU 가격 흐름을 보면 좋다.
8. 같이 볼 기술 글
기술 흐름을 이어서 볼 글은 IT 카테고리와 #AI, #AIAPI, #오픈소스 태그에서 이어서 볼 수 있다. Exa Labs $250M AI 검색 글은 이어서 보면 AI 인프라 가격·시장 흐름이 한 번에 잡힌다.
9. 참고 자료
출처: Engadget, Bloomberg, Yahoo Finance, Quartz
태그: #DeepSeek #AIAPI #AI가격 #오픈소스 #GenerativeAI