DeepSeek V4-Pro가 75% 영구 인하: AI API 가격 전쟁의 진입점

문제 배경

중국 DeepSeek가 5월 31일 종료 예정이던 V4-Pro 모델 75% 할인 프로모션을 영구 가격으로 전환한다고 5월 23일 발표했다. Bloomberg가 보도하고 Engadget·Quartz·Yahoo Finance·Reuters(Investing)·Startup Fortune 등 다수가 같은 흐름을 동시에 정리했다. AI API 가격 전쟁이 다음 단계로 들어선 신호이다. 한국 개발자·기업이 무엇을 챙겨야 할지 정리했다.

DeepSeek V4-Pro가 75% 영구 인하: AI API 가격 전쟁의 진입점 관련 이미지

*Photo by Martin Martz on Unsplash*

핵심 가격 변화

항목	이전 가격	영구 인하 후
입력 토큰 (백만당)	$0.0145	$0.003625
출력 토큰 (백만당)	$3.48	$0.87
인하 폭	기존 가격의 25% (즉 75% 인하)	—
적용 모델	DeepSeek V4-Pro (플래그십)	동일
시행 시점	2026년 5월 31일 15:59 UTC 이후 영구	—

출력 1백만 토큰당 $0.87은 GPT-5나 Gemini 3.5 Flash 동급 가격대의 약 1/3~1/4 수준이다.

영구 인하의 배경

DeepSeek는 4월 V4 시리즈(Pro + Flash)를 출시하면서 "비용 효율적인 1M 컨텍스트 길이의 시대"를 표방했다. 5월에 진행된 75% 할인 프로모션은 단기 마케팅으로 출발했지만, 사용량·점유율 데이터를 본 뒤 영구 정책으로 전환했다. 다음 3가지가 결정 배경이다.

추론·학습 비용 하락 — 자체 인프라 효율 개선으로 단위 토큰당 원가가 빠르게 떨어졌다
글로벌 점유율 확보 목표 — 미국 모델 사용에 부담을 느끼는 신흥국·동남아·유럽 기업의 채택 가속
Western AI rate limit anger — 미국 모델의 호출 제한·가격 변동에 피로감을 느낀 개발자를 공략

Android Headlines는 이 가격 정책을 "서구 AI 사용자의 rate limit 불만을 무기화한 전략"으로 정리했다.

AI 가격 전쟁이 진짜로 시작됐다

DeepSeek 단일 결정만이 아니다. 같은 흐름이 다른 회사에서도 관찰된다.

Google Gemini 3.5 Flash — Antigravity·API에서 "절반 이하 비용"을 명시
Anthropic Claude Haiku 4.5 — 빠른·저렴한 라인 강화
OpenAI GPT-5 mini — 일반 워크플로우 옵션 확대
Alibaba Qwen / Moonshot Kimi — 중국 진영의 동시 인하

같은 추세 안에서 출력 토큰 단가는 1년 사이 10배 이상 하락한 모델군이 다수 등장했다. 한 모델의 인하가 다른 모델의 인하를 부르는 자기 강화 사이클이다.

DeepSeek V4-Pro가 75% 영구 인하: AI API 가격 전쟁의 진입점 관련 이미지 2

*Photo by Steve A Johnson on Unsplash*

한국 개발자가 챙길 점

DeepSeek는 OpenAI 호환 API를 제공해 코드 수정이 적은 편이다. 그러나 다음을 확인해 두면 좋다.

데이터 정책 — 입력 데이터의 학습 활용·저장 정책 확인. 기업·금융·의료 데이터는 별도 평가
모델 출력 품질 — 한국어 자연어, 코드, 추론에 대한 자체 벤치마크 필요. GPT-5·Claude·Gemini와 같은 프롬프트로 테스트
법규·정책 위험 — 중국 회사 API를 기업 시스템에 직접 연결하기 전, 본사 보안 정책·국가별 규제(예: 일부 국방·공공 영역) 확인
장애·지연 대응 — 단일 공급사 의존 위험. 멀티 LLM 라우팅(OpenRouter, LiteLLM 등) 구조 고려
계약 안정성 — "영구 인하"는 정책이지 계약이 아님. 갑작스러운 가격·정책 변경 위험 대비

같은 작업, 다른 비용 시나리오

월 1억 출력 토큰을 소비하는 가상의 워크플로우 기준으로 단순 비교하면 다음과 같다. (실제 비용은 입력·캐싱·기능별로 다르다.)

모델	1M 출력 토큰당 가격	1억 출력 토큰 비용 (출력만)
DeepSeek V4-Pro (신규)	$0.87	$87
Gemini 3.5 Flash (기준값 대략)	$0.6~$3	$60~$300
GPT-4o-mini (기준값 대략)	$0.6~$3	$60~$300
Claude Haiku 4.5 (기준값 대략)	$1~$5	$100~$500
GPT-5 (플래그십, 기준값 대략)	$10~$30	$1,000~$3,000

플래그십 모델 대비 10배 이상의 비용 격차가 일반적이다. 작업 난이도와 정확도 요구치에 따라 모델을 단계적으로 분리하는 라우팅 전략이 표준화돼 가는 중이다.

한계와 시그널

가격이 싸다고 무조건 좋은 건 아니다. 다음 한계를 같이 봐야 한다.

추론 품질의 균일성 — 특정 작업(수학·코딩·다국어)에서 다른 모델 대비 격차가 큰 영역이 있을 수 있음
컨텍스트 윈도우 vs 실효 정확도 — 1M 컨텍스트를 광고해도 후반부 토큰 활용도가 떨어지는 패턴이 흔함
장기 가용성 — 가격 인하가 단기 점유율 확보 목적이라면 영구 정책이라도 향후 조정 가능성
글로벌 규제 변수 — 미·중 기술 갈등 영향으로 일부 시장 접근이 제한될 수 있음

다음 시그널로는 ① OpenAI·Anthropic·Google의 후속 가격 정책 ② Qwen·Kimi 등 중국 진영의 동시 대응 ③ 엔터프라이즈 계약 패턴(연간 약정·SLA) 변화 ④ AI 학습용 GPU 가격 흐름을 보면 좋다.

맥락이 닿는 글

기술 흐름을 이어서 볼 글은 IT 카테고리와 #AI, #AIAPI, #오픈소스 태그를 따라가며 더 볼 수 있다. Exa Labs $250M AI 검색 글은 이어서 보면 AI 인프라 가격·시장 흐름이 한 번에 잡힌다.

이 글이 본 자료

참고한 자료: Engadget, Bloomberg, Yahoo Finance, Quartz