데일리이슈

DeepSeek V4-Pro가 75% 영구 인하: AI API 가격 전쟁의 진입점

DeepSeek V4-Pro가 75% 영구 인하: AI API 가격 전쟁의 진입점 관련 내용을 제품 변화, 보안·비용·도입 조건, 한국 독자 확인 기준과 한계 중심으로 정리했다. 발표 문구와 실제 적용 범위를 나눠 봤다. 본문에서는 공식 출처와 반대 관점도 함께 다뤘다.

IT · · 최윤석

DeepSeek V4-Pro가 75% 영구 인하: AI API 가격 전쟁의 진입점

1. 문제 배경

중국 DeepSeek가 5월 31일 종료 예정이던 V4-Pro 모델 75% 할인 프로모션을 영구 가격으로 전환한다고 5월 23일 발표했다. Bloomberg가 보도하고 Engadget·Quartz·Yahoo Finance·Reuters(Investing)·Startup Fortune 등 다수가 같은 흐름을 동시에 정리했다. AI API 가격 전쟁이 다음 단계로 들어선 신호이다. 한국 개발자·기업이 무엇을 챙겨야 할지 정리했다.

DeepSeek V4-Pro가 75% 영구 인하: AI API 가격 전쟁의 진입점 관련 이미지

*Photo by Martin Martz on Unsplash*

2. 핵심 가격 변화

항목이전 가격영구 인하 후
입력 토큰 (백만당)$0.0145$0.003625
출력 토큰 (백만당)$3.48$0.87
인하 폭기존 가격의 25% (즉 75% 인하)
적용 모델DeepSeek V4-Pro (플래그십)동일
시행 시점2026년 5월 31일 15:59 UTC 이후 영구

출력 1백만 토큰당 $0.87은 GPT-5나 Gemini 3.5 Flash 동급 가격대의 약 1/3~1/4 수준이다.

3. 영구 인하의 배경

DeepSeek는 4월 V4 시리즈(Pro + Flash)를 출시하면서 "비용 효율적인 1M 컨텍스트 길이의 시대"를 표방했다. 5월에 진행된 75% 할인 프로모션은 단기 마케팅으로 출발했지만, 사용량·점유율 데이터를 본 뒤 영구 정책으로 전환했다. 다음 3가지가 결정 배경이다.

  1. 추론·학습 비용 하락 — 자체 인프라 효율 개선으로 단위 토큰당 원가가 빠르게 떨어졌다
  2. 글로벌 점유율 확보 목표 — 미국 모델 사용에 부담을 느끼는 신흥국·동남아·유럽 기업의 채택 가속
  3. Western AI rate limit anger — 미국 모델의 호출 제한·가격 변동에 피로감을 느낀 개발자를 공략

Android Headlines는 이 가격 정책을 "서구 AI 사용자의 rate limit 불만을 무기화한 전략"으로 정리했다.

4. AI 가격 전쟁이 진짜로 시작됐다

DeepSeek 단일 결정만이 아니다. 같은 흐름이 다른 회사에서도 관찰된다.

  1. Google Gemini 3.5 Flash — Antigravity·API에서 "절반 이하 비용"을 명시
  2. Anthropic Claude Haiku 4.5 — 빠른·저렴한 라인 강화
  3. OpenAI GPT-5 mini — 일반 워크플로우 옵션 확대
  4. Alibaba Qwen / Moonshot Kimi — 중국 진영의 동시 인하

같은 추세 안에서 출력 토큰 단가는 1년 사이 10배 이상 하락한 모델군이 다수 등장했다. 한 모델의 인하가 다른 모델의 인하를 부르는 자기 강화 사이클이다.

DeepSeek V4-Pro가 75% 영구 인하: AI API 가격 전쟁의 진입점 관련 이미지 2

*Photo by Steve A Johnson on Unsplash*

5. 한국 개발자가 챙길 점

DeepSeek는 OpenAI 호환 API를 제공해 코드 수정이 적은 편이다. 그러나 다음을 확인해 두면 좋다.

  1. 데이터 정책 — 입력 데이터의 학습 활용·저장 정책 확인. 기업·금융·의료 데이터는 별도 평가
  2. 모델 출력 품질 — 한국어 자연어, 코드, 추론에 대한 자체 벤치마크 필요. GPT-5·Claude·Gemini와 같은 프롬프트로 테스트
  3. 법규·정책 위험 — 중국 회사 API를 기업 시스템에 직접 연결하기 전, 본사 보안 정책·국가별 규제(예: 일부 국방·공공 영역) 확인
  4. 장애·지연 대응 — 단일 공급사 의존 위험. 멀티 LLM 라우팅(OpenRouter, LiteLLM 등) 구조 고려
  5. 계약 안정성 — "영구 인하"는 정책이지 계약이 아님. 갑작스러운 가격·정책 변경 위험 대비

6. 같은 작업, 다른 비용 시나리오

월 1억 출력 토큰을 소비하는 가상의 워크플로우 기준으로 단순 비교하면 다음과 같다. (실제 비용은 입력·캐싱·기능별로 다르다.)

모델1M 출력 토큰당 가격1억 출력 토큰 비용 (출력만)
DeepSeek V4-Pro (신규)$0.87$87
Gemini 3.5 Flash (기준값 대략)$0.6~$3$60~$300
GPT-4o-mini (기준값 대략)$0.6~$3$60~$300
Claude Haiku 4.5 (기준값 대략)$1~$5$100~$500
GPT-5 (플래그십, 기준값 대략)$10~$30$1,000~$3,000

플래그십 모델 대비 10배 이상의 비용 격차가 일반적이다. 작업 난이도와 정확도 요구치에 따라 모델을 단계적으로 분리하는 라우팅 전략이 표준화돼 가는 중이다.

7. 한계와 시그널

가격이 싸다고 무조건 좋은 건 아니다. 다음 한계를 같이 봐야 한다.

  1. 추론 품질의 균일성 — 특정 작업(수학·코딩·다국어)에서 다른 모델 대비 격차가 큰 영역이 있을 수 있음
  2. 컨텍스트 윈도우 vs 실효 정확도 — 1M 컨텍스트를 광고해도 후반부 토큰 활용도가 떨어지는 패턴이 흔함
  3. 장기 가용성 — 가격 인하가 단기 점유율 확보 목적이라면 영구 정책이라도 향후 조정 가능성
  4. 글로벌 규제 변수 — 미·중 기술 갈등 영향으로 일부 시장 접근이 제한될 수 있음

다음 시그널로는 ① OpenAI·Anthropic·Google의 후속 가격 정책 ② Qwen·Kimi 등 중국 진영의 동시 대응 ③ 엔터프라이즈 계약 패턴(연간 약정·SLA) 변화 ④ AI 학습용 GPU 가격 흐름을 보면 좋다.

8. 같이 볼 기술 글

기술 흐름을 이어서 볼 글은 IT 카테고리#AI, #AIAPI, #오픈소스 태그에서 이어서 볼 수 있다. Exa Labs $250M AI 검색 글은 이어서 보면 AI 인프라 가격·시장 흐름이 한 번에 잡힌다.


9. 참고 자료

출처: Engadget, Bloomberg, Yahoo Finance, Quartz

태그: #DeepSeek #AIAPI #AI가격 #오픈소스 #GenerativeAI