GPT-5.5 Instant 출시: 의학·법률·금융 환각 52% 감소

5월 5일, OpenAI가 ChatGPT의 기본 모델을 GPT-5.5 Instant로 교체했다. 가장 큰 변화는 민감 영역(의학·법률·금융)에서 환각이 52.5% 감소했다는 점이다. 속도는 5.3 Instant 수준 유지.

핵심 메시지는 "정확도 ↑ + 속도 그대로"이다.

"환각률 감소가 마케팅 숫자가 아니라 평가 벤치마크에 기반한 측정이라는 점이 중요하다. 의학·법률·금융처럼 신뢰성이 핵심인 영역에서 의미가 크다."
— SiliconANGLE 요약

OpenAI가 강조한 영역은 세 가지이다.

환각이 줄었다고 해서 전문가 자문을 대체하는 건 아니다. 다만 검색 보조·요약·1차 자료 정리 용도로는 신뢰도가 한 단계 올라간 것이다.

GPT-5.5의 또 다른 특징은 복잡한 다단계 작업을 끝까지 끌고 가는 능력이다.

"메시지 1번에 작업 1개" 시대에서 "한 번에 던지면 알아서 단계 나눠 처리"하는 방향으로 가는 것이다. 에이전트 사용성이 핵심이다.

"ChatGPT가 과거 대화·업로드 파일·연동된 Gmail까지 참조해서 응답한다. Plus·Pro부터 시작해 Free·Business까지 단계적으로 확대 중이다."
— OpenAI 공식 요약

개인화 강화의 진짜 의미는 재사용 가능한 컨텍스트이다. 매번 같은 정보를 다시 설명하지 않아도 된다.

*Photo by Nik on Unsplash*

같은 시기 다른 모델 발표가 함께 일어났다.

환각률을 정면에 내세운 건 OpenAI이다. 속도는 Gemini, 코딩 + 장기 작업은 Claude. 1년 전엔 한 모델로 다 해결하던 시대였는데, 이제 작업별로 모델을 골라쓰는 시대이다.

새 모델이 실제로 좋아졌는지는 홍보 문구보다 내 업무에서 확인하는 게 빠르다. 기존에 실패했던 프롬프트 3~5개를 다시 넣어보고, 답변의 근거·누락·오류 수정 능력을 비교해본다.

작업 도구 선택에서 "GPT가 약했던 영역(정확도)"의 격차가 좁혀진 게 가장 큰 변화이다. 다만 의료·법률·금융은 여전히 전문가 자문이 우선이라는 점만 기억해야 한다.

기술 흐름을 이어서 볼 글은 IT 카테고리와 #AI, #ChatGPT 태그에서 이어서 볼 수 있다. Google I/O 2026 Gemini 3.5 정리 글도 같이 읽을 만하다.