오픈AI(OpenAI)가 최신 모델 GPT-4.1의 성능을 대폭 끌어올림과 동시에 API 가격을 대폭 인하하면서 생성형 인공지능(AI) 업계에 가격 전쟁이 본격화됐다. 이 모델은 최대 100만 토큰의 문맥 처리 능력을 갖춘 데다, 가격 구조도 단순화돼 개발자 커뮤니티의 관심이 집중되고 있다.
GPT-4.1은 소프트웨어 엔지니어링 벤치마크인 SWE-bench에서 54.6%의 정답률을 기록하며 기술적으로도 전작을 넘는 성과를 거뒀다. 실제 깃허브(GitHub) 풀 리퀘스트 기반 테스트에서도 코드 정확도와 관련도 면에서 GPT-4.1이 구글(GOOGL)의 제미니, 앤트로픽의 클로드 3.7 소넷 등을 앞섰다는 분석이 나왔다.
오픈AI는 이번 GPT-4.1에서 입력 기준 백만 토큰(Mtok)당 2달러, 출력은 8달러로 설정했으며, 소형 모델인 GPT-4.1 미니와 나노는 각각 0.4달러, 0.1달러로 책정돼 있다. 여기에 입력 데이터를 반복 사용할 경우 최대 75%까지 캐시 할인 혜택이 제공돼, 프롬프트 최적화가 중요한 반복형 업무나 대화형 서비스 개발에서 강력한 비용 절감 효과를 기대할 수 있다.
이는 경쟁사와 비교할 때 매우 파격적인 조건이다. 앤트로픽(Anthropic)의 클로드 3.7 소넷은 입력당 3달러, 출력은 15달러로, 같은 입력 기준이라도 GPT-4.1보다 최대 7배 이상 비싸다. 클로드 3 오퍼스는 무려 75달러에 달하는 출력 비용을 요구해 대형팀 외의 접근이 사실상 막혀 있다. 반면 GPT-4.1은 스타트업이나 소형 개발팀에 적합한 '개발자 중심' 가격 정책을 앞세워 시장 점유율을 빠르게 높이려는 전략이다.
구글의 제미니는 고성능 모델(2.5 Pro) 기준 첫 20만 토큰까지는 입력당 1.25달러지만 그 이상 사용 시 두 배로 인상되는 구조다. 출력 역시 최대 15달러에 달하며, 자동 청구 차단 기능이 없어 보안 취약점이나 악의적 요청에 쉽게 노출될 수 있다는 경고도 나온다. 실제 개발자 보호 솔루션 기업 프로프트쉴드는 이를 ‘지갑 거절 공격(Denial-of-Wallet)’의 잠재적 위험 요소라고 분석했다.
일론 머스크(Elon Musk)의 xAI가 내놓은 그록(Grok) 역시 경쟁에 뛰어들었지만, 구체적인 성능과 가격에 있어 한계를 드러내고 있다. 공식적으로는 GPT-4.1과 동일한 최대 100만 토큰 문맥 창을 지원한다고 했지만, 초기 API에선 13만1000토큰으로 제한돼 사용자들 사이에서 과장된 마케팅이라는 비판이 제기됐다. 여기에 빠른 응답을 원하면 가격이 크게 뛰는 ‘패스트-베타’ 모델로 유도하는 것도 부담으로 작용한다.
이런 가운데 AI 기반 개발 환경을 제공하는 윈드서프(Windsurf)는 GPT-4.1을 일주일간 무료로 무제한 사용할 수 있는 프로모션을 전격 실시하며, 시범 사용 후 전환률을 끌어올리는 전략에 나섰다. 실사용 중심의 체험 마케팅으로 GPT-4.1의 강점을 체감하게 해 업계 전환점을 만들겠다는 의도다.
전문가들은 이번 가격 조정이 오픈AI만의 움직임에 그치지 않을 것으로 보고 있다. 기술력뿐 아니라 가격과 운용 효율성까지 고려하는 새로운 기준이 형성되면서, 앤트로픽, 구글, xAI 등 기존 경쟁사들도 조만간 대응 전략을 내놓을 것으로 예상된다. 그 결과 AI 모델 선택 기준이 단순 성능 우위에서 비용 대비 효율성 중심으로 전환될 가능성도 커지고 있다.
AI 예산이 부담이었던 기업과 개발자들에게 GPT-4.1은 단순한 서비스 업데이트를 넘어, 업계 판도를 바꾸는 선택지가 될 수 있다. 가격 투명성과 성능, 반복 사용에 대한 할인을 모두 갖춘 이 모델은 생성형 AI 시대의 새로운 표준을 제시하고 있으며, 다가올 AI 혁신의 기반으로 작용할 가능성이 높아지고 있다.