링크복사
공유
댓글
추천
스크랩
인쇄
글자크기

링크가 복사되었습니다.

글자크기

가

작게

가

보통

가

크게

가

매우크게

인공지능

오픈AI, '생각하는 AI' 시대 열었다…신형 모델 o3·o4-mini 전격 공개

김민준 기자

2025.04.17 (목) 03:48

오픈AI가 시각 정보 통합·도구 활용 능력을 갖춘 차세대 AI 모델 o3와 o4-mini를 공개했다. 전문가들은 이를 '생각하는 인공지능'의 변곡점으로 평가하고 있다.

오픈AI, '생각하는 AI' 시대 열었다…신형 모델 o3·o4-mini 전격 공개 / TokenPost Ai

샌프란시스코에 본사를 둔 오픈AI(OpenAI)가 이미지 기반 추론부터 도구 활용까지 자율적으로 수행할 수 있는 차세대 인공지능 모델 'o3'와 'o4-mini'를 전격 공개했다. 전문가들은 이 두 모델을 기존 AI 기술을 넘어서는 '질적 도약'으로 평가하고 있으며, 오픈AI는 이를 통해 다시 한번 AI 업계의 리더십을 입증하려 하고 있다.

새롭게 선보인 ‘o3’와 소형화된 모델 ‘o4-mini’는 오픈AI의 ‘o 시리즈’ 중 가장 강력한 추론 능력을 갖춘 버전이다. 이 모델들은 단순히 이미지를 인식하는 수준을 넘어서, 시각 정보를 사고 과정에 직접 통합하는 방식으로 문제를 해결한다. 텍스트 기반 질의에 이미지를 연결해 분석하거나, 웹 탐색, 코드 작성, 이미지 생성까지 일련의 작업을 유기적으로 수행할 수 있는 것이 핵심 역량이다.

오픈AI의 공동 창업자이자 사장인 그렉 브록만(Greg Brockman)은 “GPT-4 이후 오랜만에 진정한 진보라고 느껴지는 모델”이라며 “세계 최고 과학자들도 이 모델이 실질적으로 새로운 아이디어를 창출할 수 있는 수준이라고 말한다”고 밝혔다.

기자회견에서 시연된 데모에 따르면, o3는 10년 전 물리학 인턴십에서 사용된 복잡한 포스터를 분석해 핵심 정보를 추출해냈다. 단순 정보 추출을 넘어서 다이어그램을 해석하고, 빠진 데이터를 유추하는 능력도 입증했다. 멀티모달 리서치 팀의 연구원 브랜든 매켄지(Brandon McKenzie)는 “이 정도 분석을 하려면 나 혼자 했을 때는 며칠, 아니 거의 일주일이 걸렸을 것”이라고 말했다.

산업 전문가들은 이처럼 이미지를 사고의 일부로 삼는 방식이 과학, 교육, 콘텐츠 제작 등 다양한 영역에서 판도를 바꿀 것으로 내다보고 있다. 사용자들이 구체적인 시각 정보를 통해 복잡한 분석을 수행할 수 있기에 활용 범위가 획기적으로 넓어진 셈이다.

o3와 o4-mini는 단순한 모델이 아닌 종합적인 AI 시스템으로서의 정체성을 갖고 있다. 특히 '도구 사용' 능력이 핵심인데, 오픈AI는 이 모델들이 정해진 알고리즘만 따르는 것이 아니라, 문제의 성격에 따라 어떤 도구가 언제 필요한지를 스스로 판단할 수 있도록 강화 학습을 통해 학습시켰다.

브록만은 “o3는 어떤 복잡한 과제를 해결하는 과정에서 최대 600번의 도구 호출을 연속적으로 수행할 수 있었다”며 “단일 질문에 대해 여러 데이터 소스 검색, 코드 작성, 시각화 생성까지 자동화된 워크플로를 구현할 수 있다”고 설명했다.

공식 발표에 따르면, o3는 AI 능력 평가 지표인 Codeforces, SWE-bench, MMMU 등 여러 외부 벤치마크에서 새로운 최고 기록을 세웠다. 전작보다 실수도 20% 가량 줄였다. 비교적 경량화된 o4-mini도 비용 대비 성능에서는 눈에 띄는 개선을 이뤘다. 수학 경시대회 AIME 2025에서 Python 인터프리터 접근이 가능할 경우 99.5%의 정확도를 기록할 정도로 정교함을 갖췄다.

오픈AI는 이번 발표가 단순한 기술 업데이트를 넘어 상업적 확대의 분수령이 될 것으로 기대하고 있다. GPT-4.1 발표 직후 이루어진 이 모델 출시는 구글의 ‘제미니’, 앤스로픽의 ‘클로드’, 일론 머스크의 xAI와 치열하게 맞붙고 있는 경쟁 환경에서 오픈AI가 다시 한발 앞서 나가기 위한 전략적 포석으로 읽힌다.

올해 3월 오픈AI는 사상 최대 규모의 민간 기술 투자 유치에 성공하며 약 40조 원 규모의 자금을 마련했음은 물론, 자체 소셜 미디어 플랫폼을 구축해 일론 머스크의 X(구 트위터)와 경쟁하는 방안도 검토 중이다.

이와 함께 오픈AI는 코딩 전용 에이전트인 Codex CLI도 함께 발표했다. 이 오픈소스 도구로 개발자들은 코드 기반 이미지 생성, 스크린샷 분석, 스케치 이해와 같은 멀티모달 능력을 터미널 환경에서 즉시 활용할 수 있다. 초기 확산을 위해 오픈AI는 총 100만 달러(약 14억 4,000만 원) 규모의 API 크레딧을 제공하는 지원 프로그램도 동시에 시작했다.

사용자 접근성 측면에서도 범용화를 강하게 의식한 전략을 취했다. 현재 ChatGPT Plus, Pro, 팀 요금제 이용자에게는 즉시 제공되며, 기업용과 교육용은 다음 주부터 단계적으로 확장된다. 개발자들은 관련 API를 통해 두 모델을 바로 활용할 수 있다.

오픈AI는 이 모델들이 인간의 대화 능력과 추론 능력을 동시에 갖춘 차세대 시스템으로 진화하고 있음을 시사했다. 즉, 대화형으로 작동하면서도 복잡한 분석과 도구 활용까지 자율적으로 해내는 통합형 AI 시스템으로의 진입점이라는 것이다.

업계에서는 o3와 o4-mini가 단순히 이미지 인식 AI를 넘어, 시각 정보를 사고에 통합하는 '능동적 시각 추론'의 시대를 열었다는 점에서 의미를 부여하고 있다. 이로써 인공지능이 보는 것을 진정으로 ‘생각하는’ 변곡점에 도달했다는 것이 전문가들의 평가다.

뉴스를 실시간으로...토큰포스트 텔레그램 가기

광고문의 기사제보 보도자료

#오픈AI #o3 #o4mini #AI모델 #멀티모달AI #도구사용AI

많이 본 기사