오픈AI, GPT-4o 이미지 생성 기능 공개… AI 크리에이티브 혁신 가속

정민석 기자

2025.03.26 (수) 04:31

오픈AI가 GPT-4o의 네이티브 이미지 생성 기능을 공개했다. 기존 모델과 달리 텍스트, 코드, 이미지 등을 단일 모델에서 직접 생성할 수 있으며, 다양한 산업에서 활용될 전망이다.

오픈AI, GPT-4o 이미지 생성 기능 공개… AI 크리에이티브 혁신 가속 / TokenPost Ai

오픈AI가 GPT-4o의 새로운 네이티브 이미지 생성 기능을 공개하며 사용자들에게 강렬한 인상을 남겼다.

GPT-4o는 기존의 AI 이미지 생성 모델과 차별화된 접근 방식을 채택했다. 이전까지 챗GPT에서 사용되던 DALL-E 3는 텍스트 프롬프트를 기반으로 이미지를 복원하는 ‘확산 변환 모델’ 방식이었다. 반면, GPT-4o는 텍스트, 코드, 이미지 등 다양한 형태의 데이터를 단일 모델에서 직접 생성할 수 있도록 설계됐다. 오픈AI는 이번 업데이트를 통해 챗GPT의 모든 사용자 계층(무료, 플러스, 프로, 팀)에서 이 기능을 활용할 수 있도록 했으며, 곧 엔터프라이즈, 교육 기관, API 사용자들도 이용 가능할 것이라고 밝혔다.

특히 이번 이미지 생성 모델은 더욱 자연스러운 시각적 표현과 정교한 텍스트 삽입 기능을 제공한다. 기존 AI 모델들이 텍스트 렌더링에서 한계를 보였던 반면, GPT-4o는 인포그래픽, 간판, 초대장 등의 제작에서도 높은 정확도를 자랑한다. 또한 사용자가 이미지 스타일, 색상 코드, 비율 등을 지정하면 1분 내로 해당 디자인을 생성할 수 있다.

이미지 생성 기술을 챗GPT뿐 아니라 오픈AI의 동영상 생성 플랫폼 ‘소라(Sora)’에도 통합할 계획이다. 이를 통해 사용자들은 보다 정교한 멀티모달 콘텐츠 제작이 가능해질 전망이다. 오픈AI의 내부 발표에 따르면, 이번 업데이트를 통해 ▲브랜드 디자인(로고, 포스터, 광고 제작) ▲교육 시각화(과학 다이어그램, 역사적 이미지) ▲게임 그래픽(캐릭터 일관성 유지) ▲콘텐츠 제작(소셜 미디어 자산, 마케팅 자료 제작) 등 여러 산업에서 활용도가 증가할 것으로 예상된다.

이번 발표는 구글이 최근 AI 스튜디오에서 ‘제미니 2 플래시’ 모델을 공개한 직후 이뤄졌다는 점에서도 주목된다. 한편, GPT-4o의 학습 데이터가 구체적으로 무엇인지에 대해서는 여전히 밝혀지지 않았다. AI 모델들이 인터넷에서 가져온 이미지 데이터를 활용해 학습하는 만큼, 저작권 문제를 둘러싼 논란이 이어질 가능성도 있다.

오픈AI는 이에 대한 윤리적 책임을 다하기 위해 모든 AI 생성 이미지에 ‘C2PA’ 메타데이터를 삽입해 출처를 확인할 수 있도록 했으며, 내부 검색 툴을 활용해 AI 생성 이미지 감지 기능도 강화할 방침이다. 또한 폭력적이거나 기만적인 콘텐츠 생성을 방지하기 위한 엄격한 안전장치도 마련했다.

샘 알트만 오픈AI CEO는 "이번 발표는 AI 이미지 생성에서 새로운 전환점이 될 것"이라며 "사용자들이 더욱 창의적인 시각적 콘텐츠를 제작할 수 있도록 지속적으로 개선해 나가겠다"고 밝혔다. GPT-4o의 이미지 생성 기능이 텍스트 기반 AI의 한계를 극복하고, 창작 및 디자인 산업 전반에 어떤 변화를 불러올지 주목된다.

뉴스를 실시간으로...토큰포스트 텔레그램 가기

광고문의 기사제보 보도자료

#오픈AI #GPT-4o #AI이미지생성 #텍스트투이미지

많이 본 기사