링크복사
공유
댓글
추천
스크랩
인쇄
글자크기

링크가 복사되었습니다.

글자크기

가

작게

가

보통

가

크게

가

매우크게

블록체인

DeepSeek, 중국판 ChatGPT AI 산업 흔드는 초거대 언어 모델 등장

손정환 기자

2025.01.31 (금) 10:40

DeepSeek, 중국판 ChatGPT AI 산업 흔드는 초거대 언어 모델 등장 / 셔터스톡

DeepSeek이 6700억 개의 파라미터를 가진 세계 최대 오픈소스 AI 모델로 공개되면서, 저비용 고효율 AI 개발의 새로운 패러다임을 제시하고 있다.

30일(현지시간) 코인텔레그래프에 따르면, DeepSeek은 코딩, 논리적 추론, 수학 문제 해결 등 다양한 작업을 수행할 수 있는 AI 챗봇으로, OpenAI의 ChatGPT와 유사한 기능을 제공하지만 더욱 비용 효율적인 모델로 주목받고 있다. DeepSeek의 핵심 모델인 R1은 6700억 개의 파라미터를 갖추고 있으며, 이는 2025년 1월 28일 기준으로 가장 큰 오픈소스 대형 언어 모델(LLM)이다. 이 모델은 인간의 사고 과정을 모방해 점진적으로 응답을 생성하는 방식을 채택해, 메모리 사용을 줄이고 운영 비용을 절감하는 특징을 가진다.

DeepSeek의 개발 비용은 단 600만 달러로, OpenAI의 GPT-4 개발 비용인 1억 달러 이상의 극히 일부 수준이다. 비용 절감의 핵심 요소는 GPU 조달 전략이었다. DeepSeek의 창립자는 2022년 9월 이후 중국으로의 수출이 금지된 엔비디아 A100 칩을 대량으로 비축했으며, 여기에 비교적 저렴한 H800 칩을 병행 사용해 강력한 AI 모델을 구축했다. 이러한 방식으로 DeepSeek은 상대적으로 저렴한 비용으로 고성능 AI 모델을 개발하며 AI 업계의 경쟁 구도를 변화시키고 있다.

DeepSeek은 오픈소스 모델을 제공하지만, 학습 데이터는 비공개로 유지된다. 이는 연구자들이 모델 성능을 검증할 수 있도록 하면서도, 데이터의 출처와 투명성 부족으로 논란을 불러일으킬 가능성이 있다. DeepSeek의 R1 모델은 기존 LLM 대비 효율적인 연산 구조를 갖추고 있으며, 특히 Mixture-of-Experts(MoE) 아키텍처와 Multi-head Latent Attention(MLA) 기법을 적용해 성능을 최적화했다. MoE는 모델의 전체 파라미터 중 일부만 활성화해 연산 부담을 줄이는 방식으로, 거대한 단일 신경망 대신 여러 개의 ‘전문가 네트워크’를 활용하는 형태다. MLA는 기존 트랜스포머 모델이 대량의 정보를 저장해야 하는 부담을 줄이기 위해, 정보를 압축된 ‘잠재 표현(latent representation)’으로 변환하여 처리 속도를 높이는 기술이다.

DeepSeek의 기술적 강점은 비용 절감뿐만 아니라 연산 효율성에서도 드러난다. DeepSeek R1은 2048개의 엔비디아 H800 GPU에서 55일 동안 학습되었으며, 총 550만 달러의 비용이 투입됐다. 이는 ChatGPT가 약 1억 달러의 학습 비용이 소요된 것과 비교하면 10분의 1 수준에 불과하다. 이러한 비용 효율성 덕분에 DeepSeek은 AI 연구 및 활용을 더욱 저렴하게 만들고 있으며, 이를 통해 다양한 산업에서 AI 도입이 가속화될 것으로 예상된다.

DeepSeek을 개발한 량원펑(Liang Wenfeng)은 저장대학교에서 전자정보공학 및 컴퓨터과학을 전공한 인물로, 금융업에서 AI를 활용한 경험을 바탕으로 2023년 12월 DeepSeek을 설립했다. 그는 중국 최초로 100억 위안(약 1조8000억 원) 규모의 퀀트 헤지펀드를 조성한 '하이플라이어(High-Flyer)'의 CEO이기도 하다. DeepSeek은 하이플라이어와는 별개로 운영되지만, 여전히 주요 투자자로 남아 있으며 AI를 활용한 금융 데이터 분석 및 투자 전략 개발에도 영향을 미치고 있다.

DeepSeek의 등장은 AI 업계에 큰 파장을 불러일으키고 있다. 유명 벤처 캐피털리스트 마크 안드레센(Marc Andreessen)은 이를 "미국 AI 산업에 스푸트니크 모멘트(Sputnik moment)"라고 평가하며, 미국의 AI 주도권이 위협받고 있음을 시사했다. 스푸트니크 모멘트란 한 국가가 예상치 못한 기술적 격차를 경험하며 연구개발(R&D)에 집중하게 되는 순간을 의미하는데, DeepSeek의 등장이 미국 AI 업계에 새로운 도전 과제가 될 수 있음을 시사한 것이다.

그러나 DeepSeek은 정치적으로 민감한 주제에 대해 답변을 제한하는 검열 정책을 적용하고 있어, 글로벌 시장에서의 경쟁력에 대한 우려도 나오고 있다. 예를 들어, 1989년 톈안먼 사건이나 중국 공산당에 대한 질문을 받으면 "도움이 되지 않는 질문"이라는 응답을 제공하는 방식으로 회피한다. 또한, DeepSeek의 개인정보 보호 정책과 데이터 저장 방식에 대한 논란도 제기된다. 일부 서방 국가는 중국 AI 모델의 데이터 보안 및 프라이버시 이슈를 우려하며 신중한 접근을 요구하고 있다.

DeepSeek은 비용 효율적인 AI 모델 개발로 산업 내 새로운 패러다임을 제시하고 있으며, AI 대중화 및 연구 혁신을 촉진할 가능성이 크다. 현재 글로벌 AI 기업들이 데이터센터와 반도체 투자에 집중하는 가운데, DeepSeek은 제한된 하드웨어로도 강력한 AI 모델을 개발할 수 있음을 증명했다. 이러한 전략은 AI 기술이 반드시 막대한 비용과 첨단 하드웨어를 필요로 한다는 기존 인식을 뒤흔들고 있다.

DeepSeek의 등장은 AI 산업의 지형을 재편할 중요한 전환점이 될 것으로 보이며, 앞으로의 기술 발전과 글로벌 경쟁 구도에 어떤 영향을 미칠지 주목된다.

뉴스 속보를 실시간으로...토큰포스트 텔레그램 가기

광고문의 기사제보 보도자료

많이 본 기사

美 SEC, 비트와이즈 비트코인·이더리움 결합 ETF 승인

그레이스케일, SEC에 'XRP 현물 ETF' 전환 신청

솔라나(SOL), DEX 시장 점유율 급등… 이더리움 시장 잠식 중

비트코인 가격 상승, 연준 금리 동결·ETF 자금 유입 영향

비트코인, 트럼프 관세 정책에 상승세 주춤...10만4730달러선

[코인 동향분석]자산가 순매수 1위비트코인(BTC)...비트코인 골드(BTG) RSI 8.71%

[토큰포스트 브리핑] 미 SEC, 비트와이즈 현물 BTC-ETH 결합 ETF 승인 外

비트코인, 10만8000달러 돌파 가능성 커져… 강세장 본격화

[토큰포스트 오후 브리핑] TRUMP 출시 후 솔라나 기반 스테이블코인 공급량 73%↑ 外

코인베이스, CFTC에 솔라나·헤데라 선물 허가 신청

미션

매일 미션을 완료하고 보상을 획득!

출석 체크

0 / 0

이동

기사 스탬프

0 / 0

이동

티켓스토어

티켓으로 다양한 상품에 응모하자!

1명

사토시노트™ Lite

2명

리플 빅뱅

2명

웹3 시대와 새로운 기회

2명

최소한의 비트코인

2명

아웃백 모바일 금액권

2명

던킨 카라멜마끼아또

10명

매머드익스프레스

아메리카노 M

에어드랍

선물이 쏟아지는 에어드랍 이벤트!

일반 마감

[Episode 16] CoinEx에서 밈코인을 쏜다! $BOME, $DOGE, $MEW, $PEPE, $TRUMP

$10 상당의 밈코인 ($BOME, $DOGE, $MEW, $PEPE, $TRUMP 택1)

자이언트맘모스(GMMT) 일반 마감

[Episode 15] GM Wallet 다운받고, GMMT 에어드랍받자!

500 GMMT 에어드랍 (500명)

자이언트맘모스(GMMT) 일반 마감

[Episode 14] GM Wallet 다운받고, GMMT 에어드랍받자!

500 GMMT 에어드랍 (500명)

일반 마감

[Episode 13] TOKENPOST X CoinEx 총 1000 USDT 에어드랍 이벤트

추첨을 통해 총 1000 USDT 에어드랍

퀴즈

퀴즈풀고 선물 받자!

진행중

[토큰포스트] 기사 퀴즈 264회차

2025.01.31 (금) ~ 2025.02.01 (토)

마감

[토큰포스트] 기사 퀴즈 263회차

2025.01.24 (금) ~ 2025.01.25 (토)

마감

[토큰포스트] 기사 퀴즈 261회차

2025.01.20 (월) ~ 2025.01.21 (화)

마감

[토큰포스트] 기사 퀴즈 260회차

2025.01.17 (금) ~ 2025.01.18 (토)

기사 제목	페페(PEPE) 30일 최저점을 기록, 밈코인 열풍의 끝을 시사하나페페(PEPE) 30일 최저점을 기록, 밈코인 열풍의 끝을 시사하나...
내용	0/1000

기사 제목	페페(PEPE) 30일 최저점을 기록, 밈코인 열풍의 끝을 시사하나페페(PEPE) 30일 최저점을 기록, 밈코인 열풍의 끝을 시사하나...
내용	0/1000
파일 첨부	파일 업로드 다운로드 파일명