맨위로 가기
  • 공유 공유
  • 댓글 댓글
  • 추천 추천
  • 스크랩 스크랩
  • 인쇄 인쇄
  • 글자크기 글자크기
링크가 복사되었습니다.

딥엘(DeepL), 차세대 AI 번역 모델 출시

작성자 이미지
김민준 기자

2024.07.19 (금) 18:40

대화 이미지 1
하트 이미지 6

딥엘(DeepL), 차세대 AI 번역 모델 출시 / 셔터스톡

독일에 본사를 둔 AI 번역 기술 선두주자인 딥엘(DeepL)이 차세대 모델을 출시했다. 최근 펀딩 라운드에서 20억 달러의 가치를 평가받은 딥엘은 AI 붐의 번역 부문에서 큰 반향을 일으키며 이미 10만 개 이상의 기업, 정부 및 기타 조직에서 자사의 기술을 사용하고 있다고 밝혔다.

19일(현지시간) 포춘에 따르면, '우리는 2017년 딥엘이 설립된 이래로 유사한 신경망을 사용해 왔지만, 이번에 처음으로 대형 언어 모델(LLM) 기술로 이를 발전시켰다'고 딥엘의 CEO 야렉 쿠틸로프스키(Jarek Kutylowski)는 말했다. 'LLM은 번역을 장악할 것이다.'

이 모델은 GPT-4나 Llama 3 같은 일반 LLM이 아니며, 딥엘에서 자체적으로 구축한 번역에 특화된 모델이다. 이름 없는 이 모델은 이전 모델의 기능을 모두 개선하고, 앞으로 더 많은 기능을 추가할 계획이다. 새로운 LLM 아키텍처는 멀티모달 번역과 사용자가 입력하는 동안 실시간으로 여러 언어로 번역하는 기능을 제공할 수 있는 길을 열어줄 것으로 기대된다.

딥엘의 번역 모델은 웹사이트와 다양한 브라우저 확장 프로그램 및 소프트웨어 통합을 통해 누구나 사용할 수 있지만, 회사는 특히 슬랙 메시지부터 민감한 법적 문서까지 모든 것을 번역하려는 글로벌 기업을 목표로 하고 있다. 많은 번역 도구는 사용자가 자신의 언어로 작성한 후 전체 텍스트를 번역하도록 모델을 요청하는 기능만 제공하지만, 딥엘의 모델은 상호작용하는 글쓰기 기능도 포함하여 사용자가 다른 언어에서 언어적으로 정확하면서도 여전히 자신의 글처럼 느껴질 수 있는 다양한 옵션을 제안한다.

'이것이 당신의 텍스트라는 점을 확실히 하고 싶고, 번역되더라도 여전히 당신이 쓴 것처럼 보이게 하는 것이 중요하다'고 쿠틸로프스키는 말했다. '미세 조정하고 자신의 것으로 만드는 것이 우리 사용자들이 중요하게 여기는 부분이다.'

모든 AI 소프트웨어와 마찬가지로 데이터는 중요하다. 딥엘은 최상급 번역 데이터에 대한 접근성과 교육 과정에서 인간이 참여하는 점을 주요 차별화 요소로 보고 있다. 딥엘은 공개 데이터(전문 언어학자들이 평가하여 품질이 높은 데이터만 모델에 입력되도록 함), 라이선스 데이터셋, 합성 데이터를 결합하여 사용한다. 인간 전문가들은 모델 출력을 피드백하여 성능을 개선하는 강화 학습(RLHF) 과정을 거친다. 쿠틸로프스키에 따르면, 인간 피드백으로 인한 품질 향상은 '상당히 큰' 수준이며, 딥엘이 현재의 위치에 도달할 수 있었던 이유이다.

물론 딥엘은 마이크로소프트, 구글, 애플, 아마존, 메타 등 주요 기술 기업들과 치열한 경쟁을 벌이고 있다. 세마포 기술 뉴스레터에 따르면, '구글 같은 회사는 손가락을 튕기면 100개 이상의 언어를 번역할 수 있는 능력을 얻고 그 기술을 무료로 제공할 수 있다.' 딥엘은 이전 세대 소프트웨어로 32개 언어를 지원하지만, 다음 세대에서는 영어, 일본어, 독일어, 간체 중국어만 지원하고 있다. 반면 구글 번역은 최근 추가로 243개 언어를 지원하게 되었다.

오픈AI와 같은 주요 AI 기업들도 이 경쟁에 뛰어들고 있다. 이번 주 초, 코히어(Cohere)도 일본의 기술 대기업 후지쯔와 전략적 파트너십을 맺고 일본어 언어 기능을 갖춘 LLM을 구축하기 위해 '중요한 투자'를 발표했다.

딥엘은 자사의 모델이 최고의 번역 품질을 제공한다고 믿고 있다. 회사는 블라인드 테스트에서 언어 전문가들이 딥엘의 차세대 모델을 구글 번역보다 1.3배, ChatGPT-4보다 1.7배, 마이크로소프트보다 2.3배 더 선호한다고 밝혔다. 그러나 딥엘은 이 연구를 공개하지 않았으며, 테스트에 참여한 언어 전문가의 수와 같은 방법론에 대한 구체적인 내용을 제공하지 않았다. 2021년 독립 평가에서는 딥엘이 13개 언어 쌍에서 구글과 16개의 다른 모델을 능가하여 최고의 성능을 보인 것으로 나타났다.

많은 AI 사용 사례가 여전히 논쟁 중이지만, 번역에 AI를 사용하는 이점은 명확하다. 기업은 날로 더 글로벌화되고 있으며, 이는 얻을 것이 많고 잃을 것이 적은 분야이다. 전문가들이 인간 번역가를 이용할 수 있는 경우는 드물었지만, 이제 모든 사람—성장하는 기업부터 휴가 여행자까지—이 새로운 기회를 열어줄 번역기를 주머니에 가지고 있다.

'제 관점에서는 정말로 놀랍다'고 쿠틸로프스키는 말했다. '번역 기술에서 LLM이 앞으로 나아갈 길인지 확실하지 않았지만, 현재 이 단계에서는 다른 모델을 능가할 수 있는 능력을 보여주고 있으며, LLM이 단순한 번역 외에도 더 많은 것을 할 수 있는 추가 기능을 제공할 수 있다는 점에서 정말 흥미롭다.'

뉴스 속보를 실시간으로...토큰포스트 텔레그램 가기

<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>

많이 본 기사

미션

매일 미션을 완료하고 보상을 획득!

출석 체크

0 / 0

기사 스탬프

0 / 0

관련된 다른 기사

댓글

1

추천

6

스크랩

스크랩

데일리 스탬프

0

매일 스탬프를 찍을 수 있어요!

데일리 스탬프를 찍은 회원이 없습니다.
첫 스탬프를 찍어 보세요!

댓글 서비스는 로그인 후 이용하실 수 있습니다.
전체댓글 [1]
댓글보기
  • 1mini
  • 2024.07.24 18:18:15
ㄱ ㅅ ㅇ
답글 달기
  • 0
  • ·
  • 0
1