옴니체인 데이터 네트워크 체인베이스(Chainbase)가 공식 블로그를 통해 암호화폐 분야를 위해 설계된 데이터 세트로 학습한 첫 번째 거대언어모델(LLM)인 테이아-라마-3.1-8B를 오픈소스화, 코드를 공개했다고 11일 발표했다. 이와 관련 체인베이스는 "해당 언어모델을 훈련시킨 데이터 세트는 블록체인 프로젝트에 대한 포괄적인 표현을 위해 두 가지 주요 소스를 통해 구성됐다. 첫 번째는 코인마켓캡에서 시가총액 기준 상위 2,000개 프로젝트의 데이터를 끌어왔다. 여기에는 백서, 공식 블로그 포스트, 뉴스 기사 등 내용이 포함됐다. 두 번째 소스로는 신뢰할 수 있는 기관의 프로젝트 연구 보고서가 포함됐으며, 펀더멘털, 개발 진행 상황, 시장 영향력 등이 담겼다"고 설명했다. 한편 체인베이스는 모든 블록체인 데이터를 통합해 인공지능(AI) 시대를 위한 개방되고 투명한 데이터 상호운용성 레이어를 제공하는 것이 목표다. 특히 체인베이스는 중국 IT 공룡 텐센트가 투자한 것으로 알려졌다.
뉴스 속보를 실시간으로...토큰포스트 텔레그램 가기