개인화가 개인화를 망치는 시대의 솔루션 (ft. FLock.io)

링크복사
공유
추천

링크가 복사되었습니다.

인프라

개인화가 개인화를 망치는 시대의 솔루션 (ft. FLock.io)

포필러스(Four Pillars)

2024.10.28 18:46:59

초개인화된 시대를 점점 추구하게 되면서, 근 5년간 IT 업계를 뜨겁게 달군 키워드 두개는 단연 블록체인과 AI 이다. 하지만 또 신기하게도, 두 기술 모두 같은 가치를 추구하는 것 같으면서도 그것에 접근하는 방법론은 반대이다. 그래서일까, AI와 블록체인이 가지는 서로 상반되는 특성을 되려 상호보완의 가능성으로 보기 시작한 관점들이 생겨나기 시작했다(i.e., AI의 탈중앙화). 연합 학습(Federated Learning)과 블록체인의 결합은 이에 대한 가장 대표적인 사례 중 하나로 자리매김할 것이다.

1. 배경 - 중앙집중식 AI의 발전에 대항할 수 있는 연합학습

1.1 개인화는 개인화에 의해 망쳐지고 있다

더욱 더 많은 상호작용이 일어나는 복잡한 사회 속에서, 개인들은 점점 더 자신만의 뚜렷한 개성을 나타내기를 선호하고 자기 자신에게 제공되는 서비스들 역시 편리하고 독특한 경험이길 바란다. 이에, 많은 비즈니스들은 고객 맞춤형 (개인화) 서비스에 집중하기 시작하였고, 그것을 위해 AI 기술에 강하게 의존하고 있다.

하지만 곰곰히 생각해보면, 완벽히 개인화된 서비스를 제공하는 것은 현실적으로 매우 어렵다. 우리가 살아가는 매 순간의 컨텍스트는 매우 복잡하고 변화무쌍하기 때문이다. 우리는 우리의 상태를 매번 데이터로 저장할 수 없을 뿐더러, 원하지도 않는다. 더욱이, 개인의 생활 양식에서 디지털 디바이스나 각종 (AI) 서비스들에 대한 의존도는 점점 늘어나기 때문에, 어쩌면 우리가 새로이 누리는 서비스들의 개인화에 쓰이는 원본 데이터는 이미 우리의 지극히 일부 개인 데이터를 토대로 만들어진 잘못된 개인화된 결과물일 지도 모르겠다.

그렇다. 오늘날, 수많은 중앙집중식 AI 서비스들은 개인화를 추구하는 과정에서 오히려 개인화를 망쳐버리는 역설을 낳고 있다. 개인화된 서비스를 제공한다는 명목 아래, 우리는 AI가 제시하는 답변을 일방적으로 수용할 수밖에 없다. 이들 시스템이 사용자들의 방대한 데이터를 수집하고 분석하는 과정은 마치 블랙박스와도 같아서 그 속을 들여다보는 것은 불가능에 가깝고, 이 시스템이 제공하는 맞춤형 선택지는 오히려 AI가 강요하는 답지처럼 느껴진다.

설상가상으로, 대중들의 AI 서비스에 대한 의존도가 커지는 상황에서 새로운 주체가 더욱 정교한 제품 및 어플리케이션을 만들어 기존의 서비스들과 경쟁하기 위해서는 더욱 많은 모델에 대한 연구와 많은 양의 데이터를 처리할 수 있는 연산 인프라가 필요하다. 이는 비즈니스, 아카데미 전역을 통틀어서 많은 자본을 집약하지 않고서는 발전되기 어려움을 시사하며, 더욱 기존의 AI 모델 혹은 AI 스택 공급자에 대한 의존도를 심화시킨다.

어쩌면 우리는 무엇을 원하고 생각하는지에 대한 독립적 결정권을 시스템에 넘기고, 우리의 개성을 스스로 흐릿하게 만들고 있는 것은 아닐까? 우리는 개인화가 정말 올바른 방식으로 이뤄지고 있는 지, 혹은 이뤄질 수 있는 지 현재 시스템에 반문해야하는 시점에 다다르고 있다고 생각한다. AI 기술이 진정으로 개인화란 가치를 추구한다면, 미래의 AI는 지금과 같이 제 3자의 거대한 단일 주체에 의해 관리되고 일방향적으로 서비스를 제공하는 방식이 아닌, 서비스 이용자들이 개인화된 데이터를 선별적으로 공급할 수 있는 참여형의, 그리고 누구나 모델의 로직을 확인할 수 있는 오픈소스로 설계돼야 할 것이다.

1.2 연합 학습에 대한 개요

이러한 문제점들에 대한 인식을 그간 업계에서 해오지 않은 것은 아니다. 연합 학습의 등장이 이에 대한 대표적인 예시라 할 수 있겠다. McMahan, H B 등 구글의 리서처들의 논문에 의해 처음으로 제안된 연합 학습 개념의 골자는 고유한 데이터를 가진 각 로컬 클라이언트에 AI 학습 모델을 보내어 학습을 진행시킨 후, 중앙 서버가 클라이언트들로부터 학습된 파라미터들을 중앙 서버로 전송하여 취합하는 학습 방식이다.

즉, 연합 학습을 통해 AI 모델링을 시행하게 되면, 각각의 로컬 클라이언트들은 자신의 디바이스 속 데이터를 통해 해당 서비스가 요구하는 모델을 트레이닝하되 모델의 트레이닝 결과값 만을 중앙 서버에 제공하면 되므로 그들의 원본 데이터가 제 3자에게 노출될 필요가 없어진다. 또한, 중앙 서버로부터 해당 모델에 대한 구조를 전송받기 때문에 자신의 데이터가 어떻게 학습되어 어떤 결과가 나오는 지도 확인할 수 있으므로 투명하고 신뢰할 수 있다(i.e., 화이트 박스).

더욱이, 중앙 서버 역시 다수의 클라이언트로 트레이닝된 각 파라미터에 대한 평균치를 계산하여 모델의 업데이트에 반영하므로, 기존의 AI 모델링 방식이라면 편향되어 있을 지도 모르는 중앙화된 데이터에 대한 의존도를 줄임으로써 편향되지 않은 더욱 객관적인 모델을 만들어낼 수 있으며, 또 학습에 필요한 데이터 스토리지 및 연산 자체도 로컬 클라이언트에서 모두 진행되므로 전체적인 모델 개발을 위한 스토리지 및 연산 비용, 그리고 네트워크 통신 레이턴시 측면에서도 이점이 있을 수 있다.

연합 학습의 응용 분야는 매우 다양할 수 있는데 - 가장 대표적으로는 개인의 금융 데이터 혹은 환자의 의료 데이터와 같이 민감 데이터를 활용한 서비스를 개발하거나, AI 에이전트, 혹은 대량의 데이터를 지속적으로 학습하여 실시간으로 커스텀한 결과를 제공해야하는 자율 주행차의 운전 로직 구현 등의 상황에서 특별히 유스케이스가 있을 수 있다.

1.3 연합 학습의 채택에 대한 도전과제들

하지만 이러한 장점들에도 불구하고 연합 학습이 아직까지 실질적으로 다양한 분야에서 상용화되는 것을 목격하긴 어려운데, 이에 대한 대표적인 도전과제들은 아래와 같다.

비싼 통신 비용

- 연합 학습 네트워크가 수십 수백만 대의 디바이스로 구성된다고 가정했을 때, 네트워크 내 통신은 로컬 연산보다 몇 배나 느릴 수 있다. 따라서 이러한 상황에서는 높은 통신 효율이 뒷받침될 수 있는 방안이 필요한데 총 통신 횟수 혹은 통신 클라이언트의 수 자체를 줄이거나, 혹은 통신 데이터의 크기 자체를 줄이는 모델 압축(Model Compression) 등 모델링에 맞는 여러가지 방법들을 고민하고 적용해야한다.

시스템적 / 통계적 이질성 및 참여 클라이언트 확보의 어려움

- 연합 학습은 각 클라이언트에서 수집한 데이터가 독립적이며 동일하게 분포되어있다고 가정한다(i.e., Independent Identically Distributed). 하지만 참여하는 클라이언트의 조건(e.g., 저장, 연산, 통신 성능 등)이 편향되어 있지 않을 확률을 고려하지 않을 수 없으며, 별다른 인센티브 없이 충분한 수의 클라이언트를 확보하는 것 역시 매우 어려울 수 있다.

모델 / 데이터 포이즈닝(Poisoning) 및 유휴 클라이언트

- 포이즈닝 어택은 악의적인 의도로 오염된 데이터를 학습에 포함시켜, 최종 모델의 성능을 크게 저하시키는 공격이다. 특히 연합 학습 관점에서는 소수의 공격자만으로도 성공적인 공격이 가능하며, 모델의 파라미터 값만을 공유하는 특성상 공격자를 식별하는 것도 쉽지 않다. 혹은 클라이언트가 모델 업데이트 과정 자체에 참여를 잘 안하는 것도 최종 모델의 품질 저하 발생 가능성을 높인다.

회피 공격(Evasion Attack)

- 회피 공격은 입력 데이터에 최소한의 변조를 가해 모델이 잘못 학습되도록 유도하는 공격이다(e.g., 사람의 눈으로는 구별할 수 없는 약간의 노이즈를 원본 데이터에 추가하여 모델의 손실함수값을 최대화하는 경우). 특히 연합학습에서는 공격자가 전체 네트워크에 공유된 파라미터를 관측할 수 있으므로, 해당 공격을 통해 이미 최적화가 되어있는 파라미터를 변형시키기가 매우 수월해진다.

2. 시사점 - 블록체인 레이어와 결부되어 발전할 수 있는 연합 학습

블록체인이 가지고 있는 가장 큰 의의라고 하면, 인센티브의 도입을 통해 시스템 운영에 필요한 다양한 참여를 이끌어 낼 수 있다는 점이라고 생각한다. 그리고 다양한 참여자들이 어떻게 합의하는 지 그 매커니즘을 정의하기에 따라서 악의적인 행동을 방지하고 투명한 시스템을 만들 수 있다.

이러한 맥락에서, 연합 학습의 영역 역시 블록체인의 등장을 통해 그것의 발전과 채택에 있어 걸림돌이 되었던 위 도전과제들을 일부 해결하며 상당한 진전을 이룰 수 있을 것이라 생각한다 - 아래에서 간략하게 살펴볼 FLock.io는 연합 학습(Federated Learning)과 블록체인(Blockchain)을 결합한 대표적인 예시다.

2.1 (간단한) 케이스 스터디 : FLock.io의 접근법

Source: FLock.io Docs

FLock.io는 AI Arena, FL Alliance, 그리고 AI Marketplace 세 주체가 엮여서 동작하는 구조를 가지며, 위와 같은 챌린지들을 DPoS 합의 알고리즘을 활용하여 독특하게 풀어낸다.

FLock.io 네트워크가 동작을 간략하게 설명하자면 아래와 같은데 -

(1~3) ; 최초 모델 트레이닝 단계

(4~5) ; 모델의 Fine Tuning 단계

1. Task Creators는 트레이닝을 시키고자하는 모델을 생성하여 AI Arena 상에 작업(work)을 배포한다.

2. 트레이닝 노드(Training Node)는 생성된 작업에 대한 초기 트레이닝 과정을 수행하고 검증자(Validator)에게 트레이닝이 완료된 모델을 제출한다 - 이 때 트레이닝 노드가 생성된 작업에 참여하여 보상을 얻기 위해서는 일정량의 $FML 토큰을 스테이킹해야한다. 악의적인 행동을 할 경우, 스테이킹된 토큰은 슬래싱된다.

3. 검증자는 제출된 모델들을 평가하고, 합의를 통해 제출된 모델들에 대한 순위를 매긴다 - 검증자 역시 이 과정에 참여하기 위해서는 토큰을 스테이킹해야하는데, 정확하고 정직한 검증을 했다는 가정 하에 스테이킹된 토큰의 수와 위임자(Delegator)들에 의해 위임된 토큰의 수의 합에 비례하여 이들의 보상이 결정된다.

4. 합의가 이루어진 모델은 FL Alliance에 할당되며, FL Alliance 내 각 클라이언트들은 무작위로 매 라운드마다 제안자(Proposer) 혹은 투표자(Voter)로 할당된다. 제안자로 선정된 클라이언트들은 할당된 모델을 자신의 로컬 데이터를 사용해 미세 조정하고 개선된 버전의 FL 글로벌 모델을 만든다. 투표자는 제안자들로부터 제안된 FL 글로벌 모델들을 집계하여 자신의 로컬 테스트 데이터 세트를 활용해 평가하고, 제안된 업데이트를 지지하거나 반대하는 투표를 시행한다.

5. 각 라운드에서 집계된 투표 결과를 통해 글로벌 모델이 최종적으로 결정되고, 이에 따라 각 FL Alliance 작업 참가자에 대한 보상이 분배된다.

6. 이렇게 완성된 AI Arena 합의 모델 또는 FL 글로벌 모델은 AI Marketplace에 배포되어 다양한 애플리케이션에 활용된다.

이처럼 트레이닝 단계(i.e., AI Arena)와 Fine Tuning 단계(i.e., FL Alliance) 전반에 걸쳐 인센티브 부여 및 슬래싱 기준을 명확히 설정함으로써 1.3 부분에서 언급한 공격 벡터 중 상당 부분을 예방할 수 있다.

예를 들어, 각 단계에 참여하기위해 스테이킹을 의무화하고, 악의적인 행동에 따라 처벌을 강화하거나 기여에 따라 보상을 비례하게 분배하는 (PoS 기반의) 인센티브 매커니즘 덕분에 트레이닝 및 검증의 품질을 컨트롤할 수 있으므로, 각종 모델 / 데이터 포이즈닝 공격 및 Sybil 공격 등에 대한 대비가 가능하다.

또한, 비록 Task Creator가 요구하는 모델의 복잡도는 모델마다 각각 상이하겠지만, 참여를 함에 있어 충분한 보상이 보장이 된다면 다양한 클라이언트들에 대한 참여를 유도할 수 있다. 특히 기여한 양이 적더라도 그에 비례하여 보상이 주어지기는 하며 상대적으로 높은 작업량을 요구하는 검증 작업 외에도 다양한 역할이 존재하기 때문에, 네트워크는 많은 참여 유인을 만들어낼 수 있다.

2.2 다원화되는 사회에 맞추어

물론 중앙화된 AI 모델이 주는 이점도 명확히 있을 것이고, 현재 전세계 수많은 사람들이 해당 모델을 사용하고 있다는 사실 자체가 그것을 증명한다고 생각한다. 하지만 서론에서 언급한 바와 같이, 우리는 중앙화된 AI 프로덕트들을 믿을 수 있는 근거가 현재로썬 부재하며, 특히 개인 정보 보호 문제 등 다양한 문제를 일으킬 우려까지 존재한다.

더욱이, 우리의 사회는 앞으로도 점점 더 복잡해지며 다양한 가치를 지향하는 사회로 나아갈 가능성이 크다. 그렇다면, 다양해지는 컨텍스트에 따라 생성되는 각 데이터에 맞는 AI 모델 역시 다양한 방식으로 등장해야한다고 생각한다.

이런 점에서 인센티브 매커니즘이 있는 블록체인의 도입은 연합 학습 방법론과 함께 결합되어 기존의 AI 모델링이 이뤄지는 방식을 민주화할 수 있는 강력한 동기가 될 수 있다. 물론 네트워크가 안정적으로 유지될 수 있도록 이 인센티브가 계속해서 기여자들에게 매력적인 보상으로 다가갈 수 있도록 토크노믹스를 잘 설계하는 것도 별도의 중요한 어젠다이겠지만, 적어도 FLock.io의 이러한 시도는 연합 학습 방법론이 원래 구조적으로 가지고 있는 여러 문제점들을 근본적으로 해결할 수 있는 잠재력을 일부 갖추었다는 점에서 큰 의의가 있다.

트위터 웹사이트