인공지능(AI)의 효과는 데이터를 얼마나 체계적으로 관리하느냐에 달려 있다. 특히 의료 업계에서 AI를 성공적으로 활용하려면 데이터의 ‘FAIR(Findable, Accessible, Interoperable, Reusable, 찾기 쉽고, 접근 가능하며, 상호 운용이 가능하고, 재사용할 수 있는)’ 원칙이 필수적이다. 이를 무시하면 비효율성과 부정확성이 커지고, AI 기반 분석의 신뢰성도 떨어질 수밖에 없다.
FAIR 데이터 전략이 중요한 이유는 AI가 데이터를 단순히 처리하는 것을 넘어, 유의미한 통찰력을 도출하는 데 그 역할이 있기 때문이다. 구글 클라우드의 헬스케어 솔루션 글로벌 디렉터 아시마 굽타는 "데이터 전략 없이 AI 전략을 논하는 것은 불가능하다"고 강조했다. 그는 최근 열린 HIMSS25 컨퍼런스에서 EPAM 시스템즈의 테드 슬레이터와 함께 AI 도입에 있어 데이터 전략이 갖는 역할을 설명하며 “현재 시장에 AI 기술에 대한 과장된 기대와 불필요한 적용이 많지만, AI의 성과를 극대화하려면 탄탄한 데이터 전략부터 마련해야 한다”고 말했다.
AI 도입을 고려하는 기업과 기관은 데이터 구조화 작업을 우선해야 한다. 슬레이터는 데이터가 명확하게 정리되지 않는다면 검색조차 어렵고, 설령 찾더라도 활용하기 어려운 경우가 많다고 지적했다. 또한 여러 시스템이 단절된 상태로 운영되면 데이터의 상호 운용성이 떨어지기 때문에 AI가 원활하게 작동하지 못할 가능성이 크다. 그는 "데이터를 찾을 수 없다면 활용할 수도 없다. 또한 한 번 찾았다고 해서 이를 자유롭게 사용할 수 있는 것이 아니며, 데이터가 반복 사용될 수 있도록 설계해야 지속적인 가치를 창출할 수 있다"고 설명했다.
구조화된 데이터 없이 AI를 적용할 경우, 비효율성과 비용 낭비가 발생할 위험이 크다. 슬레이터는 “FAIR 데이터 전략을 구축하지 않으면 데이터가 빠르게 단절되고 분산되며, 재사용도 어렵게 된다”고 지적하며, "진정한 질문은 'FAIR 데이터 전략이 없을 때 발생하는 비용이 얼마나 되는가?'이다. AI 활용을 위해 필요한 데이터를 항시 재정비해야 한다면, 막대한 시간과 비용이 낭비될 것"이라고 강조했다.
FAIR 데이터를 구현하기 위해서는 초반부터 명확한 검증 기준을 마련하고, 실무적으로 적용 가능한 단계를 설정하는 것이 중요하다. 슬레이터는 "완벽한 데이터 전략을 구축하려 하기보다, 현실적으로 가능한 수준에서 점진적으로 데이터 체계를 정비하는 것이 효과적"이라고 조언했다. 굽타도 이에 동의하며 "장기적인 데이터 전략과 단기적인 성과 창출을 조화롭게 균형을 맞추는 것이 중요하다"고 덧붙였다. 그는 “만약 데이터 전략을 수년에 걸쳐 구축하려 한다면, 실질적인 활용 사례가 나오기도 전에 투자자와 경영진이 관심을 잃을 가능성이 크다”며 짧은 주기로 가시적인 성과를 보여줄 필요가 있다고 설명했다.
특히, 점차 AI 모델이 진화하면서 데이터 관리 방식도 변화하고 있다. 과거에는 데이터를 수집, 변환, 정리한 후 클라우드에 저장하여 AI 시스템을 구축하는 방식이 일반적이었지만, 최근에는 AI 에이전트가 데이터를 실시간으로 처리하는 방식이 주목받고 있다. 굽타는 "이제는 데이터가 반드시 변환된 상태에서 클라우드에 저장되지 않아도 되며, AI가 데이터가 위치한 곳에서 바로 분석하는 방식이 점점 보편화되고 있다"고 말했다. 다만, 모든 AI 응용 사례에 이와 같은 접근 방식이 적용될 수 있는 것은 아니기 때문에 개별 사례에 적절한 방법을 선택하는 것이 필요하다고 강조했다.
FAIR 데이터 원칙을 준수하면 AI가 단순한 자동화 도구를 넘어 보다 정밀하고 신뢰성 높은 인사이트를 제공할 수 있다. 기업과 의료 기관이 AI 기술을 성공적으로 도입하려면, 무엇보다 데이터를 전략적으로 관리하는 것이 필수적이라는 점이 분명해졌다.