빅데이터로 맞춤형 의료 앞당긴다
빅데이터로 맞춤형 의료 앞당긴다
빅데이터 시장 11% 증가율 ... 2026년 381조 예측

의료 비용 절감, 수익화 개선, 개인화 정밀의료 제공

질병현황, 약물처방 및 수술빈도, 유전변이 진단 가능

“데이터 이질성, 이해관계자 갈등 등 문제 해결해야” 
  • 이지혜
  • admin@hkn24.com
  • 승인 2022.09.21 08:31
  • 댓글 0
이 기사를 공유합니다

유전체 빅데이터 기반 AI 신약개발 기업 신테카바이오의 구로슈퍼컴센터 전경.
유전체 빅데이터 기반 AI 신약개발 기업 신테카바이오의 구로슈퍼컴센터 전경 [사진=헬스코리아뉴스 D/B]

[헬스코리아뉴스 / 이지혜] 빅데이터 분야가 생명공학과 의료산업에 적용될 수 있는 가장 중요한 영역 중 하나로 꼽히며 데이터 내의 패턴을 찾아 질병을 개선하는 데 큰 역할을 할 것으로 전망되고 있다. 

글로벌 시장조사보고서 마켓앤마켓(Markets and Markets)에서 발간한 ‘Global Forecast to 2026’에 따르면, 빅데이터 시장 규모는 2021년 1626억 달러(약 226조 8270억 원)에서 2026년 2734억 달러(약 381조 3930억 원)로 약 11%의 증가율을 보이며 성장할 것으로 예측된다. 

한국바이오협회 바이오경제연구센터는 20일 ‘생명과학 분야에서 빅데이터의 영향과 향후 방향’ 브리프를 통해 “생명공학 분야는 기술혁신으로 인해 다양한 소스에서 정보를 수집하는 것이 점점 더 가능해짐에 따라 의료산업에 침투하고 있는 빅데이터 분야의 최전선에 있으며 데이터는 생명공학에 적용할 수 있는 가장 중요한 영역 중 하나가 됐다”고 밝혔다. 

분석 도구, 인공 지능(AI) 및 머신러닝(ML) 기술을 사용한 빅데이터 분석으로 의료 비용을 절감하고 수익흐름을 개선하고 개인화된 의학을 개발하며 사전 예방적으로 환자 진료를 관리하고 있다.

의료 및 의료연구는 사용 가능한 풍부한 데이터 리소스에서 파생된 데이터 내에 숨겨진 연관성이나 패턴을 찾아 질병을 개선하는데 초점을 맞추고 있다.

기존의 의료데이터 분석은 예측력이 제한적이었지만 현재는 데이터 마이닝을 통해 다양한 차원 또는 관점에서 데이터를 분석하고 추출된 정보를 사용해 예측모델을 구축한다. 해당 과정을 통해 개별환자의 요구에 맞는 맞춤형 의료를 제공하고 질병의 진단 및 치료를 지원하는 자동화된 분석의 개발로 발전하고 있다.

 

빅데이터가 기업과 의료산업에 미치는 영향 [사진=한국바이오협회]
빅데이터가 기업과 의료산업에 미치는 영향 [사진=한국바이오협회]

빅데이터는 다양한 병원체에 대한 집단 내의 역학을 더 잘 이해하는데에도 기여한다. 면역감시센터는 정기적으로 빅데이터를 처리해 집단 내에서 풍토병이 될 위험이 높은 병원체를 식별하며 마찬가지로 전체 게놈 시퀀싱 및 전체 엑솜 시퀀싱 라이브러리와 같은 게놈라이브러리의 빅데이터는 데이터 기반 생물의학 발전을 가속화하는데 핵심적인 역할을 수행한다.

유전체학에서 빅데이터의 적용은 치료제 개발을 빠르게 변화시키고 있다. 단일세포 게놈 및 액체생검에서 종양 DNA의 전사체 시퀀싱을 포함한 유전체학의 최근 발전과 메타지노믹스는 이미 의학에 현저한 영향을 미치고 있다.

과거에는 세포나 동물에서 수행된 실험에서 질병과 관련된 경로 및 지식에 따라 약물이 개발되었지만 인간에게까지 적용이 되지 않은 경우가 있었다. 

유전적 변이가 있기 때문에 종의 차이와 생물학적 및 기술적 변수를 고려하여 추론하기 위해 빅데이터가 필요하다. 유전체 빅데이터를 기반으로 환자에게 개별화되거나 개별화될 수 있는 치료방법의 개발을 도와주고 있다.

인간게놈 서열은 유전적인 지시가 인간의 생물학적 기능으로 어떻게 이어지는지 이해하기 위한 기초다. 환자집단의 유전적 프로파일을 평가하고 질병의 위험 및 치료적 접근 및 반응과 관련된 패턴을 식별하기 위해 국제 이니셔티브가 착수됐다.

The Cancer GenomeAtlas(TCGA)는 여러 질병 부위의 표본을 배열하고 암과 관련된 유전적 변형에 대한 심층적인 이해를 얻기 위해 미국 국립 보건원과 국립 인간 게놈 연구소에서 시작한 프로젝트다. 

국제 HapMap 프로젝트는 인간 게놈 변이의 패턴을 식별하고 약물 또는 환경요인에 대한 반응을 포함해 건강 및 질병에 대한 영향을 결정하기 위한 프로젝트로 미국, 유럽, 중국 및 일본이 참여했다.

 

빅데이터에 활용되는 기술은?

멀티오믹스의 데이터 소스 및 응용 [사진=한국바이오협회]
멀티오믹스의 데이터 소스 및 응용 [사진=한국바이오협회]

오믹스 기술은 정교한 생체정보 분석을 필요로 하는 빅데이터를 생성하며 많은 세포와 조직에 걸쳐 많은 세포 구성요소를 상세하게 연구할 수 있게 했다. 고품질의 오믹스 데이터 가용성은 건강 및 질병의 생물학적 조건의 여러 계층을 이해하는데 크게 기여했으며 멀티오믹스를 통해 여러분야에 걸쳐 데이터를 통합함으로써 생명과학 연구가 가속화됐다. 

다중 오믹스 접근방식의 데이터 통합은 생물학적 조건의 여러 데이터 레이어(게놈, 전사체, 후성 유전체 등)의 결과를 결합해 다각적 판독을 제공하고 실제로 여러 그룹에서 다중 오믹스 데이터를 성공적으로 사용하여 생물학적 표현형을 프로파일링하고 다양한 질병 메커니즘에 대한 이해를 얻었다.

메타분석 개념 [사진=한국바이오협회]
메타분석 개념 [사진=한국바이오협회]

메타분석은 비특이적이거나 또는 신뢰성이 낮은 구성요소를 제거하고 동일한 데이터 유형의 데이터 세트에서 공유되는 가장 빈번한 신호를 증폭시키는 것을 목표로 한다.

데이터 세트의 품질이 이미 낮은 경우 다중 오믹스 접근방식을 사용하면 잘못된 결과를 발생할 수 있는 위험을 감소시킬 수 있다. 예를 들어, 질병과 관련된 데이터 세트가 생성되면 각 데이터 유형에 대한 메타분석을 결합한 다음 통합하는 것이 다중 오믹스 분석을 수행하는 가장 정확한 방법일 수 있다.

공동발현 분석의 생물학적 해석 및 결과 [사진=한국바이오협회]
공동발현 분석의 생물학적 해석 및 결과 [사진=한국바이오협회]

세포 기능에는 메커니즘이 작동하는 데 필요한 RNA 및 단백질 구성 요소를 인코딩하는 유전자 네트워크가 필요하지만 어떤 유전자가 어떤 기능과 관련되어 있는지 결정하는 것은 어려울 수 있다.

공동발현 분석은 유사한 특성을 공유하는 유전자 클러스터를 식별하는 데 사용할 수 있으며 잠재적으로 세포기능을 제어하는 동일한 네트워크에 관련되어 있음을 나타낸다. 공동발현 분석 접근방식을 통해 전사 인자와 같은 조절 요소 및 메틸화와 같은 후성 유전학적 변형을 식별할 수 있다.

 

빅데이터 기술 활용 및 연구 기업은?

[사진=에비드넷 홈페이지]
[사진=에비드넷 홈페이지]

에비드넷은 의료 빅데이터를 바탕으로 질병현황, 약물 처방 빈도, 수술 빈도, 검사 빈도 등의 메타데이터 분석 및 패턴정보를 제공하는 EVIX-INSIGHTTM 플랫폼 개발을 완료했다.

신테카바이오는 전 세계 다양한 인종, 수천 명의 유전체시퀀싱 데이터를 마하 슈퍼컴퓨팅 기술로 분석을 수행하고 있으며 자체 기술인 Adiscan 엔진으로 3가지의 DB인 대립유전자깊이정보, 유전형질정보, 반수체정보를 생성한다. 유전체 빅데이터를 생성하고 운영하는 시스템은 암 약물선별 및 희귀질환 진단과 같은 병원 정밀의료를 위해 활용되어 질병 연관성 검증에 역할을 하고 있다.

테라젠바이오는 첨단 유전체 분석 기술을 바탕으로 맞춤형 진단 및 솔루션과 차세대 염기서열 분석(NGS) 임상 검사, 의료 빅데이터 등의 서비스를 제공하고 있으며 유전자 분석 기반의 암 위험도 예측, 약물 기전 파악, 맞춤형 항암제 선별 등이 가능한 알고리즘을 개발해 특허를 취득했다.

쓰리빌리언은 인공지능 유전변이 해석 시스템을 활용해 10만 개의 유전변이에서 병원성 변이를 판별하고 동시에 환자가 가지고 있는 증상이 알려진 7000여 개의 유전질병과 상관성이 있는지 검정하는 과정을 통해 최종 진단하는 서비스를 제공하고 있다.

이외에도 국내 여러 기업들이 빅데이터 기술을 활용한 플랫폼 개발이나 진단·분석 서비스 등을 제공하고 있다.

 

“데이터 이질성, 이해관계자 갈등 등 문제 해결해야” 

빅데이터의 광범위한 사용을 촉진하기 위해서는 대규모 데이터 세트의 복잡한 특성을 작업하고 서로 다른 데이터 유형을 통합하는 가장 효율적인 방법을 식별하는 등의 주요 장애물을 극복해야 한다. 

멀티오믹스, 메타분석, 공동발현 분석 모두 대규모 복잡한 데이터에서 정보를 추출하는 것을 기반으로 한다. 데이터 간의 이질성, 데이터 이해 관계자 간의 갈등, 데이터 소유권, 데이터 개인정보 보호 및 무결성 등 생물의학 연구의 빅데이터 분야에서 많은 시급한 과제가 존재하고 있다. 

한국바이오협회 바이오경제연구센터 박봉현 책임연구원은 “생물의학 연구에서 빅데이터를 개선하기 위한 몇 가지 실행 가능한 접근으로 ▲데이터 형평성을 촉진하고 정크데이터의 중복성과 과부하를 최소화하기 위해 기업, 산업 및 데이터 생성 팀 간의 협업 촉진 ▲컴퓨터 엔지니어, 데이터과학자, 생물의학 과학자 및 임상의사를 초빙하여 학제 간 팀, 부서 및 센터 구축해야 한다”며 “▲약물 파이프라인에 적용할 수 있도록 규제기관의 AI-ML 모듈 및 방법 승인 ▲TCGA와 같은 범용적 고가치 데이터 세트 축적에 대한 자금 지원 ▲높은 처리량 컴퓨팅 및 머신러닝 접근에서 얻은 결과의 투명성 및 재현성 발전 등의 조치가 포함될 수 있다”고 제안했다.


      • 회사명 : 헬코미디어
      • 서울특별시 마포구 월드컵로10길 5 2층
      • 대표전화 : 02-364-2002
      • 청소년보호책임자 : 이순호
      • 제호 : 헬스코리아뉴스
      • 발행일 : 2007-01-01
      • 등록번호 : 서울 아 00717
      • 재등록일 : 2008-11-27
      • 발행인 : 임도이
      • 편집인 : 이순호
      • 헬스코리아뉴스에서 발행하는 모든 저작물(컨텐츠, 기사)는 저작권법의 보호를 받는 바, 무단·전재·복제·배포 등을 금합니다.
      • 「열린보도원칙」 당 매체는 독자와 취재원 등 뉴스이용자의 권리 보장을 위해 반론이나 정정보도, 추후보도를 요청할 수 있는 창구를 열어두고
        있음을 알려드립니다. 고충처리인 이슬기 02-364-2002 webmaster@hkn24.com
      • Copyright © 2022 헬스코리아뉴스. All rights reserved. mail to admin@hkn24.com
      ND소프트
      편집자 추천 뉴스
      베스트 클릭
      오늘의 단신