Posts 의료인공지능에 대한 개괄적 소개와 의료인공지능 사업에 대한 이해 - Part 4
Post
Cancel

의료인공지능에 대한 개괄적 소개와 의료인공지능 사업에 대한 이해 - Part 4

의료인공지능에 대한 개괄적 소개와 의료인공지능 사업에 대한 이해 - Part 4

돈을 줄 것이냐 말 것이냐. 그것이 문제로다.

NPJ Digital Medicine에 이런 글이 올라왔습니다. 이 글을 보며 미국 의료인공지능의 최신 업데이트를 보험 수가 관점에서 살펴보도록 합니다.

용어 정리

  • NHS : National Health Service. 영국의 보건의료제도
  • SaaS : Software-as-a-Service.
  • CMS : Centers for Medicare and Medicaid Services. 미국 보험청
  • IIPS : Inpatient Prospective Payment System. 입원 환자(inpatient)들의 처치 및 관리를 위한 지불 방식(Medicare Part A로 산정됨)
  • OPPS : Outpatient Prospective Payment System. 외래 환자(outpatient)들의 처치 및 관리를 위한 지불 방식(Part B로 산정됨)
  • MPFS : Medicare Physician Fee Schedule. 미국의 의사보상수가
  • CPT : Current Procedural Terminology. 미국 보험 코드
  • HCPCS : Healthcare Common Procedure Coding System. CPT를 포함하는 넓은 범위의 의료 행위 코드
  • AMA : American Medical Association. 미국의사협회
  • ICD : International Classification of Disease. 국제표준 질병코드
  • MS-DRGs : Medicare Severity Diagnosis Related Groups. 포괄수가제
  • NTAP : New Technology Add-on Payment. 미국의 신의료기술 보상제도
  • APC : Ambulatory Payment Classification. Medicare program상에서 외래 환자들에 행해지는 서비스에 대한 미 정부의 지급 방식
  • MTG : Medical Technology Guideline.
  • DG : Diagnostic Guideline.
  • RVU : Relative Value Units. 상대점수

Introduction

AI 제품들은 영상의학을 바꿔 놓고 있습니다. 200개가 넘는 인공지능 제품들이 FDA의 승인(clearance)를 받았고 이들의 적응증 및 사용처는 다양합니다. 이미지 해석을 도와주는 AI 제품들은 정확도와 민감도(sensitivity)를 올려주어 더 양질의 진료를 받을 수 있게 해줍니다. 이러한 자동화를 통해서 또한 의사들간의 의견의 차이를 줄여주기도 합니다.

인공지능 제품들이 영상의학에 있어서 이미지의 해석을 메인으로 담당하기는 하지만, 이미지 해석이 아닌 분야에서도 AI 제품들은 효용성, 안정성, 질을 높일 수 있습니다. 예를 들면 3D MRI 이미지의 노이즈를 제거해주는 것과 같이요. 혹은 환자 순서를 바꿔서 중증 환자를 먼저 검사 및 처치하게 할 수도 있습니다.

이러한 유망한 인공지능 기술들이 많기는 하지만 널리 쓰이게 하기 위해서는 좀 장벽들이 있습니다. AI 제품을 영상의학의 workflow에 통합시키는 것은 복잡하고 time-consuming합니다. 영상의학과 의사들과 다른 AI 소프트웨어 유저들은 AI가 요구하는 workflow에 대한 심적, 물리적 저항을 가지기도 하겠죠. 병원과 영상의학과 입장에서는 돈이 되는 것이 중요할수도 있습니다.

누가 그래서 인공지능에 돈을 쓸 것이냐는 것은 AI 제품들을 영상의학에 녹이는 데 있어서 필수적인 질문입니다. 인공지능에 돈을 주기 시작한다면 전체적인 의료 비용은 상승할 것이니까요. 혁신적 기술에 대한 지불을 하게 된다면 두 가지 상황이 발생할 수 있습니다. 첫 번째는 우리가 예상하는 대로 혁신적 기술을 의료에 녹여낼 수 있는 긍정적인 측면이지만, 두 번째로 부정적인 측면은 의료 공급자들이 더 많은 돈을 벌기 위해서 혁신 기술을 오남용하는 사례가 생길 수 있지요. 따라서 헬스케어 시스템은 AI 제품들 또한 적재적소에서 딱 맞게 사용되는 임상적 상황을 세팅해야 합니다. 이것이 어려운 부분이지요.

인공지능 영상의학 제품들에 돈을 주는 방식은 아주 초기의 시기입니다. 미국에서는 매우 적은 수의 영상의학 AI 제품들이 지불을 받고 있습니다. 영국이나 일본의 경우에는 SaaS와 같은 방식으로 AI 제품들에 지불을 하고 있고요.

이 글에서 저자들은 영상의학 AI 제품들이 미국 시장에서 어떻게 보상받고 있는지를 다룹니다.

영상의학 AI 제품들에 대해서 보상받을 수 있는 경로는 이미 존재합니다.

CMS는 입원 환자(IPPS)와 외래 환자(OPPS)에 대한 지불 방식을 통해 의료 서비스에 대한 보상을 진행합니다. 뿐만 아니라 MPFS를 통한 방식도 있지요.

이 세 가지 측면을 통해서 지불하는 시스템은 세 가지 요소로 구성됩니다: 코드, 보상 범위, 보상. 코드는 알파벳 순서의 코드를 통해 서비스나 기술을 묘사합니다. 적절한 코드를 가지는 것은 그에 대한 보상이 가능할 수 있다는 것을 암시하죠. 새로운 기술이 코드로 결정되었다면 CMS는 언제 어떤 상황에서 서비스나 기술이 지불 가능할지를 결정합니다. 이것이 보상 범위입니다. 보통 CMS는 “필수적이고 합리적인”경우에만 보상 범위를 설정하곤 합니다. 마지막으로, CMS는 얼마만큼의 금액을 보상할지를 결정하곤 합니다.

OPPS와 MPFS는 CPT code 상에서 보상을 지급하고, 이는 HCPCS의 부분집합입니다. CPT code는 AMA에 의해서 만들어지고 관리됩니다. IPPS는 ICD 코드를 사용합니다.

입원 환자 서비스들은 헬스케어 서비스들을 임상적으로 비슷한 상황에 따라 묶고 MS-DRGs를 통해 지불합니다. 새로운 헬스케어 서비스들이 입원 환자에게 적용가능할 것으로 사료되면 NTAP을 통해서 보상하기도 하죠. 이는 3년간 한시적으로 MS-DRG에 추가적으로 지불되는 금액입니다. NTAP은 CMS에 의해서 2001년 처음 소개되었고 의료비가 비싼 혁신적 기술을 보상하기 위해 창조되었습니다. NTAP하에서 승인된 기술들은 세 가지 조건을 필요로 합니다.

  • 기술은 3년 이내에 개발된 것일 것
  • 기술의 비용은 MS-DRG상에서 적절하게 보상받고 있지 못할 것
  • 기술은 현존하는 기존 기술에 비해서 잠재적으로 더 나은 임상적 예후를 보일 것

OPPS는 APC라는 또 다른 grouping 제도를 사용합니다. 새로운 일회성 물리적 의료기기는 FDA 승인 이후 2-3년간 추가적인 지불을 받을 수 있습니다. CMS는 New Technology APCs라는 항목도 가지고 있어서 적절한 데이터가 모일 때까지 신기술을 사용할 수 있게 제도도 만들어 놓았습니다. New Technology APC를 만족하려면 서비스는 다음 기준을 만족해야 합니다:

  • 서비스는 정말로(truly) 새로워야 하고
  • 전통적 방법에서는 적절히 보상받지 못하며 구별되는 시술이어야 하고
  • 의학적으로 합리적이고 필수적이어야 함

MPFS는 grouping을 하지 않습니다. 대신, 지불 방식들은 각 CPT마다 RVU를 가지고 있는데 이는 의사의 리소스가 얼마나 들어가냐에 따라 산정됩니다. AMA는 CMS를 위해 RVU 제안을 하고, 이는 CMS가 보정한 다음 지불하게 됩니다. 새로운 서비스는 AMA가 새로운 CPT 코드를 만들도록 하고, 이 때 CMS는 AMA RVU 제안서에 따라 지불을 결정하게 됩니다.

다른 나라들도 비슷한 제도와 기관을 많이 가지고 있습니다.

  • 영국의 MedTech Funding Mandate (MTFM), MTG, DG
  • 독일의 Neue Untersuchungs- und Bvehandlungsmethoden (NUB), Einheitlicher Bewertungmassstb (EBM), Gemeinsamer Bundesausschuss (GBA)
  • 일본의 Pharmaceutical and Medical Devices Agence (PMDA)

적은 비율의 제품들만이 보상받는다.

지난 5년간, 200개가 넘는 FDA-approved 영상의학 소프트웨어 제품들 중 8개가 CMS에 의해서 평가되었습니다.

1

두 개의 제품들은 반려당했고, CMS는 나머지 6개에 대해서 보상과 지불 결정을 내렸습니다. 한 개는 NTAP이고, 다섯 개는 OPPS, 하나는 MPFS에 해당됩니다.

입원 환자 세팅에서의 기수른 잠재적 임상 예후 향상 기준을 만족시켜야 하는데 이는 좀 어렵습니다.

Untitled

CMS는 세 개의 NTAP 요청 중 두 개를 반려했고, ContaCT (Vis LVO라고도 불립니다.) 만이 입원 환자 세팅에서 사용 가능합니다. 이는 거대 혈관 폐색 (Large vessel occlusion; LVO) 을 자동으로 CT에서 찾아주는 알고리즘입니다. ContaCT의 임상적 근거는 LVO의 진단까지 걸리는 시간이 줄어든다는 것을 보여주었습니다. 빨리 진단하면 빨리 치료하고, 그렇다면 환자의 예후는 좋아질 테니까요.

하지만 2021년에 CMS는 Rapid ASPECT의 NTAP 신청을 거절했습니다. 이는 뇌졸중이 있는 환자들의 뇌조직을 분석해주는 소프트웨어입니다. 이 제품을 만든 RapidAI에서는 reader study를 통해 Rapid ASPECT score과 radiologist reported ASPECT score를 비교하여 유저들간에 variability가 감소했다는 것을 증명했습니다. RapidAI는 또한 이집트에서 전향적 연구를 하여 Rapid ASPECT가 치료까지 걸리는 시간을 줄여주었다는 것도 증명하였습니다. CMS는 이 시간의 감소가 잠재적으로 임상적 예후가 좋아질 것이라는 판단을 하지 않았습니다.

그러나 CMS가 지불하는 방식은 미국에서는 아주 초기의 시기이며, 지금까지 CMS가 평가한 FDA 승인 영상의학 소프트웨어 제품 중 8개만이 보상과 지불 결정을 받게 되었습니다. 이를 보면 적은 비율의 제품들만이 보상을 받는 것으로 나타납니다. 이에 대해서는 CMS에서 입원 환자 세팅에서의 기술의 잠재적 임상 예후 향상 기준을 만족시켜야 하기 때문에 어려움이 있습니다.

2021년에 CMS는 NTAP을 신청한 Aidoc의 Briefcase를 반려했는데, 이는 폐 색전(pulmonary embolism; PE)를 CT 조영술에서 찾아주는 소프트웨어입니다. Aidoc은 Briefcase가 의사에게 notification을 더 빨리 줄 수 있다고 주장하는 후향적 연구를 제출하였습니다.

이 기기는 또한 출간되지는 않았지만 Aidoc Briefcase 도입 전후의 분석 결과를 제출했는데, 입원 기간의 감소와 사망률의 감소를 입증했다고 주장했습니다. 이러한 주장들에도 불구하고 CMS는 의사가 수동으로 환자 우선순위 변경을 하는 것과 같은 세팅보다 우월하다고 판단하지 않았기 때문에 잠재적인 임상적 예후 향상이 아니라고 판단헀습니다.

CMS가 내린 결정은 영상의학 인공지능 제품들이 입원 환자 세팅에 있을 때는 임상적 효용성 뿐만 아니라 임상적으로 내리는 결론들을 향상시킬 수 있어야 한다는 맥락입니다. 즉, 임상적 결정이 워크플로우 말단에서 그것만 영향을 줘서는 안되고 downstream하게 결정이 내려와야 한다는 것을 의미하죠. 의심의 여지 없이 연구의 질은 매우 중요하고 이는 Aidoc Briefcase에서 표준 치료 방침이 아닌 다른 방법과 비교했다는 것이 실책이 되었다는 말이기도 합니다.

이렇게 입원 환자들에게서 매우 적용이 힘든 것에 비해 외래 세팅에서는 조금 더 수월합니다.

IMG_1082.jpg

위 표에서 나오는 HeartFlow가 그 예시입니다. 이 회사는 관상동맥 혈류를 정량화하는 소프트웨어를 가지고 있는데, randomized controlled study와 non-randomized cmoparative study를 통해서 견고한 근거를 확보하였습니다. 이 회사에서 내놓은 소프트웨어는 관상동맥 혈류가 관상동맥 조영술 CT에서 당사의 제품을 통해 뽑아내는 것이 침습적인 pressure-wire 기반 측정방법과 견줄만 하다는 것을 입증하였습니다. 연구들은 HeartFlow가 진단에 드는 비용을 감소시킬 수 있고 비침습적인 방법으로 침습적인 방법을 대체할 수 있다는 것을 보였다는데 의의가 있습니다. HeartFlow의 제품은 또한 MedTech를 통해 영국에서, 그리고 일본에서도 추천받는 상황입니다.

LiverMultiScan, MRI로부터 간의 병증을 정량화하는 것을 도움주는 소프트웨어는 현재 최선의 진단법(gold-standard)인 침습적 간 생검과 비교했을 때 더 정확하게 찾아낼 수 있다느 것을 임상 연구를 통해 증명하였습니다. 이 제품은 전향적인 연구 또한 진행하였습니다. HeartFlow와는 다르게, LiverMultiScan은 간 생검을 할 필요가 없다는 진짜 근거를 제시하지는 않았지만, 암시적으로 그러한 가능성을 보여주었다는데 강점이 있습니다. Optellum의 Lung Cancer Prediction (LCP) 제품은 암일 것 같은 폐결절과 암이 아닐 것 같은 페결절을 기존의 임상 모델들보다 더 잘 예측할 수 있다는 것을 입증하였습니다. MRCP+라는 소프트웨어는 magnetic resonance cholangiopancreatography (MRCP)를 통해서 담도의 폐색을 정량화하는 소프트웨어이고, 마지막으로 Cleerly labs의 관상동맥 분석 소프트웨어느 관상동맥 폐색을 CT 관상동맥조영술에서 찾아내고 침습적인 과정을 제거할 수 있는 시술입니다.

CMS는 이 다섯 기술에 대한 임상적 근거를 매우 엄밀하게 검토하지는 않았습니다. 왜냐하면 외래 상황에서느 “임상적으로 잠재적 향상이 있”을 필요는 없기 때문입니다. 이 기술들이 서로 다른 층위의 근거를 가지고 있기는 하지만 공통적인 면이 있습니다: 이들의 대부분은 다르게는 불가능했던 임상적 정보를 영상에서 주거나, 기존 이미지 기술에서 부가적인 진단적 정보를 줍니다. 예를 들어서, HeartFlow, LiverMultiScan, Cleerly labs는 영상의학과나 타과 의사를 도와서 원래는 하지 못했던 이미지에서의 정보 추출을 해냅니다. HeartFlow와 Cleerly labs는 관상동맥 폐색을 예측해주고, 이는 기존에는 침습적인 방법으로만 가능헀었습니다. 반면 LiverMultiScan은 간 조직검사의 결과를 예측해줄 수 있는 진단적 도구입니다. Optellum LCP 제품은 기존의 폐암 예측 모델들보다 더 우월함을 보였고 이로부터 직접적인 증거는 없지만 불필요한 생검을 줄이고 페암의 진단적 정확도를 높일 수 있는 가능성이 있습니다. 따라서, 이러한 제품들은 환자와 보험사에게 잠재적 이득을 주고, 이는 아마도 CMS의 결정에 영향을 미쳤을 것으로 사료됩니다.

인공지능 알고리즘을 보상할지의 여부에 대한 프레임워크

인공지능을 영상의학에 적용할 수 있을지의 핵심적 질문은 누가 인공지능 제품에 돈을 쓸 것인가에 대한 것입니다. 지불하는 측에서는 혁신적인 기술을 통해 의료비 지출을 향상하는 것과 그럴만한 가치가 있는지 사이의 줄다리기를 해야 합니다.

전향적으로 지불하는 방식이 혁신적인 기술에 지출을 더 함으로 효율화가 증가하지 않는다는 것은 잘 알려진 사실입니다. 전향적 지불 방식은 역사적으로 그렇지 못했습니다. 이는 흔히 다음 두 시나리오 중 한 가지를 야기하곤 합니다: 첫 번째로 지불하는 측의 총 비용이 증가하거나, 두 번째로 그냥 혁신적 기술에 돈을 쓰지 않는 것 둘 중 하나를 야기하고는 합니다.

영상의학 인공지능 제품들은 2017년 말 6개 제품에서 폭발적으로 늘어 2022년 11월 210개의 제품들이 FDA 승인을 받은 상황입니다. 이 제품들은 제품마다 드는 비용이 다 다릅니다. 몇은 판독의 일관성을 높일 뿐이고, 다른 몇은 의사들이 영상에서 추출하지 못하는 정보들을 추출해내므로 비용도 달라지는게 맞겠죠. 제품들은 누가 득을 보는지에 따라서도 다릅니다. 몇 인공지능 제품은 자동 측정화와 같은 방식으로 의사를 돕고, 몇은 실제로 예후를 좋게 함으로 환자들과 사회가 이득을 보게 만드는 방식입니다. 따라서 제품들마다 그 임상적 가치가 모두 다릅니다. CMS의 2002년 결정 중 computer-aided detection(CAD)중 유방촬영술(mammography)돈을 주는 방식은 유방촬영술 CAD의 사용을 폭발적으로 늘렸습니다. 2001년 전체 유방촬영술의 5% 미만이 CAD로 판독되었지만 2008년에는 74%가 CAD로 판독되었습니다. CAD의 사용으로 인해 증가한 비용은 연간 4억 달러($400 million)입니다. 연구들은 CAD를 통해 진단적 정확도 향상이 없다고 주장했고 이로부터 CMS는 유방촬영술 screening 검사에 이들을 모두 합병시켰습니다.

따라서, 어떤 영상의학 제품에 돈을 써야 할 지 결정하는 것이 중요합니다.

저자들의 지식 수준에서 지불하는 측은 영상의학에 딱 맞는 그러한 기준을 만들지는 못했다고 합니다. 한국은 영상의학 인공지능 제품에 대한 지불 방식을 문서화한 첫 나라라고 합니다. 이 문서는 영상에서 기존에 발견하지 못했던 정보를 발견하거나 예후를 예측하는 등의 새로운 imaging biomarker를 발견해야 하고 임상적 유효성이나 비용 효과성을 입증해야 한다고 주장합니다. 이 문서는 하지만 아직 확실한 정책적 근거로 자리잡지는 못헀습니다.

영상의학 인공지능 제품이 돈을 받을만한 것이냐를 판단하는 기준을 만드는데 있어서, 저자들은 두 가지 측면이 중요하게 고려되어야 한다고 말합니다: 첫 번째는 그러한 응용 제품이 가져올 잠재적 이득을 고려해야 하는 것을 말합니다. 이전에 논의했듯 영상의학 인공지능 제품은 본질적으로 모두 가치가 다르고 다양한 층위에서 이득을 가져올 수 있습니다. 또한 누가 이득을 볼 지도 다릅니다. 따라서 이러한 서로 다른 가치를 잘 메겨야 한다는 것을 말합니다. 두 번째는 이러한 이득이 생긴다는 주장에 대한 연구적 근거를 잘 판단해야 한다는 것입니다. 즉, 적당한 불확실성 하에서 직간접적인 이득을 가져온다는 것을 잘 판단해야 한다는 것입니다.

스압이 너무 심하네요. 다음 편에서 좀 더 이야기하고 이번 편은 여기서 마치도록 하겠습니다.

To be continued…

1편 읽기

2편 읽기

3편 읽기

This post is licensed under CC BY 4.0 by the author.

의료인공지능 오마카세 Week 8 - ChatGPT는 의사의 업무를 줄여줄까요?

의료인공지능 오마카세 Week 9 - 인생은 실전이야