네이버㈜가 올해 3월 11일 출원(출원번호 제1020200029989호)하고 3월 18일 공개(공개번호 제1020200029425호)한 '딥 어텐션 네트워크를 이용하여 환자 의료 기록으로부터 질병 예후를 예측하는 방법 및 시스템'의 특허 요약문이다. 그림=키프리스 캡처
네이버㈜가 올해 3월 11일 출원(출원번호 제1020200029989호)하고 3월 18일 공개(공개번호 제1020200029425호)한 '딥 어텐션 네트워크를 이용하여 환자 의료 기록으로부터 질병 예후를 예측하는 방법 및 시스템'의 특허 요약문이다. 그림=키프리스 캡처

[비즈월드] 딥 어텐션 네트워크를 이용하여 환자 의료 기록으로부터 질병 예후를 예측하는 방법 및 시스템이 개시된다. 질병 예후 예측 방법은 환자의 의료 기록에 포함된 정보를 정보 유형 별로 각각 시퀀스(sequence) 형태로 표현해 시퀀스 데이터를 생성하는 단계와 상기 정보 유형 별 시퀀스 데이터에 대해 각각 분리된 어텐션 네트워크(attention network)를 이용한 학습 모델을 사용해 해당 환자의 질병 예후를 예측하는 단계를 포함한다.

네이버㈜가 올해 3월 11일 출원(출원번호 제1020200029989호)하고 3월 18일 공개(공개번호 제1020200029425호)한 '딥 어텐션 네트워크를 이용하여 환자 의료 기록으로부터 질병 예후를 예측하는 방법 및 시스템'의 특허 요약문이다.

고혈압(HBP), 당뇨, 고지혈증 등과 같은 성인병들은 전 세계적으로 중년들에게 매우 흔하게 나타나고 있는 질병 중 하나이다.

비록 성인병 그 자체가 건강에 치명적이지는 않더라도 이는 심각한 합병증을 일으킬 수 있어 꾸준한 관리와 주의를 필요로 한다.

특히 성인병은 사망의 주요 원인인 심장, 뇌, 혈관 질병과 같은 고위험 질병과 관련성이 매우 높다는 점이 지속적으로 보고되고 있다.

따라서 성인병 환자의 고위험 예후를 예측하는 것은 의료 분야와 바이오 기술 분야에서 매우 중요한 문제라고 할 수 있다.

현재 의료계 등에서는 고위험 예후 예측을 위해 연령, 성별, 현재 상태, 가족력 등의 정보를 이용한다거나, 바이오마커 유전자 발현량, CT 등의 의료 이미지, 혈액분석 등을 이용한 방법을 주로 사용되고 있다.

예를 들어 한국가학기술원이 2013년 1월 31일 출원(출원번호 제1020130011376호)하고 2015년 1월 9일 등록(등록번호 제101483284호) 받은 '질병 관련 단일염기다형성 조합 추출 방법, 질병 발생 위험도 예측 방법, 그리고 이를 이용한 질병 발생 위험도 예측 장치' 특허에는 분석 대상 질병에 관련된 단일염기다형성(single nucleotide polymorphism, SNP) 조합을 기초로 사용자의 질병 발생 위험도를 예측하는 기술이 개시되어 있다.

고위험 예후 예측을 위한 기존 방법에서 사용되는 데이터들은 종류도 다양할 뿐 아니라 전처리 등의 데이터 처리 과정이 복잡하기 때문에 필요한 데이터를 확보하는데 많은 시간과 노력, 비용을 필요로 한다.

이런 가운데 네이버㈜가 환자의 상징적인 병력 시퀀스와 의약 코드만으로 고위험 질병의 발병을 예측할 수 있는 어텐션 모델(Medical History-based Prediction using Attention Network (MeHPAN))을 제공하고 이를 바탕으로 질병의 예후를 정확하게 예측할 수 있는 발명을 내놓았다.

올해 3월 11일 출원(출원번호 제1020200029989호)하고 3월 18일 공개(공개번호 제1020200029425호)한 '딥 어텐션 네트워크를 이용하여 환자 의료 기록으로부터 질병 예후를 예측하는 방법 및 시스템'의 특허가 그것이다.

이 특허는 네이버가 2018년 4월 24일 출원(출원번호 제1020180047497호)했던 특허를 분할출원한 것이다.

분할출원이란 복수의 실체를 가지는 발명에 관해 하나의 출원을 한 경우, 그 출원의 내용 중 일부에 관해 출원범위를 나눠 별도로 출원을 하는 것을 말한다. 이는 최초 출원이 '1발명 1출원주의 원칙'에 위반돼 등록을 거절 받을 수 있을 경우 이용하게 된다.

또 출원자가 출원 당시 생각하지 못했다가 나중에 스스로 처음 출원을 여러 출원으로 분할하고 싶을 때 이용하기도 한다.

예를 들어 특허 청구범위 가운데 등록이 쉬워 보이는 일부를 분할출원으로 먼저 등록을 받고 나머지 청구범위는 별도로 신청하고자 할 때 이용하는 것으로 하나의 출원으로 둘 이상의 특허권을 등록할 수 있는 제도이다.

원출원은 최초 2019년 12월 27일 거절결정을 받았고 재심사됐지만 결국 2020년 2월 27일 다시 거절을 결정받았다.

네이버 측은 이에 끝나지 않고 기존 연구 결과를 바탕으로 2020년 3월 11일 분할 출원해 특허 취득에 대한 열의를 보였다.

분할 출원한 발명은 진단, 투약, 임상에 대해 각각 분리된 RNN(Recurrent Neural Networks) 혹은 CNN(Convolutional Neural Networks) 모델을 적용하고 중요한 역할을 하는 인자를 명확히 식별하기 위해 어텐션(attention) 모델을 적용한다.

질병 예후 예측을 위한 모델 구조를 개선하기 위해 진단·투약의 기간 정보를 명시적으로 모델에 반영한다.

이를 위해 컴퓨터로 구현되는 질병 예후 예측 방법에 있어서 환자의 의료 기록에 포함된 정보를 정보 유형 별로 각각 시퀀스(sequence) 형태로 표현해 시퀀스 데이터를 생성하는 단계와  상기 정보 유형 별 시퀀스 데이터에 대해 각각 분리된 어텐션 네트워크(attention network)를 이용한 학습 모델을 사용하여 해당 환자의 질병 예후를 예측하는 단계를 포함하는 질병 예후 예측 방법을 제공한다.

해당 환자의 의료 기록은 진단 기록과 투약 기록을 포함하고, 상기 생성하는 단계는 진단 기록에 대해 진단 코드 시퀀스, 진단 기간 시퀀스, 방문 종류 시퀀스를 생성하고 상기 투약 기록에 대해 투약 코드 시퀀스, 투약 기간 시퀀스, 투약 유형 시퀀스를 생성한 후 상기 학습 모델에 입력 가능하도록 임베딩 할 수 있다.

다른 측면에 따르면 상기 학습 모델은 RNN(Recurrent Neural Networks) 혹은 CNN(Convolutional Neural Networks) 모델로서 상기 시퀀스 데이터의 연속 패턴을 학습할 수 있다.

상기 학습 모델은 상기 시퀀스 데이터의 연속 패턴을 학습하는 GRU(Gated Recurrent Unit)와 상기 GRU의 출력을 이용해 컨텍스트 벡터를 계산하는 어텐션을 포함할 수 있다.

또 다른 측면에 따르면 상기 학습 모델은 상기 시퀀스 데이터의 연속 패턴을 학습하는 1차원 컨볼루션(1D convolution)과 상기 1차원 컨볼루션의 출력을 이용해 컨텍스트 벡터를 계산하는 어텐션을 포함할 수 있으며 상기 어텐션은 2단 FFN(feed forward network)을 이용해 구성될 수 있다.

이런 과정을 거쳐 환자의 상징적인 병력 시퀀스와 의약 코드만으로 고위험 질병의 발병을 예측할 수 있는 어텐션 모델(MeHPAN)을 구현할 수 있다고 네이버 측은 설명했다.

이 발명의 예들에 따르면 진단, 투약, 임상에 대해 각각 분리된 RNN 혹은 CNN 모델을 이용하고 중요한 역할을 하는 인자를 명확히 식별하기 위해 어텐션 모델을 적용함으로써 보다 정확한 예후를 예측할 수 있도 있다고 한다.

진단·투약의 기간 정보를 명시적으로 모델에 반영함으로써 질병 예후 예측 모델의 구조를 더욱 개선해 명확한 예측 결과를 제공할 수 있다고 네이버 측은 전했다.

새로운 발명이 정식 특허로 인정받기 까지는 많은 시행착오가 있다. 인류의 영원한 숙제인 질병 없이 오래 살 수 있는 꿈을 실현하기 위해 이번에 네이버가 첨단 기법을 활용해 개발하고 공개한 특허가 앞으로의 연구에 도움이 되기를 기대해 본다.

관련기사

저작권자 © 비즈월드 무단전재 및 재배포 금지