표=특허청
표=특허청

[비즈월드] 특허청(청장 이인실)은 2월 13일부터 키프리스플러스(KIPRISPlus, plus.kipris.or.kr)를 통해 특허공보에 포함된 의약품 실험데이터와 실험데이터 추출을 위한 인공지능(AI) 학습데이터 총 44만7000건을 무료로 개방한다고 밝혔다.

키프리스플러스(KIPRISPlus)는 특허청이 운영하는 데이터 개방플랫폼으로서 국내외 13개국 주요 산업재산권(특허·상표·디자인) 공보와 특허행정 정보 등의 데이터 상품을 제공하고 있다.

최근에는 다국어 번역, 이미지 검색 등을 위한 인공지능(AI) 학습데이터까지 개방해 총 115종의 데이터 상품을 파일 또는 공개에이피아이(OpenAPI) 형태로 개방하고 있다.

여기서 ‘공개에이피아이(OpenAPI : Open Application Programming Interface)란 표준화하여 구축된 데이터를 실시간으로 호출해 누구나 쉽게 활용할 수 있는 공개 인터페이스를 의미한다. 

이번에 개방하는 의약품 실험데이터는 의약품 분야의 특허공보에 포함된 그림(image) 형태의 표를 가공·분석해 의약품 성분명, 실험방법, 실험값 등을 데이터베이스(database)로 구축한 정보이다.

특허청(청장 이인실)은 2월 13일부터 키프리스플러스(KIPRISPlus, plus.kipris.or.kr)를 통해 특허공보에 포함된 의약품 실험데이터와 실험데이터 추출을 위한 인공지능(AI) 학습데이터 총 45만건을 무료로 개방한다고 밝혔다. 표=특허청
특허청(청장 이인실)은 2월 13일부터 키프리스플러스(KIPRISPlus, plus.kipris.or.kr)를 통해 특허공보에 포함된 의약품 실험데이터와 실험데이터 추출을 위한 인공지능(AI) 학습데이터 총 45만건을 무료로 개방한다고 밝혔다. 표=특허청

인공지능(AI) 학습데이터는 ▲표·그래프·화학식 등 다양한 그림(image) 형태의 실험데이터에서 표 형태만을 추출하기 위한 이미지 분류 정보 ▲표 데이터를 정확하게 파악하기 위한 표 구조(행×열) 정보 ▲실험에 사용된 성분명, 실험값 등을 자동분류하기 위한 실험데이터 속성 분류 정보를 포함하고 있다.

이런 의약품 실험데이터와 인공지능(AI) 학습데이터를 활용하면 특허·논문 등에 포함되어 있는 그림(image) 형태의 ‘표 실험데이터’를 문자 형식(text)의 분석 가능한 데이터로 변환 추출할 수 있다.

이를 기반으로 지식재산 서비스 업체들은 특허공보의 실험데이터 추출·활용 서비스를 개발하고, 관련 기업과 연구기관들은 특허공보에 포함된 실험 실시예, 비교예 등을 자유롭게 분석 활용해 백신·신약 등 연구개발에 활용할 수 있을 것으로 예상되고 있다.

김기범 특허청 정보고객지원국장은 “기술 정보의 보고인 특허데이터는 실험데이터와 같이 유용한 정보가 많아 공공과 민간에서 적극 활용한다면 미래를 이끌어 갈 첨단 기술 분야에서 우리나라의 기술개발 역량이 제고되고 글로벌 경쟁력은 더욱 강화될 것이다”면서 “특허청은 적극행정의 일환으로 국민의 수요에 맞춘 다양한 지식재산 데이터를 지속적으로 개방해 나갈 것이다”라고 말했다.

[비즈월드=정영일 기자 / zprki@bizwnews.com]

관련기사

저작권자 © 비즈월드 무단전재 및 재배포 금지