이번에도 같은 문제 발생됐는데도 '수수방관'
지휘보고체계도 허술…초보적인 기술 예방조치도 않해

특허청의 특허정보검색서비스인 ‘키프리스(kipris)’ 서비스가 2시간 동안이나 마비되는 현상이 발생해 이용자들이 큰 불편을 겪었다. 서비스가 정지된 특허청 '키프리스'. 사진=비즈월드
특허청의 특허정보검색서비스인 ‘키프리스(kipris)’ 서비스가 2시간 동안이나 마비되는 현상이 발생해 이용자들이 큰 불편을 겪었다. 서비스가 정지된 특허청 '키프리스'. 사진=비즈월드

[비즈월드] 특허청의 특허정보검색서비스인 ‘키프리스(kipris)’ 서비스가 25일 오전 2시간 동안이나 마비되는 현상이 발생해 이용자들이 큰 불편을 겪었다.

이런 상황인데도 특허청 담당 공무원은 해당 서비스가 운영되지 못하고 있는 상황을 보고받지 못하는 등 관리감독의 부실이 그대로 드러나 개선책 마련이 시급한 것으로 드러났다.

25일 특허청과 키프리스의 위탁운영을 담당하고 있는 한국특허정보원에 따르면 이날 오전 8시 30분쯤부터 미국 쪽 IP로 확인되는 특정 서버에서 다수의 크롤링이 집중됐다. 결국 총 4대의 특허청 키프리스 서버 가운데 1대가 마비되는 사태가 발생했다.

여기서 크롤링(crawling)이란 웹사이트(website), 하이퍼링크(hyperlink), 데이터(data), 정보 자원을 자동화된 방법으로 수집·분류·저장하는 것으로 이를 위해 개발된 소프트웨어를 이용해  크롤러(crawler)하는 것을 의미한다. 

크롤러는 주어진 인터넷 주소(URL)에 접근해 관련된 URL을 찾아내고, 찾아진 URL들 속에서 또 다른 하이퍼링크(hyperlink)들을 찾아 분류하고 저장하는 작업을 반복함으로써 여러 웹페이지를 돌아다니며 어떤 데이터가 어디에 있는지 색인(index)을 만들어 데이터베이스(DB)에 저장하게 된다. 

크롤링과 유사 개념으로 소프트웨어를 통해 대상 웹사이트와 같은 데이터 소스에서 데이터 자체를 추출, 특정 형태로 저장하는 스크래핑(scraping) 또는 데이터 스크래핑(data scraping)이 있다. 빅데이터 분석에서는 크롤링을 통해 필요한 데이터가 어디 있는지 알아내고 이를 스크래핑을 통해 수집·저장해 분석에 사용하는 것처럼 두 기술을 결합하는 방식으로 사용하기도 한다.

문제는 크롤링 기술을 악용해 정보를 무단으로 복제하게 되면 지식재산권 침해 소지가 발생할 수 있다는 것이다. 또 이번 키프리스 마비 사태처럼 특정 시간에 특정 서버에 과부하가 발생해 서버가 정지하기도 한다.

키프리스의 경우 이런 햔상이 발생하면 한국특허정보원 담당자는 특허청 주무관에게 해당 사실을 알리고 이 주무관이 정부서버센터에 연락을 취해 특정 IP의 차단을 막고 정지된 서버를 복구한다. 이런 과정을 거치는 동안 허비된 시간이 30분 이상었다. 

게다가 더 큰 문제점은 전 세계 불특정 다수인에게 공개된 ‘키프리스’의 경우 언제나 ‘크롤링’ 등의 위험에 노출되어 있는데도 이에 대한 조치를 전혀 취하기 않았다는 부분이다.

일반적으로 크롤링 위험에 있다고 판단되면 사전에 웹 페이지 소유자는 웹 페이지에 로봇 배제 표준(robots exclusion standard)을 사용해 접근 제한에 대한 설명을 robots.txt에 기술하거나 ‘noindex’ 메타 태그(meta tag)를 사용해 크롤러로 검색 색인이 생성되는 것을 차단하도록 하는 등의 기본적이고 쉬운 기술을 적용하는데도 특허청은 이를 수수방관하고 있었던 것이다.

결국 이런 크롤링으로 서버 정지가 최근에도 이미 한 차례 이상 발생했는데도 특허청이나 위탁 운영기관인 한국특허정보원 측은 강 건너 불구경하듯 대책 마련을 미뤄오면서 사태를 키웠다는 비난을 받게 됐다.

[비즈월드=정영일 기자 / zprki@bizwnews.com]

저작권자 © 비즈월드 무단전재 및 재배포 금지