※ 이글은 한국조사기자협회가 연간지로 발행하는 2010년 '조사연구' 제22호에 실린 글임을 알립니다.

 

뉴스콘텐츠 분류 표준화 시대 오나?

유영식 YTN·한국NewsML포럼 분류분과위원회 간사

 


뉴스 포맷 표준 현황

디지털로 콘텐츠가 생산되는 뉴스산업의 ‘표준화’는 유럽과 북미 메이저 뉴스통신사와 언론사가 주도하는 IPTC(국제언론통신협의회, International Press Telecommunications Council)를 통해 이미 30여 년 전부터 진행되어 왔다. ‘IPTC 7901’은 텍스트로 된 와이어(wire) 뉴스를 전송하기위해 1979년에 발표한 최초의  표준포맷이었고, XML을 기반으로 텍스트 뉴스를 메타데이터와 함께 전송하는 NITF(News Industry Text Format)도 1998년에 표준포맷으로 제정된다. NITF는 와이어, 신문, 인터넷, PDA 등 어떤 채널로도 전송이 용이하며, 아직까지도 북미 언론사를 중심으로 뉴욕타임즈, AP, AFP, LexisNexis 등에서 사용하고 있다. 

그렇지만 이전의 뉴스 표준 포맷은 텍스트 뉴스를 위한 것이었고, 다양한 형태로 생산되는 멀티미디어 뉴스콘텐츠를 바쁘고 정확하게 전송하고, 인터넷 웹 사이트와 모바일 서비스도 동시에 지원하는 표준 포맷이 필요하게 된다. 이에 IPTC는 뉴스콘텐츠에 XML을 적용한 NewsML을 제정 발표하였고, 이 NewsML은 이후 10여 년 동안 뉴스산업 국제 표준 포맷으로 광범위하게 사용되고 있다. NewsML은 텍스트, 사진, 그래픽, 애니메이션, 동영상 등 뉴스콘텐츠 미디어 특성에 독립적으로 교환할 수 있고, 여러 뉴스콘텐츠를 묶어서 패키징하거나 개인화된 뉴스 서비스를 지원한다. 또한 뉴스산업에 필요한 메타데이터의 분류 표준과 통제어휘(Controlled Vocabulary)도 함께 제공한다.   

IPTC는 웹 2.0(Web 2.0)과 시멘틱 웹(Semantic Web)을 뉴스콘텐츠에 접목하기 위한 뉴스표준 포맷으로 ‘IPTC G2-표준’을 2008년 2월에 제정 발표한다. G2-표준은 입체적인 뉴스 패키징, 맞춤형 뉴스 서비스, 의미론적 지식기반 서비스를 지원한다. G2-표준은 NewsML-G2, EventML-G2, SportsML-G2 3개의 표준포맷으로 구성되며, 뉴스 아키텍처(News Architecture)를 공통 프레임워크로 사용하고 있다. NewsML-G2는 NewsML 1.x와 비교해 훨씬 간결하고 명확하게 뉴스콘텐츠를 처리하며, 뉴스에 딸린 부가정보(인물, 기관·기업, 지역, POI)를 통해 뉴스소비자에게 지식기반 서비스로 제공한다. EventML-G2는 대형사건 뉴스를 입체적으로 제공할 때 사용하는 포맷이며, SportsML-G2는 스포츠 경기결과나 통계자료를 뉴스콘텐츠와 함께 전달할 수 있는 포맷이다.
국내 NewsML 표준 도입 현황은 G2-표준이 아닌 NewsML 1.2를 기반으로 2010년 11월 현재 서울·지역 일간지(조선일보, 한겨레신문, 경향신문, 세계일보), 지역주간지, 언론재단 등 00곳에서 표준으로 채택하여 사용하고 있다.

 

뉴스 아키텍처와 IPTC G2-표준 구성 요소

 

 

뉴스 포맷 표준의 산업 효과

 

다른 산업도 마찬가지겠지만, NewsML이라는 뉴스 표준의 도입이 비용 절감을  일차적으로 발생시킨다. 언론사 내부적으로 통일된 표준포맷으로 뉴스제작, 편집, 관리, 배포, 출판, 아카이브가 됨으로써 시스템 관리 비용이 획기적으로 줄어든다. 또한 다양한 뉴스콘텐츠를 다양한 채널(디바이스)로 전달하는 ‘통합뉴스룸’이 NewsML을 도입함으로써 별도 비용 없이 개발되는 장점이 있다. 나아가 NewsML이 국제적 표준이기 때문에 세계시장 진출을 위한 사업기회도 자연스럽게 주어진다. 

과거 신문이나 잡지, TV뉴스 제작을 위해 일회성으로 콘텐츠가 사용됐지만, 이제는 멀티채널(웹, 모바일, DMB, IPTV 등)로 뉴스가 소비된다. 모든 언론사가 다양한 형태(텍스트, 사진, 그래픽, 동영상 등)의 뉴스콘텐츠를 서로 다른 포맷으로 전송하면 뉴스산업 전체로 볼 때 교환과 유통 구조가 매우 복잡해진다. 이를 받아 2차 유통을 하는 언론사 웹사이트, 포털사이트, 뉴스신디케이트, 콘텐츠유통업체는 복잡한 유통체계를 통일하기위한 시간과 인력을 투입해야한다. 그러나 서로 약속된 ‘표준포맷’으로 콘텐츠를 생산하고 유통한다면, 뉴스산업 전체적으로 볼 때 비용 절감이 효과가 매우 클 수밖에 없다. 

다음으로는 NewsML을 도입함으로써 ‘메타데이터 표준화’를 통해 뉴스콘텐츠를 다양하게 묶어서 제공할 수도 있고, 고객의 요구에 맞게 맞춤형 서비스를 제공할 수 있다. 즉, NewsML의 메타데이터는 뉴스의 내용을 설명하거나 관리를 위해 필요하지만, 이를 통해 뉴스를 입체적으로 전달하고 뉴스소비자가 요구하는 형태로 뉴스와 부가정보를 제공해 한 차원 높은 서비스를 제공할 수 있다. 예를 들어, 노무현 전 대통령의 서거 소식과 같은 대형사건이 생겼을 때, 사건 기사 본문만 아니라 관련 사진, 그래픽, 동영상을 묶어서 전달하고, 그의 발자취와 관련된 배경 정보, 자세한 인물 프로필을 함께 서비스할 수 있다. 또한 전직 대통령의 서거 관련 기사들을 언론사 아카이브에 있는 모든 형태의 콘텐츠를 함께 이용할 수 있게 참조 목록을 링크로 제공할 수도 있다.

NewsML이 국내뿐만 아니라, 국제적 표준이라는 것에 대해서는 누구도 이의를 제기하지 않는다. 국내에서는 NewsML을 언론사 자체적으로 도입을 결정했거나, 신문발전위원회, 지역신문발전위원회를 통한 외부지원으로 도입한 곳까지 53개 언론사가 표준으로 채택하고 있다. 2010년 6월 언론진흥재단의 지원을 통해 중앙일보, 국민일보, 일간스포츠, 내일신문 등 10여개의 언론사가 추가적으로 NewsML 도입을 결정했다. 이런 NewsML 도입 추세는 2006년 국내 처음 소개한 이후로 빠른 속도로 ‘뉴스 포맷 표준’으로 정착하고 있으며, NewsML 기술 도입 자체가 이제는 이슈가 되지 않는다는 반증이다. 작년부터 국내 ‘뉴스 포맷 표준화’ 이슈는 NewsML 도입에 따라 IPTC 주제분류를 어떻게 활용할 것인지, 한국형 Ks뉴스코드를 제대로 활용할 수 있게 해달라는 요구로 이동하고 있다. 

올바른 IPTC 주제분류 활용법

IPTC 주제분류(SubjectCode)는 NewsML을 도입한 언론사가 이 표준에 따라 뉴스를 분류하고, 전 세계 모든 언론사가 공통의 주제분류체계를 가지면, 글로벌한 콘텐츠 유통과 교환이 용이하다는 목적에서 출발했다. 도서 분류에서 국제분류표인 듀이 십진분류법(DDC)를 사용하는 것과 같은 취지이다. 그러나 국내 NewsML 도입 초기부터 작년까지도 한국NewsML포럼과 몇몇 언론사들의 고민은 기존 언론사 고유의 기사 주제분류표를 버리고, IPTC 주제분류로 전환해야 하는지에 대한 논의가 활발했다. IPTC 주제분류가 유럽·북미 문화가 강하게 스며든 분류체계로 국내에는 매우 낯설었기 때문이었고, 기존에 기사분류체계를 바꿔야하는 실무부서의 고충과 경제적인 비용 발생이 예상됐기 때문이었다.

그렇지만 IPTC에 가입된 해외 언론사의 주제분류 적용 사례를 수집한 결과, NewsML 도입 언론사가 자사 분류체계를 버리고, IPTC 주제분류 표준으로 전환해야 한다는 주장은 오해라는 결론에 도달하게 된다. 즉, 오랫동안 사용한 언론사 고유 기사분류표가 여전히 유효하다면 그대로 사용하되, 교환과 유통을 위해 NewsML 문서를 전송할 때는 IPTC 주제분류도 함께 제공할 수 있으면 되는 것이다. 물론 이런 경우에는 IPTC 주제분류를 위한 별도의 인력이 필요하지만, 현 언론사 환경에서 업무 인력보다는 자동분류시스템을 활용해 자사 분류체계와 IPTC 주제분류간 매핑(mapping) 작업을 자동화하는 것이 더 현실적이고 합리적인 방법이라 판단된다. 

또 다른 뉴스분류 Ks뉴스코드

 

흰 바탕에 검은 선과 숫자로 구성된 바코드는 계산대에 선 고객의 줄을 줄이기 위해 도입했지만, 이후로 판매 실적, 거래 동향, 재고량, 유통경로를 파악할 수 있는  ‘유통 혁명’의 아이콘으로 자리 잡았다. 뉴스산업에서 바코드와 같이 ‘뉴스 유통의 혁명’을 가져 올 것으로 기대되는 것이 바로 ‘뉴스코드(NewsCode)’이다. 뉴스코드는 NewsML을 도입한 개별 언론사나 국가별 언론단체가 뉴스산업에 필요한 메타데이터 분류 정보과 부가 정보를 콘텐츠와 함께 유통하기 위해서 고안한 것이다. Ks뉴스코드는 그간 국내 언론사에서 중요하게 취급해온 인물, 기관·단체, 기업, 상품, 지역 등을 국내 언론환경에 맞게 확장한 ‘한국형 뉴스코드’이다. 

 

NewsML을 채택한 모든 언론사가 표준화된 Ks뉴스코드 값을 NewsML 문서에 바코드처럼 포함시킨다면, 국내 뉴스시장 유통에 지각변동을 일으킬 것이다. Ks뉴스코드의 활용 사례를 하나 들어 보자. 어떤 기사 본문에 ‘김대중’이라는 인물명이 있다면 이 인물이 ‘전 대통령’인지, ‘조선일보 고문’인지, 어느 대학의 ‘교수’인지 사람이 기사를 읽어보지 않으면 알 수 없다. 그러나 NewsML 문서에 Ks뉴스코드 값으로 KsPeople(인물)의 ‘020002’라는 코드 값이 포함되었다면, 이 뉴스는 ‘김대중 전 대통령’의 기사임을 시스템에서 쉽게 처리할 수 있다. 또한 김대중 전 대통령의 프로필까지 부가정보로 함께 제공할 수 있는 것이다.

 

이런 장점을 가진 Ks뉴스코드가 NewsML을 도입한 국내 언론사가 점차 증가함에 따라 이것을 활용해 뉴스콘텐츠의 부가가치를 향상시키려는 현업의 요구들이 하나 둘 발생하기 시작했다. 이에 한국NewsML포럼은 Ks뉴스코드가 국내 뉴스산업에 획기적 변화와 활력을 가져올 것으로 예상하고 Ks뉴스코드를 언론사 현업에서 많이 활용하고 적용할 수 있도록 2009년 한 해 Ks뉴스코드를 대대적으로 정비하였고, 2010년에는 작년에 작업한 Ks뉴스코드에 1만6천여 건에 대한 하나하나 변동사항을 대조하고, 필요한 Ks뉴스코드를 추가로 입력하는 업데이트 작업을 완료했다. 특히 인물의 경우, 지방선거와 재보궐 선거로 인한 변동과 추가, 인물 직책 변동, 기업의 경우 신규 상장업체 반영 등의 작업이 있었다.

   

뉴스분류 표준화는 이미 시도 중

 -뉴스산업 발전을 위한 공적투자 절실

 

글로벌 뉴스 표준인 NewsML은 도입의 단계를 넘어서 이미 정착의 단계로 진입하고 있다. NewsML을 도입할 시기에는 표준이 제공하는 기술과 도입 방법에 포커스가 맞춰졌지만, 정착의 단계로 들어서자 표준을 활용해 뉴스콘텐츠 부가가치를 향상시키거나, 이를 활용한 비즈니스 모델을 찾고자 한다. 그 중심에 뉴스콘텐츠의 다양한 분류 표준인 Ks뉴스코드가 있다. Ks뉴스코드를 언론사 현업에서 적극 활용될 때 뉴스 표준인 NewsML 도입 효과가 극대화 된다. 그러나 대부분 언론사가 갈수록 경영여건이 열악하고 Ks뉴스코드를 이용해 콘텐츠 분류 전문인력을 지원하지 못하는 현실은 Ks뉴스코드 정착과 활성화에 큰 장애물이다. 이러한 어려움을 풀기위한 해법은 국가 차원에서 ‘Ks뉴스코드 자동분류시스템’을 공적 투자로 만들어 주고, NewsML을 도입한 언론사가 무료로 언제나 이용할 수 있도록 지원해야 한다. 이러한 요구에 따라 2009년 신문발전위원회에서 추진했던 ‘Ks뉴스코드 자동분류시스템’이 개발 적격업체가 없어서 유찰된 사례는 매우 애석한 일이었다. 2011년에는 뉴스 표준인 NewsML 활성화, Ks뉴스코드를 활용한 분류표준을 현업에서 활용하기 위해 국내 뉴스산업 발전을 위해 다시 추진해 줄 것을 요청한다. 또한 NewsML을 통한 통합뉴스룸 소프트웨어와 신문제작시스템을 공급하는 밴더들이 Ks뉴스코드를 언론사가 사용할 수 있도록 시스템에 적용하는 것도 중요하다.  

Ks뉴스코드가 ‘한국형 뉴스 분류 표준’으로 정착해 국내 뉴스산업에서 꽃을 피우기 위해서는 NewsML을 채택한 언론사들이 서로 협력해서 Ks뉴스코드를 활용하여 뉴스콘텐츠에 적용, 활용할 수 있어야 한다. ‘분류 표준화’가 단지 획일적이고 규격화된 것을 의미하기 보다는, 뉴스산업을 발전시키고 뉴스콘텐츠와 뉴스소비자의 접점을 확대시키는 수단이 되도록 Ks뉴스코드를 유지 관리하는 것이 매우 중요하다. 그러기 위해서 Ks뉴스코드 메타데이터 세트들이 지속적으로 최신의 것으로 유지되어야 하고, 세부 항목에 대한 동의어 처리, 시소러스 매핑 작업, 나아가 뉴스코드 항목을 컴퓨터가 자동적으로 추출하는 ‘Ks뉴스코드 자동분류시스템’에 대한 공적 투자가 선행되어야 한다. 수년간 Ks뉴스코드를 최신의 것으로 업데이트하고, 뉴스 소비자가 필요로 Ks뉴스코드를 확장하고 질 높은 부가정보를 지속적으로 축척하게 되면, 시맨틱 웹에 부합하는 ‘한국형 뉴스 지식기반 시스템’이 탄생하게 된다. 이러한 청사진이 현실화되려면 NewsML을 도입한 언론사들의 협업이 매우 중요하며, 명실상부한 뉴스산업의 공공재(公共財) 역할을 수행하기 위한 국가적 지원 또한 절실히 필요하다. 

 

 

블로그 이미지

한국조사기자협회

사단법인 한국조사기자협회는 1987년 국내의 신문, 방송, 통신사의 조사, 정보, 자료, DB업무를 담당하는 조사기자들의 모임으로 출범하여, 2009년 회원들의 연구활동에 기초한 신문 및 방송 발전에 기여할 목적으로 사단법인으로 재출범하였으며, 언론공익활동으로 신문논술대회, 조사연구 발간, 세미나·토론회, 보도연감 출판 등의 사업을 하고 있는 언론단체입니다