※ 이글은 한국조사기자협회가 연간지로 발행하는 2010년 '조사연구' 제22호에 실린 글임을 알립니다.

"우리 아카이브팀 이렇게 돌아가요∼"

- YTN 아카이브팀 김빈나

 

갑작스럽게 추워진 날씨로 몸이 움츠려든 요즘 다들 안녕들 하신지요. 온도가 급격하게 떨어졌는데 다들 감기 조심 하세요. 조사기자협회 모임에 꼭 나간다는 마음만 앞서고 선배님들을 자주 찾아 뵙고 많은 교류를 해야 하는데, 그러지 못해서 죄송할 다름입니다. 협회 모임에 처음 갔던 어리숙한 막내였을 때가 엊그제 같은데 벌써 몇 해가 지나 저도 어느덧 삼십 줄에 접어드네요. 되돌아보니 YTN이라는 회사에 입사해 사옥도 이전하고, 조사기자협회 회원이 되어 여러 모임과 행사도 참가하였습니다. 또한 회사 내에서도 아카이브 시스템화 작업 등 참 여러 일들이 주마등처럼 지나가네요.

 

그래서 오늘은 제가 YTN의 아카이브 시스템에 대해서 말씀드리고자 합니다.

 

YTN 아카이브시스템은 2009년 6월부터 2010년 1월까지 MAM(Media Asset Mangement), 인제스트, DTL(Digtal Tape Library) 등 SI업체 ‘쌍용정보통신’과 MAM 전문개발업체 ‘코난테크놀러지’ 등과 함께 시스템을 구축하였습니다. 아카이브시스템을 관리하는 영상아카이브팀이 신설되었고, 인력조직으로 팀장 1인과 팀원 7인으로 구성되었습니다.

영상아카이브팀 내에서 하고 있는 일은 크게 인제스트, 아카이브, 메타데이터 정리 및 분류, 자료실 내 관리, 송출 등을 담당하고 있습니다.

 

 

 

 

YTN 아카이브시스템의 주요 특징은 세 가지로 나눌 수 있는데, 첫 번째는 웹 방식의 MAM 시스템입니다. NLE 장비 호환성과 웹 전송 등의 IP베이스를 얻을 수 있게 되었습니다. 두 번째는 테입리스 (Tapeless)시스템 입니다. 영상취재, 인제스트, 영상편집, 송출, 아카이브까지 ‘MXF‘의 단일화된 표준 파일로 사용됩니다. 세 번째는 파일럿 (pilot) 시스템입니다. 2013년 상암동 신사옥 완공 때까지의 통합 방송시스템 구축 이전단계입니다. 뉴스제작에 필수적인 기능만 제공하는 시스템이라는 점입니다.

 

■ 인제스트


P2, XDCAM과 테입자료, DVD, MPEG, AVI 등의 디지털영상을 YTN의 방송용 단일포맷 ‘MXF’로 변환을 하는 단계입니다. 24시간 뉴스방송을 행하고 있는 YTN은 빠르고 정확한 뉴스 전달을 위해 편집을 먼저 하고나서 인제스트 업무를 나중에 하는 방식인데요. 이것은 먼저 카메라기자가 취재한 영상은 방송을 내보내기 위해 편집 과정을 거치고 그 촬영원본을 인제스트 하는 것입니다. 인제스트 할 경우 필요에 따라 전체를 하는 경우도 있고, 부분적으로 불필요한 영상을 잘라내어 중요한 영상만 작업을 하는 경우도 있습니다. 예를 들어, 시민 인터뷰, 취재기자 스탠드업, 기타 중요도가 떨어지는 영상은 잘라내어 인제스트 할 경우 불필요한 영상까지 전체 영상을 보관함으로써 축적되는 공간을 줄일 수 있습니다.

 

‘NLE를 통한 인제스트’를 하고 있습니다. 시간이 실시간으로 드는 단점이 있긴 하지만, NLE(Edius)를 통해 표준포맷 ‘MXF’ 파일으로 변환해 MAM에 바로 영상을 등록할 수 있는 장점이 있습니다. 또한 PC에 NLE 프로그램만 설치 되어있다면 언제든지 인제스트를 할 수 있습니다. 물론 인제스트는 아카이브팀의 담당이지만, 카메라기자, 영상편집자 등 다른 이용자들도 NLE를 통해 손쉽게 인제스트가 가능합니다.

매일 인제스트 되고 있는 영상은 평일 기준 600~700건, 주말 300~400건이 되며 비율은 촬영원본이 가장 많이 차지하고 있으며, 외신, 편집본, 온에어 등의 순서대로 생성되고 있습니다.

 

■ 아카이브


아카이브 업무는 YTN 내에서 영상아카이브팀 만이 가질 수 있는 고유 권한입니다. 인제스트 완료된 데이터들이 일주일 후에 자동 아카이브 되어 스토리지에서 DTL(Digtal Tape Library)로 옮겨지게 됩니다. 여기에서 수동적으로 해줘야 할 업무가 있는데, 불필요한 영상 삭제입니다. 이 작업은 불필요한 영상을 삭제한 상태로 최종 아카이브 함으로써 공간을 확보하기 위한 작업입니다.

 

‘리스토어’라는 업무가 있습니다. 스토리지에서 일주일이 경과되어 DTL(Digtal Tape Library)에 보관된 지난 영상 파일을 뉴스에 방송하기 위해 다시 스토리지로 가지고 오는 작업입니다. 이용자들이 필요한 영상 파일을 리스토어 하면 일정 시간이 경과되어 스토리지에 영상 파일이 옮겨지게 되며 다운로드 혹은 NLE로 연동시켜 바로 그림을 확인하고 편집할 수 있습니다.

 

■ 메타데이터 정리 및 분류


YTN은 취재영상에 대한 메타데이터 입력 및 수정, 보완 작업을 인제스트 단계에서부터  언론사 근무경력이 오래된 전문 인력이 담당하고 있습니다.
별도로 리포트․단신 등 편집완성본 메타데이터 입력은 1차로 등록자가 하고, 2차로 전문 인력이 수정․보완 작업을 해주고 있습니다. 메타데이터 입력을 전문 인력이 인제스트 단계에서부터 입력하기 때문에, 영상에 대한 충분한 메타데이터를 신속하게 사용할 수 있게 하고, 검색에 있어서 효율성을 높여주는 효과를 발휘하고 있습니다.

 

또한, 분류작업을 빼놓을 수 없습니다. 1차로 메타데이터 등록하는 등록자는 분류에 대한 전문적인 지식이 없는 상태이기 때문에 2차로 수정․보완 작업을 하는 단계에서 분류작업이 제대로 되었는지 체크하고 다중분류 등으로 좀 더 디테일한 분류를 함으로써 이용자들의 원활한 검색서비스에 도움을 주고 있습니다.

아카이브시스템에서 메타데이터는 단순히 검색서비스가 잘되기 위한 것이 아니라 이용자에게 맞춤형으로 다양한 영상 콘텐츠를 서비스하기 위한 매개체로서 메타데이터를 활용해야 합니다. 그래서 메타데이터가 없다면 영상 콘텐츠의 이용가치가 떨어지게 됩니다.

 

■ 자료실 관리

 

자료실 내부에서 테이프 자료들을 보관하고 있습니다. 아직 인원 문제로 디지타이징 작업이 본격적으로 시행되고 있지 않지만 이용자의 요청이나 중요도가 높은 자료들은 우선적으로 하고 있는 상황이고, 국회에서는 아직도 테입으로 촬영되고 있기 때문에 매일 생성되는 국회 테입 자료는 바로 바로 디지타이징 작업을 하고 있습니다. 2013년 신사옥으로 이전하기 전까지 자료실 내부에 있는 테이프들을 디지털로 전환하기 위해서 인력 및 장비 문제를 논의하고 있는 상황입니다.

 

■ 송출 수신


본래 영상편집팀에서 관할하고 있던 송출 수신 업무를 영상아카이브팀이 신설되면서 옮겨졌습니다. 중계차 및 각 방송사 송출 화면을 수신 받고 바로 뉴스 영상에 활용될 수 있도록 하고 있습니다.

 

이렇게 예전 영상자료실의 시스템과는 많이 바뀌였고 전문적인 업무량도 늘어있는 상태입니다. 단순히 자료를 보관하고 관리하는 부서가 아닌, 24시간 방송되는 뉴스를 위해서 효율적인 업무 분담과 빠르고 정확한 시스템 체계가 갖춰진 부서로 성장하였습니다. 물론 문제점이 남아 있지만 앞으로 보도정보시스템과의 원활한 소통으로 지역․해외 등 지사간의 시스템 연동 및 영상자료 정리 문제 등 해결해야 할 과제로 남아 있습니다.

 

 

블로그 이미지

한국조사기자협회

사단법인 한국조사기자협회는 1987년 국내의 신문, 방송, 통신사의 조사, 정보, 자료, DB업무를 담당하는 조사기자들의 모임으로 출범하여, 2009년 회원들의 연구활동에 기초한 신문 및 방송 발전에 기여할 목적으로 사단법인으로 재출범하였으며, 언론공익활동으로 신문논술대회, 조사연구 발간, 세미나·토론회, 보도연감 출판 등의 사업을 하고 있는 언론단체입니다

 ※ 이글은 한국조사기자협회가 연간지로 발행하는 2010년 '조사연구' 제22호에 실린 글임을 알립니다.

 

국내 검색 포털들의 분류체계 비교 분석
박소연 덕성여자대학교 문헌정보학과 부교수

 

1. 서 론

 

국내 포털들은 검색 이외에도 디렉토리, 블로그, 카페, 뉴스, 사전, 백과사전, 책, 쇼핑 등 수십 개의 다양한 서비스를 개발, 제공하고 있다. 이처럼 다양한 서비스에서 제공되는 방대한 정보자원의 효율적인 관리를 위하여 포털들은 전통적으로 디렉토리 서비스에 국한되었던 분류체계를 점차 다른 서비스들에도 확대, 적용하고 있는 상황이다. 체계적으로 구축된 분류체계는 이용자의 항해 및 탐색을 지원할 수 있다는 장점이 있다. 즉, 포털의 분류체계는 특정한 주제 분야나 주제 구조에 익숙하지 않은 이용자들에게 주제가 유사한 문서들을 쉽게 브라우징 할 수 있도록 지원하고, 검색에 이용될 질의에 대한 정황 또는 배경 정보를 제공하며, 탐색의 확장 및 축소를 용이하게 한다는 장점이 있다(Kosh 1997). 또한 포털 입장에서는 분류체계를 통하여 방대하고 이질적인 정보들을 효율적으로 관리하고, 분류체계에서 사용된 용어들을 검색 시 키워드로 활용할 수 있다는 장점이 있다. 따라서 국내 포털들이 분류체계를 다양한 서비스에 확장하고 있는 시점에 포털의 분류체계에 대한 체계적인 조사와 평가가 필요하다고 할 수 있다.

 

국내 포털들이 기타 서비스에 분류체계를 확장하기 시작한 것이 최근의 현상인 만큼 디렉토리 외 서비스의 분류체계에 관한 연구는 찾아보기 드문 실정이다. 이에 본 연구에서는 국내 주요 검색 포털들인 네이버, 네이트, 다음, 야후에서 제공하는 서비스들의 분류체계를 비교, 분석하고자 한다. 검색 포털들의 분류체계에 대한 평가는 다양한 기준에 의해서 수행될 수 있는데, 특히 동일한 포털에서 제공하는 분류체계들을 평가할 경우에는 분류체계의 일관성이 매우 중요한 평가 기준이라고 할 수 있다. 따라서 본 연구에서는 분류체계의 일관성 및 논리성에 초점을 두고, 실제 데이터의 상세한 분석에 근거하여 포털들의 분류체계 개선안을 도출하여 제안하고자 한다. 본 연구의 결과는 향후 포털들의 분류체계의 개선에 활용될 수 있을 것으로 기대된다. 즉 본 연구의 결과는 포털 업체들의 보다 체계적이고 일관성 있는 분류체계 구축에 기여할 것으로 기대된다.

 

2. 선행 연구

 

포털의 분류체계에 대한 대부분의 국내 선행 연구들은 디렉토리 서비스의 분류체계 분석에 치중해 왔다. 디렉토리와 관련된 국내 선행 연구들은 크게 전반적인 디렉토리 구축의 지침을 제시하는 연구와 특정한 주제 분야나 영역의 디렉토리 구조를 분석하고 개선 방안을 제시하는 연구로 구분될 수 있다. 전반적인 디렉토리 구조에 대한 연구로서, 남영준(1998)은 웹문서 분류체계의 설계 분류 원칙을 제시하고, 이에 따른 분류체계를 설계하였으며, 신동민(2001)은 디렉토리 구성, 주제 선정, 인터페이스, 유지관리 등을 위한 지침을 제시하였다. 박소연(2009)은 국내 주요 포털들의 디렉토리 서비스를 컴퓨터, 인터넷 분야를 중심으로 분석, 평가하고, 디렉토리 서비스 개선안을 제시하였다.

특정한 주제 분야별 연구는 교육학(이명희 2000), 군사학(오동근, 황재영, 배영활 2001), 기독교(김명옥 2007), 농학(김정현, 문지현 2002), 디자인(김형년 2004, 임경란 2004), 문화콘텐츠(김성희 2002), 문헌정보학(최재황 1998), 물리학(최희윤 1998), 산업(한상길 2001), 쇼핑(곽철완 2001), 어린이(배영활, 오동근, 여지숙 2008), 여성학(이란주, 성기주, 양정하 2001), 의학(정경희 2004), 정보통신기술(이창수 2000), 컴퓨터, 인터넷(김영보 1997) 등의 분야에 대한 연구를 들 수 있다.

국외 선행 연구들의 경우 포털의 분류체계를 분석한 연구는 찾아보기 어려운 실정이다. 웹 분류에 대한 최근 국외 연구들로는 웹 문서의 자동 분류(Li, Zhu, and Ogihara 2008), 웹 문서 분류를 통한 검색 시스템의 효율성 제고(Mengle and Goharian 2010), 패싯 분석을 활용한 웹 문서의 분류(Uddin and Janeck 2007) 등에 관한 연구들을 들 수 있다. 이들 대부분은 소규모의 웹 문서들을 대상으로 한 실험을 통해 수행되었다.

 

3. 연구 방법

 

본 연구에서는 국내 주요 검색 포털들인 네이버, 네이트, 다음, 야후를 대상으로 이들이 제공하는 서비스들의 분류체계를 분석, 평가하였다. 4개의 포털들을 선택한 이유는 이들의 인지도와 대중성 때문이다. 즉, 이들은 메트릭스, 코리안클릭 등이 수행하는 각종 방문자 수 조사 및 시장 점유율 조사에서 지속적으로 상위 5위에 포함되고 있다. 웹 사이트 평가 및 트래픽 분석업체인 인터넷 메트릭스(http://www.metrixcorp.com)에 따르면, 2010년 2월 기준으로 네이버, 네이트, 다음, 야후가 국내 검색 포털 부문 상위 5위에 포함되고 있다. 또한 이들은 NCSI(National Customer Satisfaction Index)의 최근 고객만족도 조사 인터넷포털, 검색서비스 부문에서 상위 5위권에 포함되고 있다.

본 연구에서는 국내 주요 포털들이 제공하는 서비스들의 분류체계를 분석, 평가하기 위하여, 인포메이션 아키텍처의 중요 개념들과(Rosenfeld and Morville 2002/2003) 선행 연구들에서(김영보 1997; 김명옥 2007; 김형년 2004; 신동민 2001) 사용되었던 디렉토리 서비스 평가 기준을 참고하여, 분류체계의 일관성과 논리성을 평가 기준으로 선정하였다.

위 기준에 근거하여 본 연구에서는 포털 서비스들의 분류체계에 대한 평가를 수행하였다. 평가를 위한 자료는 2010년 2월 셋째 주부터 3월 첫째 주까지 수집되었고, 평가 작업은 2010년 2월과 3월 동안 실시되었다. 연구의 일관성을 위하여 특정한 항목에 대한 평가는 네이버, 네이트, 다음, 야후를 대상으로 동시에 수행되었다.

 

4. 연구 결과

 

4.1 분류체계 제공 현황

본 연구의 조사 결과 2010년 2월 기준으로 주요 포털들의 통합검색 결과에 노출되는 서비스들의 개수는 20개에서 30개 사이로 나타났으며, 이 서비스들 중에서 분류체계를 제공하는 서비스들의 현황은 <표 1>과 같다. 네이버와 다음이 가장 많은 9개 서비스들에 대해 분류체계를 제공하고 있었으며, 모든 포털들이 공통적으로 분류체계를 제공하는 서비스들은 뉴스, 디렉토리, 쇼핑, 지식 검색 서비스였다. 이들 중 디렉토리, 뉴스, 지식 검색 서비스의 분류체계는 <표 2>부터 <표 4>까지와 같다.

 

<표 1> 포털별 분류체계 제공 현황

 

네이버

네이트

다음

야후

뉴스

뉴스

뉴스

뉴스

디렉토리

디렉토리

디렉토리

디렉토리

블로그

 

블로그

블로그

자료실

 

자료실

 

전문정보

 

전문자료

 

지식쇼핑

쇼핑

쇼핑하우

쇼핑

지식iN

Q&A

지식

지식

 

카페

클럽

카페

 

 

지역정보

 

 

 

 

 

이미지박스

9

7

9

6

 

포털명

네이버

네이트

다음

야후

서비스명

디렉토리

디렉토리

디렉토리

디렉토리

최종 계층

9

8

5

6

1단계 카테고리 수

13

17

15

14

1단계 카테고리명과

2단계 카테고리 수

뉴스, 미디어

18

게임

34

비즈니스, 쇼핑

66

뉴스와 미디어

46

엔터테인먼트

21

스포츠, 레저

113

교육, 학교

33

여가생활

21

교육, 학문

44

영화

23

컴퓨터, 인터넷

21

비즈니스와 경제

24

게임

30

인물

43

여행, 세계정보

22

엔터테인먼트

24

세계정보, 여행

16

컴퓨터, 인터넷

28

생활, 건강

42

교육

36

경제, 재테크

36

엔터테인먼트

14

정치, 사회

20

건강과 의학

45

사회, 정치

24

기업

77

인물

46

사회와 문화

28

기업, 쇼핑

57

뉴스, 미디어

21

뉴스, 미디어

9

컴퓨터와 인터넷

39

인물, 사람들

52

쇼핑

62

종교

19

정부

29

생활, 건강

40

정부, 공공기관

10

문화, 예술

15

예술

26

컴퓨터, 인터넷

34

생활, 건강

39

학문, 사전

15

자연과학

41

레저, 스포츠

24

문화, 예술

19

게임

15

인문과 사회과학

41

문화, 예술

19

여행, 지역정보

30

연예, 오락

10

지역정보

4

 

 

교육

34

경제, 재테크

22

참고자료

27

 

 

학문

32

스포츠, 레저

92

 

 

 

 

사회, 종교

13

 

 

 

 

 

 

경제, 재테크

23

 

 

 

 

포털명

네이버

네이트

다음

야후

서비스명

뉴스

뉴스

뉴스

뉴스

최종 계층

2

2

2

2

1단계 카테고리 수

10

10

8

7

1단계 카테고리명과

2단계 카테고리 수

정치

7

정치

7

사회

11

정치

7

경제

6

경제

8

정치

7

경제

9

사회

9

사회

11

사설/칼럼

5

사회

13

생활/문화

8

세계

7

경제

10

문화

9

세계

5

IT/과학

7

국제

10

IT/과학

7

IT/과학

5

칼럼

4

IT/과학

6

세계

7

문화/생활

11

연예

7

스포츠

8

연예

7

연예

7

 

 

연예

5

칼럼

6

 

 

 

 

플러스

8

이슈,토론장

5

 

 

 

 

날씨

7

스포츠

7

 

포털명

네이버

네이트

다음

야후

서비스명

지식iN

Q&A

지식

지식

최종 계층

4

3

3

4

1단계

카테고리 수

11

16

14

16

1단계 카테고리명과

2단계 카테고리 수

교육, 학문

21

컴퓨터·인터넷

13

컴퓨터, 인터넷

12

수능지식

3

컴퓨터통신

11

가정·생활·취미

13

게임, 오락

9

지역지식

16

게임

12

건강·의학

10

엔터테인먼트, 예술

13

과학

14

엔터테인먼트, 예술

16

교육·학문

17

쇼핑, 제품정보

17

게임

11

생활

13

경제·재테크

9

생활, 가정

18

건강

14

----------

 

여가생활,스포츠

14

엔터테인먼트

7

건강

13

스포츠, 레저

19

비즈니스, 경제

17

쇼핑·상품정보

13

사회, 정치

14

교육, 학문

10

엔터테인먼트

14

여행

7

경제

10

건강, 의학

10

사회

14

문화·예술

9

여행

2

금융, 재테크

11

꾸러기

15

사회·시사·공공

9

스포츠

7

사회, 문화

11

컴퓨터, 인터넷

13

게임

7

쇼핑

11

----------

 

교육

17

스포츠·레저

11

 

 

기업·비즈니스

10

여행, 해외정보

8

문화, 예술

14

 

 

어린이·호기심

9

지역정보, 교통

18

쇼핑

19

 

 

지역

16

고민상담

13

가정, 육아

14

 

 

고민상담

11

어린이 지식

8

생활정보

11

 

 

 

 

4.2 분류체계의 일관

 

일반적으로 분류체계는 일정한 분류 기준에 따라 조직되어 구조화, 체계화된 분류의 결과물 전체를 의미한다. 분류체계의 일관성은 분류 전개 기준의 일관성과 카테고리명 선정의 일관성으로 구분될 수 있다.

 

4.2.1 분류 기준의 일관성

 

조사된 포털들의 디렉토리, 뉴스 서비스에는 주제별 분류 기준이 쇼핑 서비스에는 상품별 분류 기준이 단일 기준으로 적용되고 있었다. 그러나 책 서비스와 카페, 지식 검색과 같은 커뮤니티 성 서비스의 경우에는 복수의 분류 기준이 동시에 적용되고 있었다. 네이트와 다음의 책 서비스에서는 주제, 도서 장르, 연령이 네이버 책 서비스에서는, 주제, 도서 장르, 연령, 지역 등의 여러 분류 기준이 적용되고 있었다. 또한 네이버 카페의 경우, 카페의 목적과 성격, 주제, 연령이 네이트 클럽의 경우, 카페의 목적과 성격, 주제가 함께 분류 기준으로 사용되고 있었다. 이처럼 특정 서비스 내에서 복수의 분류 기준이 적용될 시 분류체계의 일관성 및 논리성이 저하되고, 이용자의 혼란을 초래할 수 있을 것으로 보인다. 카페와 같은 커뮤니티 성 서비스의 경우에는 주제 외에도 카페의 목적과 성격이 중요한 분류 기준으로 활용될 수 있을 것이다. 그러나 복수의 분류 기준 사용이 불가피할 경우에도, 가급적 분류 기준의 수를 최소화하는 것이 바람직할 것으로 보인다. 또한 복수의 분류 기준이 적용된 카테고리들이 인터페이스에서 분산되어 있어 이 역시 이용자의 혼란을 초래할 수 있을 것으로 보인다. 이러한 문제점을 해결하기 위하여 미니그룹 등을 적절하게 사용하여 성격이 상이한 카테고리들을 시각적으로 분리하는 작업이 필요할 것이다. 또는 분류 기준별로 별도의 접근점을 제공하는 방안, 즉 패싯 분석을 적용하는 방안도 고려될 수 있을 것이다.

 

4.2.2 카테고리명의 일관성

 

인포메이션 아키텍처 분야에서 레이블링은 범주(카테고리)에 대해 이름을 붙이는 작업을 의미하며, 레이블링의 중요한 규칙으로는 레이블링의 명확성, 일관성, 구체성, 컨텐츠와 일치하는 레이블의 개발 등을 들 수 있다. 이 중 레이블링의 일관성은 카테고리명의 일관성과 레이블링 작업의 일관성으로 평가될 수 있다. 본 연구의 조사 결과, 동일한 포털에서 제공하는 분류체계들에서 카테고리명 선정 시에 동일한 개념에 대해 상이한 카테고리명을 사용하는 경우가 종종 존재하였다. 예를 들어, 다음의 디렉토리에서는 “연예, 오락”을 카페에서는 “엔터테인먼트”라는 카테고리명을 사용하고 있었으며, 네이버의 디렉토리에서는 “도서”를 블로그에서는 “책”이라는 카테고리명을 사용하고 있었고, 네이버 디렉토리에서는 “여행, 지역정보”를 책 서비스에서는 “여행과 지리”라는 카테고리명을 사용하고 있었다. 야후의 지식 서비스에서는 “컴퓨터”를 쇼핑 서비스에서는 “컴”이라는 약어를 사용하고 있었다. 또한 야후의 지식 서비스의 경우, “수능지식”, “지역지식”처럼 “지식”으로 종료되는 카테고리명과 “여행”, “지역”과 같이 주제명으로 종료되는 카테고리명이 공존하는 등, 동일한 서비스 내에서도 레이블링의 일관성이 떨어지는 경우가 발견되었다. 네이버 전문 정보 서비스의 “학술자료 > 의약학” 카테고리 하위의 14개 카테고리들의 대부분이 “내과학”처럼 “~학”으로 종료되는 카테고리명을 사용하고 있었으나, “보건” “외과”와 같이 주제명으로 종료되는 카테고리명도 일부 존재하였다.

이처럼 특정한 포털의 분류체계들에서 동일한 주제에 대해 상이한 카테고리명을 사용하는 것은 이용자들에게 혼란을 초래할 수 있고, 분류의 전문성을 저하시킬 수 있으므로, 이에 대한 개선이 요청된다.

 

4.3 분류체계의 논리성

 

분류체계의 논리성은 분류체계가 특정 주제 분야의 상하위간 인과관계, 항목 간의 균형성과 일관성에서 논리적이고 객관적인가를 의미한다(김영보 1997; 김형년 2004). 조사에 포함된 모든 포털들의 분류체계에서 논리성이 부족한 사례가 존재하였으며, 특히 학문 분야 분류에서 이러한 문제점이 공통적으로 발견되었다. <표 9>는 네이버 디렉토리, 카페, 전문정보 서비스의 상이한 학문 분류체계를 보여주고 있다. “인문과학”이 네이버의 디렉토리에서는 1단계의 “교육, 학문” 카테고리의 하위 카테고리로 존재하나, 카페에서는 “과학”과 통합되어 “인문/과학” 형태의 최상위 카테고리로 존재한다. 인문, 과학과 동등한 계층에 있어야할 사회 과학은 네이버 카페의 분류체계에 포함되어 있지 않으며, 공학과 의학은 “인문/과학”의 하위 카테고리에 포함되어 있다. 또한 철학, 천문학과 같은 특정한 학문 분야가 인문, 과학, 공학 등과 동등한 계층에 위치한 것도 분류체계의 비논리성을 보여주는 사례이다. 마찬가지로 네이버 전문정보 서비스에서도 경영, 경제, 정보통신과 같은 세부적인 학문 분야가 최상위 계층에 배치되어 있다. 네이버 디렉토리에서는 최상위 카테고리로 제시되었던 농학이 전문정보 서비스에서는 공학의 하위 카테고리로 분류되어 있는 등 전반적인 분류체계의 일관성에 있어서도 문제가 있는 것으로 보인다.

 

디렉토리 > 교육,학문

전문정보 > 학술자료

카페 > 인문/과학

공학

사회과학

인문

의학

자연과학

철학

농학

공학

자연/환경

인문과학

의약학

공학

사회과학

인문과학

과학

자연과학

경영,경제

천문학

 

문화예술

의학

 

정보통신

 

 

<표 5> 네이버 디렉토리, 전문정보, 카페 서비스의 학문 분류체계

 

네이트의 Q&A 서비스의 “교육, 학문” 카테고리 하위에는 학문과 관련된 2단계 카테고리로 “인문·사회과학,” “자연·공학,” “한국학” 카테고리가 제시되어 있다. 그런데 “한국학” 카테고리는 인문 사회과학 하위의 3단계 카테고리로도 존재하며, 2단계와 3단계에 중복하여 존재하고 있다. 또한 논리적으로 “한국학”은 “인문·사회과학”하위 카테고리로 존재하는 것이 적절할 것으로 보인다. 다음 디렉토리 최상위 카테고리인 “학문, 사전” 하위에는 차이가 분명하지 않은 “자연과학”과 “과학일반”이 함께 2단계 카테고리에 배치되어 있다. “과학일반”에는 15개의 소수 사이트들만이 등록되어 있으며, “자연과학” 카테고리의 총류성 카테고리로 볼 수 있으므로, “자연과학” 카테고리의 하부에 통합되는 것이 적절할 것으로 보인다.

네이트의 클럽 분류체계에는 “동창/동문,” “학생/동아리,” “친목/또래,” “회사/프로젝트,” “초/중/고/대학교”처럼 범위가 중복되는 카테고리들이 다수 존재하여 카테고리의 배타성 및 분류체계의 논리성에 있어서 문제점을 내포하고 있다. 네이버 카페에도 “지역,” “동창/동문,” “친목/모임”과 같이 범위가 중복되는 카테고리들이 존재하여 네이트 클럽과 유사한 문제를 가지고 있는 것으로 나타났다.

 

5. 결 론

 

본 연구에서는 분류체계 평가 기준을 설정하고, 이 기준에 따라 국내 주요 검색 포털들인 네이버, 네이트, 다음, 야후의 서비스 분류체계를 비교, 평가하였다. 조사 결과, 포털들이 제공하는 서비스들의 공통적인 문제점으로는 분류체계의 일관성 부족으로 나타났다. 좀 더 구체적으로 분류 전개 기준, 카테고리명 선정 등에 있어서 분류체계들 간의 일관성이 부족한 것으로 나타났다. 즉 동일한 포털에서 제공하는 서비스들이 공통점이 거의 없는 독자적인 분류체계를 구축, 운영하는 것과 같은 실정이다. 이처럼 서비스별로 상이한 분류체계를 제공할 경우, 이용자들의 분류체계 이용 및 접근에 어려움이 예상된다.

본 연구의 이러한 조사 결과, 포털들의 분류체계의 개선이 필요한 분야는 다음과 같다. 첫째, 포털별로 모든 서비스에 적용 가능한 통합 분류체계 구축이 요청된다. 구체적인 분류체계 구축에 있어서는 서비스별 특징을 고려하더라도, 전반적인 계층 구조나 카테고리명 선정 등에 있어서는 일관성 있는 가이드라인을 수립하는 것이 필요하다. 둘째, 명확하고 일관성 있는 분류 전개 기준의 구축 및 적용이 필요하다. 이질적이고 방대한 웹 자료들을 분류하기 위하여 복수의 분류 기준을 적용하는 것이 필요한 경우에는 분류 기준별로 다각적 접근점을 제공하는 방안, 즉 패싯 기반 분류체계를 적용하는 방안이 고려될 수 있다.

본 연구의 결과는 향후 포털들의 분류체계 개선에 활용될 수 있을 것으로 기대된다. 즉, 개별 포털들의 보다 체계적이고 일관성 있는 분류체계 및 계층 구조 개발에 기여할 수 있을 것이다. 한편, 국내 포털들이 디렉토리 외 서비스에도 분류체계를 확대하고 있는 실정이므로, 향후 서비스별 분류체계에 대한 지속적인 평가가 요청된다.

본 연구의 수행 결과 향후 연구가 요구되는 사항들은 다음과 같다. 첫째, 본 연구에서 포함되지 않았던 기준들에 따라 분류체계를 분석, 평가하는 작업이 필요할 것으로 보인다. 예를 들어 이용자 지원, 부가 서비스, 광고 포함 여부, 개인화 서비스 제공 등의 측면에서 평가할 수 있을 것이다. 둘째, 국외 포털들의 분류체계들에 대한 비교, 분석 작업이 요청된다. 또한 이용자들의 분류체계에 항해 및 접근 행태에 대한 실제적인 조사가 요구된다. 마지막으로, 이용자들의 분류체계에 대한 만족도 조사를 위해서 인터뷰, 관찰 등을 통한 별도의 보완작업이 요구된다.

 

 

<참 고 문 헌>

곽철완. 2001. 인터넷 쇼핑몰의 상품 분류체계에 대한 연구. 『정보관리학회지』, 18(4): 210-215.

김명옥. 2007. 기독교 분야 웹문서 분류체계 설계를 위한 비교 분석적 고찰. 『한국문헌정보학회지』, 41(3): 127-144.

김성희. 2002. 인터넷상의 디지털 문화컨텐츠 분류방안에 관한 연구. 『한국문헌정보학회지』, 36(3): 181-200.

김영보. 1997.『인터넷 탐색엔진의 분류체계에 관한 연구: 컴퓨터, 인터넷 분야를 중심으로』. 석사학위논문, 성균관대학교 대학원.

김형년. 2004. 일반 포털 사이트에서의 디자인 관련 디렉토리 분류체계에 관한 연구.『한국인포디자인학회, 인포디자인이슈』, 6: 95-106.

남영준. 1998. 웹 문서 분류체계의 분석 및 새로운 설계. 『한국문헌정보학회지』, 32(3): 207-230.

박소연. 2009. 주요 포털들의 디렉토리 서비스 비교 평가.『한국문헌정보학회지』, 43(1): 215-234.

배영활, 오동근, 여지숙. 2008. 인터넷포털과 인터넷서점의 어린이자료 분류시스템의 비교 분석. 『한국도서관․정보학회지』, 39(3): 321-344.

배희진, 이준호, 박소연. 2004. 로그분석을 통한 네이버 이용자의 디렉토리 접근 형태에 관한 연구. 『한국도서관․정보학회지』, 35(1): 1-17.

신동민. 2001. 인터넷 검색엔진의 디렉토리 구성에 관한 연구.『정보관리학회지』, 18(2): 143-163.

오동근, 황재영, 배영활. 2001. 군사학 분야 웹 문서 분류체계의 설계.『한국도서관ㆍ정보학회지』, 32(2): 323-347.

이란주, 성기주, 양정하. 2001. 여성학분야 인터넷 자원의 분류체계에 관한 연구. 『한국도서관ㆍ정보학회지』, 32(3): 397-417.

이명희. 2000. 국내 디렉토리 검색엔진의 교육 분야 분류체계 연구. 『국회도서관보』, 37(2): 25-46.

이창수. 2001. 정보통신기술 분야 인터넷 자원의 분류체계에 관한 연구. 『한국도서관․정보학회지』, 31(4): 111-138.

임경란. 2004. 인테리어 디자인 분야 인터넷 정보 자원 활용을 위한 분류체계 연구. 『한국디자인학회, 디자인학연구』, 17(4): 79-88.

정경희. 2004. 의학 분야 웹 자료의 분류에 대한 개선 방안 연구. 『정보관리학회지』, 21(2): 89-106.

최재황. 1998. 인터넷 학술정보자원의 디렉토리 서비스 설계에 있어서 DDC분류 체계의 활용에 관한 연구. 『정보관리학회지』, 15(2): 47-67.

최희윤. 1998. 인터넷 정보서비스의 분류체계에 대한 비교연구: 물리학을 중심으로. 『정보관리학회지』, 15(3): 45-57.

한상길. 2001. 산업분야 인터넷 자원의 분류체계에 관한 연구. 『정보관리학회지』, 18(3): 285-309.

Kosh, T. 1997. "The role of classification schemes in Internet resource description and discovery." [cited 2010. 4. 1]. <http://www.ukoln.ac.uk/metadata/desire/classification/classification.rtf>. 

Larson, K., and Czerwinski, M. 1998. "Web page design: Implications of memory, structure and scent for information retrieval." [cited 2010. 4. 1]. <http://research.microsoft.com/en-us/um/people/marycz/chi98_webdesign.pdf>. 

Li, T., Zhu, S., and Ogihara, M. 2008. "Text categorization via generalized discriminant analysis." Information Processing & Management, 44(4): 1684-1696.

Mengle, S., and Goharian, N. 2010. "Detecting relationships among categories using text classification." Journal of the American Society for Information Science and Technology, 61(5), 1046-1061.

Rosenfeld, L., and Morville, P. 2003.『효율적인 웹사이트 구축을 위한 인포메이션 아키텍처』. 남상신 역. 서울: 한빛미디어. (원서출판 2002).

Uddin, M. N., and Janeck, P. 2007. "The implementation of faceted classification in web site searching and browsing." Online Information Review, 31(2), 218-233.

 

 


 

 

블로그 이미지

한국조사기자협회

사단법인 한국조사기자협회는 1987년 국내의 신문, 방송, 통신사의 조사, 정보, 자료, DB업무를 담당하는 조사기자들의 모임으로 출범하여, 2009년 회원들의 연구활동에 기초한 신문 및 방송 발전에 기여할 목적으로 사단법인으로 재출범하였으며, 언론공익활동으로 신문논술대회, 조사연구 발간, 세미나·토론회, 보도연감 출판 등의 사업을 하고 있는 언론단체입니다

※ 이글은 한국조사기자협회가 연간지로 발행하는 2010년 '조사연구' 제22호에 실린 글임을 알립니다.

 

뉴스콘텐츠 분류 표준화 시대 오나?

유영식 YTN·한국NewsML포럼 분류분과위원회 간사

 


뉴스 포맷 표준 현황

디지털로 콘텐츠가 생산되는 뉴스산업의 ‘표준화’는 유럽과 북미 메이저 뉴스통신사와 언론사가 주도하는 IPTC(국제언론통신협의회, International Press Telecommunications Council)를 통해 이미 30여 년 전부터 진행되어 왔다. ‘IPTC 7901’은 텍스트로 된 와이어(wire) 뉴스를 전송하기위해 1979년에 발표한 최초의  표준포맷이었고, XML을 기반으로 텍스트 뉴스를 메타데이터와 함께 전송하는 NITF(News Industry Text Format)도 1998년에 표준포맷으로 제정된다. NITF는 와이어, 신문, 인터넷, PDA 등 어떤 채널로도 전송이 용이하며, 아직까지도 북미 언론사를 중심으로 뉴욕타임즈, AP, AFP, LexisNexis 등에서 사용하고 있다. 

그렇지만 이전의 뉴스 표준 포맷은 텍스트 뉴스를 위한 것이었고, 다양한 형태로 생산되는 멀티미디어 뉴스콘텐츠를 바쁘고 정확하게 전송하고, 인터넷 웹 사이트와 모바일 서비스도 동시에 지원하는 표준 포맷이 필요하게 된다. 이에 IPTC는 뉴스콘텐츠에 XML을 적용한 NewsML을 제정 발표하였고, 이 NewsML은 이후 10여 년 동안 뉴스산업 국제 표준 포맷으로 광범위하게 사용되고 있다. NewsML은 텍스트, 사진, 그래픽, 애니메이션, 동영상 등 뉴스콘텐츠 미디어 특성에 독립적으로 교환할 수 있고, 여러 뉴스콘텐츠를 묶어서 패키징하거나 개인화된 뉴스 서비스를 지원한다. 또한 뉴스산업에 필요한 메타데이터의 분류 표준과 통제어휘(Controlled Vocabulary)도 함께 제공한다.   

IPTC는 웹 2.0(Web 2.0)과 시멘틱 웹(Semantic Web)을 뉴스콘텐츠에 접목하기 위한 뉴스표준 포맷으로 ‘IPTC G2-표준’을 2008년 2월에 제정 발표한다. G2-표준은 입체적인 뉴스 패키징, 맞춤형 뉴스 서비스, 의미론적 지식기반 서비스를 지원한다. G2-표준은 NewsML-G2, EventML-G2, SportsML-G2 3개의 표준포맷으로 구성되며, 뉴스 아키텍처(News Architecture)를 공통 프레임워크로 사용하고 있다. NewsML-G2는 NewsML 1.x와 비교해 훨씬 간결하고 명확하게 뉴스콘텐츠를 처리하며, 뉴스에 딸린 부가정보(인물, 기관·기업, 지역, POI)를 통해 뉴스소비자에게 지식기반 서비스로 제공한다. EventML-G2는 대형사건 뉴스를 입체적으로 제공할 때 사용하는 포맷이며, SportsML-G2는 스포츠 경기결과나 통계자료를 뉴스콘텐츠와 함께 전달할 수 있는 포맷이다.
국내 NewsML 표준 도입 현황은 G2-표준이 아닌 NewsML 1.2를 기반으로 2010년 11월 현재 서울·지역 일간지(조선일보, 한겨레신문, 경향신문, 세계일보), 지역주간지, 언론재단 등 00곳에서 표준으로 채택하여 사용하고 있다.

 

뉴스 아키텍처와 IPTC G2-표준 구성 요소

 

 

뉴스 포맷 표준의 산업 효과

 

다른 산업도 마찬가지겠지만, NewsML이라는 뉴스 표준의 도입이 비용 절감을  일차적으로 발생시킨다. 언론사 내부적으로 통일된 표준포맷으로 뉴스제작, 편집, 관리, 배포, 출판, 아카이브가 됨으로써 시스템 관리 비용이 획기적으로 줄어든다. 또한 다양한 뉴스콘텐츠를 다양한 채널(디바이스)로 전달하는 ‘통합뉴스룸’이 NewsML을 도입함으로써 별도 비용 없이 개발되는 장점이 있다. 나아가 NewsML이 국제적 표준이기 때문에 세계시장 진출을 위한 사업기회도 자연스럽게 주어진다. 

과거 신문이나 잡지, TV뉴스 제작을 위해 일회성으로 콘텐츠가 사용됐지만, 이제는 멀티채널(웹, 모바일, DMB, IPTV 등)로 뉴스가 소비된다. 모든 언론사가 다양한 형태(텍스트, 사진, 그래픽, 동영상 등)의 뉴스콘텐츠를 서로 다른 포맷으로 전송하면 뉴스산업 전체로 볼 때 교환과 유통 구조가 매우 복잡해진다. 이를 받아 2차 유통을 하는 언론사 웹사이트, 포털사이트, 뉴스신디케이트, 콘텐츠유통업체는 복잡한 유통체계를 통일하기위한 시간과 인력을 투입해야한다. 그러나 서로 약속된 ‘표준포맷’으로 콘텐츠를 생산하고 유통한다면, 뉴스산업 전체적으로 볼 때 비용 절감이 효과가 매우 클 수밖에 없다. 

다음으로는 NewsML을 도입함으로써 ‘메타데이터 표준화’를 통해 뉴스콘텐츠를 다양하게 묶어서 제공할 수도 있고, 고객의 요구에 맞게 맞춤형 서비스를 제공할 수 있다. 즉, NewsML의 메타데이터는 뉴스의 내용을 설명하거나 관리를 위해 필요하지만, 이를 통해 뉴스를 입체적으로 전달하고 뉴스소비자가 요구하는 형태로 뉴스와 부가정보를 제공해 한 차원 높은 서비스를 제공할 수 있다. 예를 들어, 노무현 전 대통령의 서거 소식과 같은 대형사건이 생겼을 때, 사건 기사 본문만 아니라 관련 사진, 그래픽, 동영상을 묶어서 전달하고, 그의 발자취와 관련된 배경 정보, 자세한 인물 프로필을 함께 서비스할 수 있다. 또한 전직 대통령의 서거 관련 기사들을 언론사 아카이브에 있는 모든 형태의 콘텐츠를 함께 이용할 수 있게 참조 목록을 링크로 제공할 수도 있다.

NewsML이 국내뿐만 아니라, 국제적 표준이라는 것에 대해서는 누구도 이의를 제기하지 않는다. 국내에서는 NewsML을 언론사 자체적으로 도입을 결정했거나, 신문발전위원회, 지역신문발전위원회를 통한 외부지원으로 도입한 곳까지 53개 언론사가 표준으로 채택하고 있다. 2010년 6월 언론진흥재단의 지원을 통해 중앙일보, 국민일보, 일간스포츠, 내일신문 등 10여개의 언론사가 추가적으로 NewsML 도입을 결정했다. 이런 NewsML 도입 추세는 2006년 국내 처음 소개한 이후로 빠른 속도로 ‘뉴스 포맷 표준’으로 정착하고 있으며, NewsML 기술 도입 자체가 이제는 이슈가 되지 않는다는 반증이다. 작년부터 국내 ‘뉴스 포맷 표준화’ 이슈는 NewsML 도입에 따라 IPTC 주제분류를 어떻게 활용할 것인지, 한국형 Ks뉴스코드를 제대로 활용할 수 있게 해달라는 요구로 이동하고 있다. 

올바른 IPTC 주제분류 활용법

IPTC 주제분류(SubjectCode)는 NewsML을 도입한 언론사가 이 표준에 따라 뉴스를 분류하고, 전 세계 모든 언론사가 공통의 주제분류체계를 가지면, 글로벌한 콘텐츠 유통과 교환이 용이하다는 목적에서 출발했다. 도서 분류에서 국제분류표인 듀이 십진분류법(DDC)를 사용하는 것과 같은 취지이다. 그러나 국내 NewsML 도입 초기부터 작년까지도 한국NewsML포럼과 몇몇 언론사들의 고민은 기존 언론사 고유의 기사 주제분류표를 버리고, IPTC 주제분류로 전환해야 하는지에 대한 논의가 활발했다. IPTC 주제분류가 유럽·북미 문화가 강하게 스며든 분류체계로 국내에는 매우 낯설었기 때문이었고, 기존에 기사분류체계를 바꿔야하는 실무부서의 고충과 경제적인 비용 발생이 예상됐기 때문이었다.

그렇지만 IPTC에 가입된 해외 언론사의 주제분류 적용 사례를 수집한 결과, NewsML 도입 언론사가 자사 분류체계를 버리고, IPTC 주제분류 표준으로 전환해야 한다는 주장은 오해라는 결론에 도달하게 된다. 즉, 오랫동안 사용한 언론사 고유 기사분류표가 여전히 유효하다면 그대로 사용하되, 교환과 유통을 위해 NewsML 문서를 전송할 때는 IPTC 주제분류도 함께 제공할 수 있으면 되는 것이다. 물론 이런 경우에는 IPTC 주제분류를 위한 별도의 인력이 필요하지만, 현 언론사 환경에서 업무 인력보다는 자동분류시스템을 활용해 자사 분류체계와 IPTC 주제분류간 매핑(mapping) 작업을 자동화하는 것이 더 현실적이고 합리적인 방법이라 판단된다. 

또 다른 뉴스분류 Ks뉴스코드

 

흰 바탕에 검은 선과 숫자로 구성된 바코드는 계산대에 선 고객의 줄을 줄이기 위해 도입했지만, 이후로 판매 실적, 거래 동향, 재고량, 유통경로를 파악할 수 있는  ‘유통 혁명’의 아이콘으로 자리 잡았다. 뉴스산업에서 바코드와 같이 ‘뉴스 유통의 혁명’을 가져 올 것으로 기대되는 것이 바로 ‘뉴스코드(NewsCode)’이다. 뉴스코드는 NewsML을 도입한 개별 언론사나 국가별 언론단체가 뉴스산업에 필요한 메타데이터 분류 정보과 부가 정보를 콘텐츠와 함께 유통하기 위해서 고안한 것이다. Ks뉴스코드는 그간 국내 언론사에서 중요하게 취급해온 인물, 기관·단체, 기업, 상품, 지역 등을 국내 언론환경에 맞게 확장한 ‘한국형 뉴스코드’이다. 

 

NewsML을 채택한 모든 언론사가 표준화된 Ks뉴스코드 값을 NewsML 문서에 바코드처럼 포함시킨다면, 국내 뉴스시장 유통에 지각변동을 일으킬 것이다. Ks뉴스코드의 활용 사례를 하나 들어 보자. 어떤 기사 본문에 ‘김대중’이라는 인물명이 있다면 이 인물이 ‘전 대통령’인지, ‘조선일보 고문’인지, 어느 대학의 ‘교수’인지 사람이 기사를 읽어보지 않으면 알 수 없다. 그러나 NewsML 문서에 Ks뉴스코드 값으로 KsPeople(인물)의 ‘020002’라는 코드 값이 포함되었다면, 이 뉴스는 ‘김대중 전 대통령’의 기사임을 시스템에서 쉽게 처리할 수 있다. 또한 김대중 전 대통령의 프로필까지 부가정보로 함께 제공할 수 있는 것이다.

 

이런 장점을 가진 Ks뉴스코드가 NewsML을 도입한 국내 언론사가 점차 증가함에 따라 이것을 활용해 뉴스콘텐츠의 부가가치를 향상시키려는 현업의 요구들이 하나 둘 발생하기 시작했다. 이에 한국NewsML포럼은 Ks뉴스코드가 국내 뉴스산업에 획기적 변화와 활력을 가져올 것으로 예상하고 Ks뉴스코드를 언론사 현업에서 많이 활용하고 적용할 수 있도록 2009년 한 해 Ks뉴스코드를 대대적으로 정비하였고, 2010년에는 작년에 작업한 Ks뉴스코드에 1만6천여 건에 대한 하나하나 변동사항을 대조하고, 필요한 Ks뉴스코드를 추가로 입력하는 업데이트 작업을 완료했다. 특히 인물의 경우, 지방선거와 재보궐 선거로 인한 변동과 추가, 인물 직책 변동, 기업의 경우 신규 상장업체 반영 등의 작업이 있었다.

   

뉴스분류 표준화는 이미 시도 중

 -뉴스산업 발전을 위한 공적투자 절실

 

글로벌 뉴스 표준인 NewsML은 도입의 단계를 넘어서 이미 정착의 단계로 진입하고 있다. NewsML을 도입할 시기에는 표준이 제공하는 기술과 도입 방법에 포커스가 맞춰졌지만, 정착의 단계로 들어서자 표준을 활용해 뉴스콘텐츠 부가가치를 향상시키거나, 이를 활용한 비즈니스 모델을 찾고자 한다. 그 중심에 뉴스콘텐츠의 다양한 분류 표준인 Ks뉴스코드가 있다. Ks뉴스코드를 언론사 현업에서 적극 활용될 때 뉴스 표준인 NewsML 도입 효과가 극대화 된다. 그러나 대부분 언론사가 갈수록 경영여건이 열악하고 Ks뉴스코드를 이용해 콘텐츠 분류 전문인력을 지원하지 못하는 현실은 Ks뉴스코드 정착과 활성화에 큰 장애물이다. 이러한 어려움을 풀기위한 해법은 국가 차원에서 ‘Ks뉴스코드 자동분류시스템’을 공적 투자로 만들어 주고, NewsML을 도입한 언론사가 무료로 언제나 이용할 수 있도록 지원해야 한다. 이러한 요구에 따라 2009년 신문발전위원회에서 추진했던 ‘Ks뉴스코드 자동분류시스템’이 개발 적격업체가 없어서 유찰된 사례는 매우 애석한 일이었다. 2011년에는 뉴스 표준인 NewsML 활성화, Ks뉴스코드를 활용한 분류표준을 현업에서 활용하기 위해 국내 뉴스산업 발전을 위해 다시 추진해 줄 것을 요청한다. 또한 NewsML을 통한 통합뉴스룸 소프트웨어와 신문제작시스템을 공급하는 밴더들이 Ks뉴스코드를 언론사가 사용할 수 있도록 시스템에 적용하는 것도 중요하다.  

Ks뉴스코드가 ‘한국형 뉴스 분류 표준’으로 정착해 국내 뉴스산업에서 꽃을 피우기 위해서는 NewsML을 채택한 언론사들이 서로 협력해서 Ks뉴스코드를 활용하여 뉴스콘텐츠에 적용, 활용할 수 있어야 한다. ‘분류 표준화’가 단지 획일적이고 규격화된 것을 의미하기 보다는, 뉴스산업을 발전시키고 뉴스콘텐츠와 뉴스소비자의 접점을 확대시키는 수단이 되도록 Ks뉴스코드를 유지 관리하는 것이 매우 중요하다. 그러기 위해서 Ks뉴스코드 메타데이터 세트들이 지속적으로 최신의 것으로 유지되어야 하고, 세부 항목에 대한 동의어 처리, 시소러스 매핑 작업, 나아가 뉴스코드 항목을 컴퓨터가 자동적으로 추출하는 ‘Ks뉴스코드 자동분류시스템’에 대한 공적 투자가 선행되어야 한다. 수년간 Ks뉴스코드를 최신의 것으로 업데이트하고, 뉴스 소비자가 필요로 Ks뉴스코드를 확장하고 질 높은 부가정보를 지속적으로 축척하게 되면, 시맨틱 웹에 부합하는 ‘한국형 뉴스 지식기반 시스템’이 탄생하게 된다. 이러한 청사진이 현실화되려면 NewsML을 도입한 언론사들의 협업이 매우 중요하며, 명실상부한 뉴스산업의 공공재(公共財) 역할을 수행하기 위한 국가적 지원 또한 절실히 필요하다. 

 

 

블로그 이미지

한국조사기자협회

사단법인 한국조사기자협회는 1987년 국내의 신문, 방송, 통신사의 조사, 정보, 자료, DB업무를 담당하는 조사기자들의 모임으로 출범하여, 2009년 회원들의 연구활동에 기초한 신문 및 방송 발전에 기여할 목적으로 사단법인으로 재출범하였으며, 언론공익활동으로 신문논술대회, 조사연구 발간, 세미나·토론회, 보도연감 출판 등의 사업을 하고 있는 언론단체입니다