빅카인즈(BIG KINDS) 활용과 전망 : 문화일보 박현수 조사팀장

 

 

지난 19일부터 20일까지 전주 르윈호텔에서 제50회 한국조사기자협회 정기세미나가 ‘뉴스 빅데이터 활용과 에버그린 콘텐츠 전망’을 주제로 열렸다. 문화일보 박현수 조사팀장이 ‘뉴스 빅데이터 빅 카인즈(BIG KINDS) 활용과 전망’, 경향신문 유기정 DB관리팀장이 ‘빅데이터 시대 조사기자의 역할’에 대해서 주제발표를 했다. 최근 몇 년전부터 자연스레 화두가 된 ‘뉴스 빅데이터’와 ‘데이터 저널리즘’과 ‘DB에디터’ 등 조사기자의 역할론에 대해 심도있는 토론도 함께 진행되었다.
SK브로드밴드 장정익 VoD사업팀장이 ‘New Content Marketing : 방송사 아카이브 활용 전략’, 제머나이소프트 정상호 부장이 ‘디지털 아카이브를 위한 콘텐츠 관리’를 발표했다. 이는 VoD 플랫폼이 점차 성장하고 있는 방송환경 속에서 아카이브를 활용한 에버그린 콘텐츠 제작과 유통, 관리전략을 콘텐츠 소비자 입장에서 한눈에 분석한 결과를 발표하여 참석자의 관심을 끌었다. 본 협회는 제50차 정기세미나 발표 내용을 4편으로 요약해 소개한다.<편집자 주>

 

 

 

<문화일보 박현수 조사팀장>

 

"넓은 의미에서의 빅데이터는 방대한 데이터를 분석해서 의미있는 정보를 찾아내는 것을 포함하는 개념이다. 빅데이터는 미래의 쌀, 원유로 불릴 만큼 여러 분야에서 갈수록 중요성이 더해지고 있다."

 

 

신문사에서 제공된 기사를 토대로 구축된 빅카인즈에 대해 소개를 드리고 앞으로의 활용과 전망에 대해서 설명하고자 한다. 빅데이터(Big Data)란 디지털 환경에서 생성되는 방대한 데이터로, 텍스트 뿐만 아니라 영상데이터도 포함하는 대규모 데이터를 말한다. 하지만 넓은 의미에서의 빅데이터는 방대한 데이터를 분석해서 의미있는 정보를 찾아내는 것을 포함하는 개념이다. 빅데이터는 미래의 쌀, 원유로 불릴 만큼 여러 분야에서 갈수록 중요성이 더해지고 있다.

 

빅데이터 활용사례를 보면 대표적으로 2015년 파리연쇄테러사건 때 범인 검거작전에 빅데이터가 활용돼 범인을 신속하게 검거하는데 기여를 했다. 무려 10TB(테라바이트)에 달하는 방대한 데이터가 활용된 것으로 알려지고 있다. 2012년 미국 대통령선거에서도 오바마 대통령이 유권자들의 성향 등을 빅데이터로 잘 활용해 재집권에 성공한 것으로 보도되었다. 이외에도 빅데이터는 여러 분야별로 널리 활용되고 있으며 특히 스포츠산업에서도 각광받고 있다.  

 

일례로 2014년 브라질 월드컵은 빅데이터 월드컵으로 불릴 만큼 빅데이터가 독일 대표팀 우승에 크게 기여한 것으로 유명하다. 독일은 국제적인 빅데이터 분석회사인 ‘SAP’와 협력하여 선수들의 어깨와 무릎, 축구공에 센서를 부착해 1분당 1만5000건의 데이터를 실시간으로 제공 받아 감독과 코치가 이를 분석함으로써 선수들 움직임 하나하나, 장단점을 분석하여 실전에 활용했다고 한다. 이후 한국 축구에서도 빅데이터를 활용키로 했다는 보도가 나오고 있기도 하다.

 

최근 인공지능(AI) 알파고와 이세돌의 세기의 대국에서 보았듯이 알파고는 인류에게 큰 충격을 주었다. 수많은 데이터를 토대로 스스로 학습하는 ‘자가학습’을 통해 진화하는 것이 알파고의 특징이다. 최근 열린 다보스포럼에서 인공지능(AI)이 빠른 속도로 진화해 2020년까지 인간의 일자리 700만개 가 없어질 것이란 전망도 있었다. 이대로 가면 미래 인류의 모습은 주객이 전도되어, 사람은 아무 일도 하지 않고 컴퓨터가 하라는 대로 사는 삶이 될지도 모른다는 우려 섞인 전망이 제기되고 있는 실정이다. 이처럼 인공지능은 지금도 빠른 속도로 발전하고 있다.

 

"한국언론진흥재단이 지난 4월 19일 출범시킨 ‘빅카인즈’를 개발한 솔트룩스가 바로 토종 인공지능(AI) ‘아담’을 개발한 회사이며 향후 빅카인즈에 인공지능이 탑재될 가능성이 매우 높기 때문이다."

 

 

 

빅카인즈를 설명하기에 앞서 인공지능과 알파고를 소개한 이유는 한국언론진흥재단이 지난 4월 19일 출범시킨 ‘빅카인즈’를 개발한 솔트룩스가 바로 토종 인공지능(AI) ‘아담’을 개발한 회사이며 향후 빅카인즈에 인공지능이 탑재될 가능성이 매우 높기 때문이다. 솔트룩스가 개발한 인공지능 ‘아담’도 끊임없이 자가학습을 거듭하고 있다. 아담은 오는 10월 장학퀴즈에 출연키로 해 알파고 못지않은 관심을 모으고 있다.

 

빅카인즈는 뉴스기사 데이터를 쌓아놓은 거대한 뉴스 빅데이터라 할 수 있다. 빅카인즈의 전신인 카인즈(KINDS)는 1990년에 처음으로 국내 종합일간지 신문사의 기사 콘텐츠를 수집해 데이터베이스화하여 서비스를 하기 시작했다. 카인즈는 조사기자와 밀접한 관계가 있다. 당시 카인즈에 탑재된 주제별 기사분류체계를 구축한 것이 바로 한국조사기자협회이고, 이같은 공로로 협회는 1989년 한국기자협회가 주는 한국기자상(공로부문) 특별상을 수상하였다.

 

“(1990년대) 취재기자는 조사부에 카인즈 자료검색을 의뢰하거나 협업으로 같이  하기도 했었다. 당시 조사기자는 카인즈를 검색할 수 있는 정보 전문가로서 전성기를 누렸다”

 

그 당시 조사기자는 언론사내 검색전문가로서 카인즈를 통해 기사를 검색해 취재기자들에게 관련 기사를 제공하였다. 당시 이 카인즈를 검색하는 방법이 지금과 비교해 매우 복잡했었다. 이 때문에 취재기자는 조사부에 카인즈 자료검색을 의뢰하거나 협업으로 조사기자와 같이 일을 하기도 했었다. 당시 조사기자는 카인즈를 검색할 수 있는 정보 전문가로서 전성기를 누렸다고 볼 수 있다.

 

그러나 1990년대 중반부터 인터넷이 생겨나기 시작했고, 2000년 이후 모든 것이 인터넷 포털에서 찾으면 된다는 인식의 확산에 카인즈도 유명무실해지기 시작했다. 게다가 이무렵 조선일보와 중앙일보, 동아일보가 카인즈 기사 제공을 중단함으로써 언론진흥재단은 카인즈 존립 자체를 심각하게 고민하기도 했었다.


이 과정에서 2000년대 중반 이후 카인즈를 비롯한 뉴스콘텐츠 유통 효율화를 위해 한국언론재단이 News ML 표준화 작업을 적극 추진했다. 이때 기사 콘텐츠의 메타데이터인 News Code 표준화 작업에 조사기자들이 활발하게 참여하기도 했다.


그러던 중 2015년 하반기부터 한국언론진흥재단이 문화체육관광부로부터 60억 원이라는 막대한 규모의 예산을 지원받아 카인즈 기사를 빅데이터로 분석해 서비스하는 빅카인즈 서비스를 올해 4월 19일 출범하게 되었다. 이것은 세계 최초의 시도라고 할 수 있다.

 

“빅카인즈의 개념은 텍스트로 이뤄진 뉴스콘텐츠를 분석이 가능한 정제된 데이터로 바꾸어, 사회현상을 분석할 수 있는 기초자료로 제공하는 시스템이다.”

 

빅카인즈의 개념은 텍스트로 이뤄진 뉴스콘텐츠를 분석이 가능한 정제된 데이터로 바꾸어, 사회현상을 분석할 수 있는 기초자료로 제공하는 시스템이다. 분석대상은 신문기사 데이터베이스인 카인즈(KINDS)에 수록된 데이터로서 1990년부터 현재까지 26년간 60여 개 매체의 3000만 건에 달하는 기사이다.

 

 

<뉴스빅데이터 분석시스템 개념도>

 

이 분석시스템의 목적은 첫 번째, 단순 뉴스검색이 아니라, 사회현상을 분석하는 기초자료로서 뉴스콘텐츠를 활용해 의미있는 정보 가치를 발굴하는 것이다. 두 번째 가치있는 뉴스 정보를 국민에게 전달함으로써 정보복지 향상에 기여하는 것이다. 세 번째로는 뉴스콘텐츠가 국민, 정부기관, 스타트업 등으로 이어지는 새로운 뉴스활용 생태계 조성을 목표로 하고 있다. 빅카인즈는 일반인을 위한 빅카인즈와, 기자는 물론 교수, 공공기관 등 전문가를 위한 분석시스템 빅카인즈-Pro 등 2개로 나눠 서비스하고 있다.

일반용은 그날그날 수집되는 뉴스를 분석해 이슈키워드, 관계도, 뉴스히스토리 등의 서비스를 제공한다. 우리 조사기자들이 관심을 가지는 부분은 단연 전문가용이다. 직접 분석하고자 하는 주제의 관련 기사를 찾아서 정제된 뉴스분석 데이터를 추출해서 다양하게 분석결과를 활용하는 과정인 것이다.

 

정보검색도 텍사노미를 기반으로한 검색이라 복잡하게 되어있어서 별도로 이용법을 공부하지 않으면 활용하는데 어려움이 있다. 또한 분석결과를 활용하기 위해 통계프로그램인 R과 SPSS로 분석하기도 한다. 또한 분석된 데이터를 시각화할 수는 기능도 제공되고 있다. 예를 들어 워드 크라우드를 만들어 보다 알기 쉽게 시각화 해 분석할 수도 있다. 유승민의 경우 정치인과 스포츠인을 구분해서 검색을 할 수 있으며, 정보원이 많이 발생하는 순으로 여기에 따라서 인용문을 검색할 수 있는 기능도 서비스된다. 수십만 건의 기사에서 꼭 필요한 데이터를 추출하기 위해서 구문패턴이라는 기능도 조사기자들이 적극 활용해야 할 것이다.


빅카인즈 활용 사례중에 동아일보가 지난 2월 ‘기부’라는 키워드로 추출된 19만건의 기사 분석을 통해서 훌륭한 기획기사를 작성한 사례도 있었을 뿐만아니라 최근 들어 빅카인즈를 활용한 보도사례가 부쩍 증가하고 있는 추세이다.

 

빅카인즈 발전 위한 향후 과제는 무엇일까요. 우선 더욱 정확한 기사 검색을 위해 한국언론진흥재단이 보유하고 있는 시소러스를 올해 안에 업그레이드 해야 한다. 둘째 빅카인즈와 정부의 공공DB를 연계를 확대해서 서비스 할 필요가 있다. 셋째 조중동을 비롯, 방송사 등도 빅카인즈 참여를 이끌어 내야 한다. 마지막으로 유료화 정책수립 및 보다 편리하고 다양한 서비스 개발이 필요하다.

 

<빅카인즈 발전 전망, 세미나 자료집 중>

 

 

마지막으로 주제발표의 결론을 말씀 드린다. "구슬이 서말이라도 꿰어야 보배"라는 속담이 있다. "아무리 좋은 시스템이라도 활용하지 않으면 무용지물이 되고 경쟁에서 도태“되는 것이다. 조사기자는 빅데이터 시대 뉴스 빅데이터 큐레이터로서, 빅카인즈를 자유자재로 분석하고, 필요한 데이터를 정확하게 추출하는 정보 전문가로서 활약해야 한다고 생각한다.

 

빅카인즈 또한 뉴스 빅데이터 융합분석과 인공지능화로 뉴스콘텐츠 가치 극대화를 할 수 있어야 이 사업이 성공될 수 있을 것이다. 이와 함께 빅카인즈의 수익모델 창출 가능성도 매우 높다고 할 수 있다.

 

빅카인즈의 구체적인 유료화 문제는 현재 한국언론진흥재단과 각 신문사별로 심도 있게 논의 중이다. 각 신문사에서는 새로운 비즈니스 모델로서 빅카인즈에 많은 관심을 가지고 있다. 비즈니스 모델은 언론진흥재단과 신문사 실무 부서장으로 구성된 TF에서 검토중인데, 연말까지는 서비스를 하면서 홍보도 하고 새로운 비즈니스모델 개발을 할 것이다. <끝>

 

(정리/편집=한국조사기자협회 취재팀 press@josa.or.kr)

블로그 이미지

한국조사기자협회

사단법인 한국조사기자협회는 1987년 국내의 신문, 방송, 통신사의 조사, 정보, 자료, DB업무를 담당하는 조사기자들의 모임으로 출범하여, 2009년 회원들의 연구활동에 기초한 신문 및 방송 발전에 기여할 목적으로 사단법인으로 재출범하였으며, 언론공익활동으로 신문논술대회, 조사연구 발간, 세미나·토론회, 보도연감 출판 등의 사업을 하고 있는 언론단체입니다

“오는 19-20일 전주 르윈호텔에서 ‘뉴스 빅데이터 활용과 에버그린 콘텐츠 전망’ 주제로 제50차 정기세미나 열어”

 

 

 


사단법인 한국조사기자협회(회장 유영식,YTN)는 19-20일 전북 전주시 르윈호텔에서 ‘뉴스 빅데이터 활용과 에버그린 콘텐츠 전망’을 주제로 한국언론진흥재단 후원으로 제50차 정기세미나를 개최한다. 문화일보 박현수 조사팀장이 ‘뉴스 빅데이터 빅 카인즈(BIG KINDS) 활용과 전망’을, 경향신문 유기정 DB관리팀장이 ‘빅데이터 시대 조사기자의 역할’에 대해서 주제발표를 한다.
최근 몇 년전부터 자연스레 화두가 된 ‘뉴스 빅데이터’와 ‘데이터 저널리즘’에 조사기자의 역할론에 대해 심도있는 회원간 토론도 함께 진행된다.
SK브로드밴드 장정익 VoD사업총괄팀장이 ‘New Content Marketing : 방송사 아카이브 활용 전략’을, 제머나이소프트 정상호 부장이 ‘디지털 아카이브를 위한 콘텐츠 관리’를 발표한다.
이는 VoD 플랫폼이 점차 성장하고 있는 방송환경 속에서 아카이브를 활용한 에버그린 콘텐츠 제작과 유통, 관리전략을 콘텐츠 소비자 입장에서 한눈에 분석한 결과를 발표하게 된다.


(=한국조사기자협회 취재팀 press@josa.or.kr)

 

블로그 이미지

한국조사기자협회

사단법인 한국조사기자협회는 1987년 국내의 신문, 방송, 통신사의 조사, 정보, 자료, DB업무를 담당하는 조사기자들의 모임으로 출범하여, 2009년 회원들의 연구활동에 기초한 신문 및 방송 발전에 기여할 목적으로 사단법인으로 재출범하였으며, 언론공익활동으로 신문논술대회, 조사연구 발간, 세미나·토론회, 보도연감 출판 등의 사업을 하고 있는 언론단체입니다

지난주 아침 협회 단톡방에 한 장의 사진이 ‘신문 배달’ 같이 올라왔다. 다름 아닌 한국일보 기획면 ‘데이터로 읽는 미스코리아’의 데이터 조사·분석 역할을 담당했던 박서영 회원을 자랑하기 위해 최종욱 DB컨텐츠부장이 흥분을  감추지 못하고 신문지면 캡쳐 이미지를 서둘러 올렸던 것이다.


 

<박서영 회원이 자료조사 바이라인으로 참여한 한국일보 view& 미스코리아 특집기사>

 

관련기사보기

 

아침부터 단톡방에선 한국일보에 대한 격려와 지지, 최국장의 리더십에 탄복을, 후속타를 기대한다 등 훈훈한 분위기가 연출되었다. 신문을 펼쳐놓고 읽어보면 알겠지만 ‘데이터로 읽는 미스코리아’의 기사는 박서영 회원의 자료제공이 밑바탕이 되었다는 것을 한눈에 알 수 있다. 이런 일을 접하는 협회의 역할은 우리 협회원들의 활약을 널리널리 퍼트리는 것이다. 그러기 위해 곧바로 전화 취재에 나섰다.

 

=어떻게 기획기사에 참여하게 되었나.
회사가 미스코리아 60주년을 맞이해 기획 기사를 아이템을 준비하던 중, 사업팀에서 보유하고 있는 본선진출자 신청서를 토대로 데이터 분석을 하면 좋겠다는 의견을 냈다. 편집국은 긍정적으로 데이터분석 협업을 요청을 했고, 2주에 걸친 자료분석을 정리해 넘겼다.

 

=어떤 것을 분석했나.
대회 첫해 1957년부터 2015년까지 본선진출 미스코리아의 체형(키, 몸무게), 장래희망, 좋아하는 음식과 영화, 출신학교, 학과, 취미, 특기 등을 전체, 역대 진(眞)별, 10년 구간별로 빈도수와 평균을 분석 정리하였다.

 

=데이터 분석은 어떻게 했나
사전 회의를 통해 데이터 분석 항목을 미리 선정했다. 본선진출자 신청서를 보고 데이터를 엑셀 시트에 입력했다. 입력된 미가공 데이터(raw data)를 평균분석과 R통계분석 프로그램을 통한 빈도수 측정으로 분석을 할 수 있었다.

 

=앞으로 편집국과의 협업이 계속될 것 같은가. 협업을 위한 조건이 있겠는가.
도움을 주고 싶은데 대상이 없으면 DB컨텐츠부는 편집국에 큰 의미가 없겠죠. 기획이나 취재에 필요한 정보를 제공하는 일을 하려면 그 상대와 원활한 커뮤니케이션이 필요하다. 편집국과 원할한 소통창구가 마련되어야하고 그것이 자연스러워야겠죠.

 

=끝으로 한국일보는 ‘조사기자’를 당당히 밝히고 일을 한다. 조사기자로서 앞으로 포부가 있다면.
조사기자라는 신문을 만드는 기자들에게 필요한 자료를 조사하거나 데이터를 분석해 신문제작에 필요한 기초를 탄탄하게해주는 일이라 생각한다. 우선 기본은 편집국과 원활한 소통이며  그 기초를 튼튼히 하기 위해 많이 고민과 노력을 하고 싶다.

 

<한국일보 DB컨텐츠부 한켠 최신 발행신문 보관함>

 

한국일보 회원들의 노력이 지면으로 결실을 맺기까지 밤낮으로 고생을 했을 모습이 상상된다. 이러한 노력은 인터뷰에서 늘 강조했듯 편집국과 원활한 소통을 하는 것, 신문 제작에 도움이 될 만한 부분을 미리 파악하는 것이 선행되어야 할 점이다.

 

전화 인터뷰를 끝내고, 며칠 전 “영화 스포트라이트를 협회가 단체관람하면 좋겠다”는 연배 있는 선배의 제안이 떠올랐다. 그 영화 주요장면에 2000년대 미국 신문사내 조사부와 조사기자가 일하는 모습이 나온다고 했다. 곧장 집에서 영화클립을 다운로드 받아 PC앞에서 보았다. 올해 아카데미 작품상을 수상한 이 영화는 보스턴 글로브 내 ‘스포트라이트’팀의 가톨릭 보스턴교구 사제들의 아동 성추행 사건을 취재하는 내용이다. 일반인은 성역이었던 가톨릭교회를 고발했다는 사회정의에 박수를 보냈겠지만, 영화속 15분간 나오는 조사부와 조사기자의 좁거나 너른 역할과 과거, 현재, 미래를 나름 가늠해 볼 수 있었다.

 

가장 협소해 보였던 역할은 기자가 요청하는 자료 리스트를 받아 관련 자료를 검색하고 출력하거나 복사해서 한꺼번에 북트럭에 담아 전달하는 것이었다. ‘소극적’인 영역이며, ‘익숙한’ 영역이다.

 

<장면1 . ‘스포트라이트’팀 맷 캐롤 기자가 조사부 자료실로 자료 리스트를 들고 와 관련 자료 수집을 요청하고 있다. 출처: 영화캡쳐>

 

 

<장면2 . 자료담당 직원이 신문 스크랩함에서 관련 기사를 손으로 직접 찾고 있다. 기사DB가 없던 시절에는 신문사의 조사기자는 ‘칼’과 ‘자’로 스크랩을 해왔었다. 일종의 아날로그식 주제별 클러스터링인 것이다. 출처: 영화캡쳐>

 

 

<장면3 . 기자의 의뢰로 관련 자료를 기사 주제별 스크랩함에서 수집하는 과정. 출처: 영화캡쳐>

 

<장면4 . 마이크로필름으로 보관된 신문지면 속 관련 기사를 찾는 모습. 요즘 PDF로 저장이 전부라고 할지 모르지만 마이크로필름으로 보관의 장점은 아직도 유효하다. 출처: 영화캡쳐>

 

<장면5. 자료실에서 찾은 방대한 관련 자료를 북트럭에 모아 한꺼번에 전달하는 모습. 출처: 영화캡쳐>

 

다음에 설명할 장면은 조사기자로선 변곡점이다. 보스턴교구 내 성추행·성폭행으로 문제가 된 사제를 찾아내는 결정적 단서를 조사기자와 함께 찾아가는 과정이다. 인터넷으로 전혀 공개되지 않는 데이터를 문헌자료실 내 보관된 ‘교구청 발행 연감’을 통해 찾는 모습이다.
인터넷으로 공개된 데이터는 전체 데이터의 일부에 불과하다. 나머지는 ‘눈에 보이지 않는’ 인비저블(invisible) 데이터로 출판물이나 전문DB를 통해 찾아야 한다. 언론사내 정보전문가인 조사기자가 이 분야에선 최고로서 전문가 역할을 해야 한다.

 

<장면6. 이 장면은 보스턴교구 내 문제의 사제를 찾아내는 결정적 단서로 활용된 교구청 발행 연감을 문헌자료실에서 조사기자가 찾아 주는 모습이다. 출처: 영화캡쳐>

 

<장면7. 문헌자료실 한 구석에서 연도별 연감을 넘겨보고 흥분을 감추지 않는 ‘스포트라이트’팀 기자들. 출처: 영화캡쳐>

 

<장면8. “Sick Leave”라는 단서를 교구청 발행 연감을 통해 확인하는 과정. 이와 유사한 단어도 영화 속에선 기자들이 찾아낸다. 결국 인비저블(invisible) 자료에서 관련 데이터를 수집하는 전쟁이 시작된다. 출처: 영화캡쳐>

 

영화속에서 중요하게 봤던 건 결국 뉴스룸 내 기자와 조사기자간의 커뮤니케이션, 협업을 통해서 그 단서를 찾을 수 있었다는 점이다. 기자들이 파트너로서, 가이드로서 조사기자와 리서치를 협업할 수 있는 부분이 무엇인지 미리 파악해야 한다. 그래서 소통이 중요하다.

 

마지막 영화 속 장면은 ‘스포트라이트’팀이 연감을 통해 찾아낸 문제가 된 사제들을 찾아서 엑셀 시트에 하나씩 입력해 나가는 모습이다. 이는 심층적 탐사보도 기법인 CAR(Computer-Assisted Reporting)를 활용하는 데이터 작업이다. 단언컨대 뉴스룸내 기자와 조사기자의 협업의 정점은 데이터저널리즘일 것이다. 단순히 북트럭에 한꺼번에 싣어 요청된 정보를 제공하는 것이 아니라, 정보를 분석해서 새로운 가치를 담은 데이터를 뉴스룸에 전달하거나, 직접 데이터를 분석한 결과를 기사로 작성하는 영역까지 이 영화가 보여준 15년 전의 모습에서 15년이 지난 현재의 모습으로 자리매김 되어야 하는게 아닐까.

 

 

<장면9. 엑셀 시트에 문제가 된 사제들을 데이터로 입력하는 과정. 이때는 CAR기법에 엑셀을 가장 많이 활용했다. 출처: 영화캡쳐>

 

<장면 . 연감속 내용을 엑셀로 입력하고 있는 맷 캐롤 기자 모습. 출처: 영화캡쳐>

 

위 장면의 맷 캐롤 기자는 조사기자로 활약을 했을 것으로 예상된다. 과거 15여 년 전에 보여지는 조사기자의 역할은 데이터의 수집과 가공 작업의 전문가였다. 현재 데이터저널리즘으로 이어지는 탐사보도에서 ‘의미있는 사실’을 찾아내는 중요하는 역할을 담당하길 기대하고 있다.

 

끝으로 우리 협회는 오래전부터 정보전문가로서 언론사 조사기자는 정보를 분석하고 의미 있는 결과를 추출해 편집국·보도국에 제공해야 한다고 주장해 왔다. 굳이 뉴스룸내 기자들의 정식 요청이 없다고 수동적 입장이 아니라, 뉴스룸내 최고의 정보전문가인 우리가 새로운 뉴스콘텐츠 제작 과정에 참여할 일은 없는지, 편집국·보도국 기자와 우리가 협업할 것은 없는지 적극적으로 조직과 소통해야 한다. ‘사일로(silo)’란 단어가 있다. 회사 안에 성이나 담을 쌓고 외부와 소통하지 않는 부서를 일컫는다. 언제부터 우리 조사기자들이 스스로 그러하지 않았는지 자문해 보자.

 

(취재/정리=한국조사기자협회 취재팀 press@josa.or.kr)

 

블로그 이미지

한국조사기자협회

사단법인 한국조사기자협회는 1987년 국내의 신문, 방송, 통신사의 조사, 정보, 자료, DB업무를 담당하는 조사기자들의 모임으로 출범하여, 2009년 회원들의 연구활동에 기초한 신문 및 방송 발전에 기여할 목적으로 사단법인으로 재출범하였으며, 언론공익활동으로 신문논술대회, 조사연구 발간, 세미나·토론회, 보도연감 출판 등의 사업을 하고 있는 언론단체입니다

통합뉴스룸‬ 내의 조사기자의 역할은 무엇일까요?
특히나 신문사내 조사기자는 통합뉴스룸 체제 내에서 무엇을 해야 할까요?
국내 언론사의 경우 기존 기사작성 업무에 속보기사, 온라인용 기사 등이 추가되고 있는 게 새로운 트렌드처럼 받아들여지고 있는 분위기라고 하지만, 이제 속보기사는 지양해야할 부분이고, 온라인용 기사 또한 본 기사가 제대로 나와야 온라인용이 더 풍부해지지 않을까요?
단순히 '디지털(스마트)기기'에 먼저 얻는게 디지털 퍼스트, 모바일 퍼스트는 아닐 것입니다.

 

우리 ‪‎조사기자협회‬ 는 이러한 언론의 변화 속에서 '에버그린_콘텐츠'‬(=언제든 다시 읽어도 가치가 있는 뉴스콘텐츠), 이슈 트렌드에 맞는 '‪큐레이션서비스‬'에 대해 관심이 많습니다.
또한 ‪조사기자‬ 는 데이터 저널리즘과 탐사보도의 한축인 리서치 부문에 대해서 언론사 조직내 최고의 인력으로 적극 참여해야 합니다.
이러한 시도가 곧 종이신문을 펼쳐 보거나, TV 앞 독자(시청자) 외에 새로운 독자(시청자)를 발굴하기 위한 새로운 콘텐츠 생산에 언론사 (빅)데이터를 관리하는 조사기자의 역할이 더욱 주목되는 이유입니다.

 

이런 의미에서 오늘자 기자협회보에 실린 통합뉴스룸과 디지털퍼스트에 관한 기사를 공유하고자 합니다.

 

관련기사보기

 

 

 

블로그 이미지

한국조사기자협회

사단법인 한국조사기자협회는 1987년 국내의 신문, 방송, 통신사의 조사, 정보, 자료, DB업무를 담당하는 조사기자들의 모임으로 출범하여, 2009년 회원들의 연구활동에 기초한 신문 및 방송 발전에 기여할 목적으로 사단법인으로 재출범하였으며, 언론공익활동으로 신문논술대회, 조사연구 발간, 세미나·토론회, 보도연감 출판 등의 사업을 하고 있는 언론단체입니다

 

 

지난 22일 오후 서울역 근처에 위치한 한국일보 회원사인 'DB컨텐츠부'를 방문할 기회가 있었습니다. 문화일보 박현수 조사팀장과 협회장(YTN 유영식)이 예고없이 실례를 무릅쓰고 숭례문 새 사옥 16층에 위치한 인테리어가 멋진 아늑한 사무실을 둘러보았습니다.


박서영 회원은 언론진흥재단의 데이터저널리즘 초급 강의를 받기 위해 없었고, 강한 리더십으로 부를 이끌고 있는 든든한 최종욱 부국장 겸 DB컨텐츠부장, 김지오 과장이 따뜻한 커피로 우리 일행을 맞이해 주었습니다.

 

 

 

 

사진으로 보듯이 깔끔한 사무공간과 함께 누렇게 바랜 보존용 신문 제본 서가, 한켠엔 최신 발행신문 보관함, 과거 신문의 디지털화를 위한 공간으로 짜여져 있었습니다. 언제나 조사기자의 땀과 열정을 후끈 느낄 수 있는 공간속에 뭔지 모를 흥분이 생겨났었습니다.

 

전직 사진부장 출신의 최종욱 부국장의 업무 추진으로 한국일보는 기존 스캔방식의 지면 디지털화가 아닌, 고화질의 '사진촬영' 방식으로 지면 디지털을 하는 혁신을 하고 있었습니다. 지면 스캔에서 느낄 수 없는 빛바랜 색감을 그대로 옮길 수 있었고, 그로 인해 '타임머신을 타고' 발행 당시의 신문을 넘겨보는 묘미를 느끼게 했습니다.

 

 

올 초 '혁신'의 감동을 주었던 사설 큐레이션 콘텐츠 http://blog.naver.com/heditorial 을 보더라도 우리 조사기자들의 열정이 회사 안의 고군분투를 벗어나, 회원사별로 같은 고민을 함께 풀 기회와 모임을 협회가 지속적으로 마련해야겠다는 생각이 들었습니다.

 

 

 

바야흐로 (빅)데이터의 시대, 조사기자의 기대되는 언론산업에서 역할과 전문성을 잘 잡아내는데 협회가 그 길잡이 역할을 해줄 것을 최종욱 부국장이 당부하면서 짧은 만남을 정리했습니다.

 

<사진 왼쪽으로부터 문화일보 박현수 조사팀장, 유영식 조사기자협회장(YTN), 최종욱 한국일보 DB컨텐츠부장(부국장)>

 

 

블로그 이미지

한국조사기자협회

사단법인 한국조사기자협회는 1987년 국내의 신문, 방송, 통신사의 조사, 정보, 자료, DB업무를 담당하는 조사기자들의 모임으로 출범하여, 2009년 회원들의 연구활동에 기초한 신문 및 방송 발전에 기여할 목적으로 사단법인으로 재출범하였으며, 언론공익활동으로 신문논술대회, 조사연구 발간, 세미나·토론회, 보도연감 출판 등의 사업을 하고 있는 언론단체입니다

안녕하십니까?

(사)한국조사기자협회는 아래와 같이 2016년 5월 19일~20일 이틀간

제50회 정기 세미나를 ‘뉴스 빅데이터와 에버그린 콘텐츠 전망’ 주제로 개최하고자 합니다. 

협회원들의 적극적인 참가를 요청드립니다.


                              

                                - 아    래 -

   가. 기간 : 2016년 5월 19일(목)~20일(금), 1박 2일
   나. 장소 : 전주 르윈호텔
   다. 주제 : ‘뉴스 빅데이터와 에버그린 콘텐츠 전망’
                 - 뉴스 빅데이터 ‘빅카인즈(Big KINDS)’를 활용한 뉴스콘텐츠 개발
                 - 영상아카이브를 활용한 큐레이션 서비스와 비즈니스 전략
                 - 빅데이터 시대 조사기자의 역할
   라. 참가비 : 10만원/1인당
   마. 입금계좌 : 하나은행 159-910010-10804 사단법인 한국조사기자협회
   바. 참가비 납부 및 신청서 접수 일정 : 5월 2일(월)~5월 16일(월)
   사. 문의: 김빈나 간사장

 

회원분들의 많은 참여와 성원을 부탁드립니다.

 

 

 

제50회 정기세미나_공문.pdf

 

 

블로그 이미지

한국조사기자협회

사단법인 한국조사기자협회는 1987년 국내의 신문, 방송, 통신사의 조사, 정보, 자료, DB업무를 담당하는 조사기자들의 모임으로 출범하여, 2009년 회원들의 연구활동에 기초한 신문 및 방송 발전에 기여할 목적으로 사단법인으로 재출범하였으며, 언론공익활동으로 신문논술대회, 조사연구 발간, 세미나·토론회, 보도연감 출판 등의 사업을 하고 있는 언론단체입니다

'신문 26년: 150만 건 기사의 뉴스 빅데이터로 본 신문의 역사' 발간
언론진흥재단, 빅데이터 통한 분석 웹진 ‘NAI’ 발간

 

150만 건 기사의 뉴스 빅데이터로 본 신문의 역사


지난 26년간 언론에서 가장 논쟁적인 정보원은 누구였을까? 어떤 해에 어떤 주제가 쟁점이 됐을까? 어떤 주장이 나왔고, 어떻게 반박됐을까? 이제 이러한 궁금증을 상당 부분 자동으로 풀 수 있게 됐다. 기계학습, 자연어처리, 의미연결망 분석 등 다양한 뉴스 빅데이터 분석 방법을 적용한 시스템 '빅 카인즈'를 통해서다.

 

한국언론진흥재단(이사장 김병호) 미디어연구센터 연구팀은 18일 다양한 사회적 의제에 대한 뉴스를 빅데이터 분석을 이용해 대규모로 살펴보는 뉴스 빅데이터 분석 전문보고서 'News Big Data Analytics & Insights'(뉴스 빅데이터 애널리틱스 앤 인사이트, NAI)를 창간했다. 분석을 위한 기초 데이터는 재단의 뉴스 빅데이터 시스템인 '빅 카인즈'를 통해 얻었다.

 

◆ NAI 창간호, 26년치 150만 건 기사 뉴스 빅데이터 분석

 

창간호에서는 1990년부터 2015년까지 26년간 8개 중앙지 및 그 자매지의 정치면, 사회면, 경제면에 보도된 기사 약 150만 건의 기사의 정보원과 인용문 주제를 분석했다. 국내 뉴스 빅데이터 분석 규모로는 최대다. 분석 매체는 경향신문, 국민일보, 동아일보, 문화일보, 서울신문, 세계일보, 한겨레신문, 한국일보 등 '빅 카인즈'에서 서비스 예정인 주요 전국일간지 8개로, 디지털화된 종이신문 기사는 물론 이들 신문이 언론사 닷컴에 게재한 인터넷신문, 잡지 등의 기사를 모두 분석했다.

 

데이터 시각화 전문기업 <비주얼다이브>(www.visualdive.com, 대표 은종진)와 함께 뉴스 빅데이터를 효과적으로 보여주기 위한 사이트(http://goo.gl/I7PZdp)도 만들었다. 사이트는 핑거프레스, 차트 다이브 솔루션을 이용해 구현됐다. 사이트에선 경제지 4개와 문화면을 더해 310만여 건의 기사의 정보원연결망과 기관연결망, 주제연결망을 연도별, 매체별, 지면별로 선택해 볼 수 있다.

 

 

그림1 <신문 26년> 시각화 사이트 초기화면

 

◆ 정치면 중요도 1위 정보원, 야당 대변인에서 대통령으로… 주제는 ‘미국’ 등 주변국 중시

 

가장 중요한 정보원을 분석한 결과 정치면은 야당 대변인의 시대에서 대통령의 시대로, 사회면은 정치인의 시대에서 교육부의 시대로 넘어갔다. 이러한 변화는 대체로 1999년부터 2000년대 초 사이에 이뤄졌으며 매체 간 차이는 거의 없었다.

 

<그림 2>는 기사 공동인용 정보원 수 기준으로 변인과 대통령의 중요도가 가장 높았던 1995년 세계일보의 박지원 대변인 중심의 정보원연결망과 2003년 서울신문의 노무현 대통령 중심의 정보원연결망을 비교한 것이다. 1995년은 새정치국민회의가 창당한 해, 2003년은 노무현 대통령이 취임한 해다. 박지원은 162명과, 노무현은 271명과 공동인용됐다.

 

사회면은 2000년 전후로 중요 정보원이 바뀌었다. 2000년 이전엔 국회의원 등 정치인의 비중이 높았다. 특히 검찰 출입 기자가 정치인에 대한 각종 수사를 취재하고 이에 대해 정치인들의 멘트를 받아 실는 경우가 많았다.
경제면의 경우 대부분의 시기에 재정과 금융 관료조직이 중시됐다. 다만 2000년대 초중반엔 주식이나 부동산 투자 등 재태크 관련 애널리스트나 컨설턴트가 부각됐다.

 

 

 

그림2 정치면의 뉴스 정보원연결망 비교

 

◆ 경제면 주제는 ‘중소기업’과 ‘미국’에서 ‘소비자’와 ‘중국’으로

 

인용문 주제 분석으로 살펴보면 우선 정치는 ‘미국’ 등 주변국을 중요한 주
제로 다뤘다. 또 1990년대엔 ‘민자당’ 등 보수정당이 가장 논쟁적인 화두로 던져졌다. 언뜻 앞서 야당 대변인이 중시된 정보원 분석 결과와 모순된다고 생각할 수 있지만, 이는 야당 대변인 역시 보수정당에 대한 비판을 주로 가했기 때문이다.

 

경제면의 주요 주제는 특히1998년 외환위기와 2008년 금융위기를 계기로 급변했다. 과거엔 ‘미국’과 ‘중소기업’이 주된 화두였지만, 금융위기 이후 ‘중국’과 ‘소비자’가 논쟁의 중심으로 부상한 것이다. 시기적으로 보면, 1990년대엔 ‘중소기업’, 외환위기 이후 3년간은 ‘구조조정’, 이후 ‘미국’ 주제가 중심이 됐고, 금융위기 후 ‘중국’과 ‘소비자’가 부각됐다. ‘소비자’가 중시된 건 홍보성 기사가 많아졌기 때문이다.

 

사회면은 다른 경우와 달리 매체간 차이가 눈에 띄었다. 한겨레사신문은 ‘노동자’를, 서울신문은 ‘공무원’을 특별히 중시했다. 가장 논쟁적인 주제는 2015년 ‘메르스’였다. 이밖에 ‘수사’ ‘피고인’ ‘피해자’ 등 경찰이나 검찰 관련 주제가 많았다. ‘서울’, ‘교육부’, ‘서울대’ 등 서울시나 교육 담당 출입기자가 다뤘을 만한 주제도 중시됐다.

 

◆ 기사 대폭 늘었지만 기사당 정보원과 주제는 감소

 

결측이나 미분류 기사가 있긴 하지만 추세만 보면, 26년간 기사가 매체별로 많게는 18배 가량 급증했다. 이는 전체적으론 종이신문의 지면 수도 늘어났으며, 인터넷 신문 등 자매매체도 많아졌기 때문이다. 이와 함께 정보원 수와 주제 수 또한 매체에 따라선 많게는 약 11배가 늘었다. 즉 인터넷 등장으로 절대적인 다양성은 더 커졌다. 그러나 기사당 정보원 수와 주제 수는 감소했다. 기사는 많이 쓰지만, 그만큼 정보원이나 주제를 발굴하진 못한 셈이다.

 

 

그림3 기사당 정보원 수

 

◆ 오늘 뉴스 빅데이터 시스템 <빅 카인즈> 공개


NAI는 PDF 파일 형식의 웹진 형태로 배포되며 격월로 연 6회 발간될 예정이다. 연도별, 매체별, 지면별 뉴스 정보원 연결망 등을 시각화한 사이트도 함께 공개될 계획이다. NAI는 창간호 <신문 26년>을 비롯해, <인공지능 26년>, <황사 26년>, <한류 26년>, <SNS의 역사> 등을 다룰 예정이다 .
자료는 한국언론진흥재단의 뉴스 빅데이터 분석 시스템인 <빅 카인즈(Big KINDS, big.kinds.or.kr)>를 활용하여 수집한다. 한국언론진흥재단은 오늘 오후 2시 서울 광화문 프레스센터 20층 국제회의장에서 출범행사를 열고  <빅 카인즈>를 언론 및 학계와 정부, 기업 등 관계자에 정식으로 공개했다.


(=한국조사기자협회 취재팀 press@josa.or.kr)

 

 

블로그 이미지

한국조사기자협회

사단법인 한국조사기자협회는 1987년 국내의 신문, 방송, 통신사의 조사, 정보, 자료, DB업무를 담당하는 조사기자들의 모임으로 출범하여, 2009년 회원들의 연구활동에 기초한 신문 및 방송 발전에 기여할 목적으로 사단법인으로 재출범하였으며, 언론공익활동으로 신문논술대회, 조사연구 발간, 세미나·토론회, 보도연감 출판 등의 사업을 하고 있는 언론단체입니다

한국조사기자협회 취재팀에서는 한국언론진흥재단(이사장 김병호) 미디어연구센터 연구팀과 데이터 시각화 전문기업 비주얼다이브 (대표 은종진)이 함께 제작한 뉴스 빅데이터 전문웹진 전량을 그림파일로 게재하니, 협회원 뿐만 아니라, 미디어업계 관계자나 연구자들이 활용하길 바랍니다.

(=한국조사기자협회 취재팀 press@josa.or.kr)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


 

 

블로그 이미지

한국조사기자협회

사단법인 한국조사기자협회는 1987년 국내의 신문, 방송, 통신사의 조사, 정보, 자료, DB업무를 담당하는 조사기자들의 모임으로 출범하여, 2009년 회원들의 연구활동에 기초한 신문 및 방송 발전에 기여할 목적으로 사단법인으로 재출범하였으며, 언론공익활동으로 신문논술대회, 조사연구 발간, 세미나·토론회, 보도연감 출판 등의 사업을 하고 있는 언론단체입니다

미국 구글북스의 저작권 소송 과정이 구글이 최종 승리했다고 합니다. 그러나 구글의 저작물에 대한 영토확장에 대해 이용자의 편의성이란 측면으로 저작권 침해를 허용하는 것이 아닌지 걱정스럽기도 합니다.
미국작가조합은 중간복제(intermediate)란 개념을 통해 작품을 복제(스캔)해서 데이터베이스를 구축함으로써 원작을 훼손하는 중간복제 행위라는 주장을 펼쳤다고 합니다.

반면 구글은 자신들의 작업이 이용자들의 편의를 향상시킨다는 주장이었습니다.
결국 미 연방대법원은 “구글이 책 페이지를 작은 조각으로 나눈 것은 연구자들이 해당 책이 관심 영역에 있는 지 판단하도록 하기 위해 충분한 맥락을 제공해준 것이다”면서 “따라서 조각으로 보도록 한 것은 연구자들의 변형적 이용에 가치를 더해준다”고 판단했습니다.


미국법원이 변형적 이용(transformative use) 개념을 "공정 이용" 판단에서 중요한 잣대로 활용했다는 사실은 저작권 판례에서 중요한 개념일 수 있겠습니다.
변형적 이용은 ‘상업적 이용’의 대척점에 있는 것으로서 흔히 목적의 비상업성 요건을 대체하는 것이란 게 대체적인 판례라고 합니다.

 

 

관련기사보기

 

 

 

구글북스

 

블로그 이미지

한국조사기자협회

사단법인 한국조사기자협회는 1987년 국내의 신문, 방송, 통신사의 조사, 정보, 자료, DB업무를 담당하는 조사기자들의 모임으로 출범하여, 2009년 회원들의 연구활동에 기초한 신문 및 방송 발전에 기여할 목적으로 사단법인으로 재출범하였으며, 언론공익활동으로 신문논술대회, 조사연구 발간, 세미나·토론회, 보도연감 출판 등의 사업을 하고 있는 언론단체입니다

 

 

 

한국언론진흥재단 (이사장 김병호)은 오는 19일 오후 2시 서울 중구 태평로 한국프레스센터 20층 국제회의장에서 3000만 건의 뉴스데이터를 바탕으로 구축된 뉴스 빅데이터 분석시스템 ‘빅카인즈‘(BIG KINDS) 서비스 개시 행사를 개최한다.
빅카인즈는 키워드를 입력하면 해당 키워드 언급 추이, 매체별 언급 빈도, 다양한 심층보도 등을 입체적으로 보여주게 된다.
문의: 언론진흥재단 뉴스빅데이터팀 한빛나 (02-2001-7572) binnacomm@kpf.or.kr

(=한국조사기자협회 취재팀 press@josa.or.kr)

 

 

 


 

블로그 이미지

한국조사기자협회

사단법인 한국조사기자협회는 1987년 국내의 신문, 방송, 통신사의 조사, 정보, 자료, DB업무를 담당하는 조사기자들의 모임으로 출범하여, 2009년 회원들의 연구활동에 기초한 신문 및 방송 발전에 기여할 목적으로 사단법인으로 재출범하였으며, 언론공익활동으로 신문논술대회, 조사연구 발간, 세미나·토론회, 보도연감 출판 등의 사업을 하고 있는 언론단체입니다