태터데스크 관리자

도움말
닫기
적용하기   첫페이지 만들기

태터데스크 메시지

저장하였습니다.

NewsML의 이해

뉴스ML 2008/01/09 15:58
1. NewsML이란?
    1.1 개요
NewsML은 IPTC가 발표한 가장 최신의 국제 표준 뉴스 포맷이다. NewsML은 원래 뉴스 교환을 위한 표준 포맷을 정하는 목적으로 설계되었으나 아카이브 구축, 뉴스의 작성, 편집, 관리, 출판의 전 영역을 지원할 수 있는 것으로 인정받았다.

NewsML은 XML로 된 문서이다. XML문서는 미리 정의해 둔 문서 구조에 따라 효과적으로 뉴스 콘텐트를 표현할 수 있다.

NewsML은 미디어 중립적인 특성을 갖는다. NewsML 문서는 텍스트, 영상, 음향, 그래픽, 사진 등과 같은 다양한 종류의 미디어를 단지 해당 문서의 타입을 구분할 수 있는 정보만 가짐으로써 수용한다. 예를 들어 특정의 콘텐트에 대해 Media Type이 Text인지 Photo인지에 대한 정보, 또 이것이 Photo일 경우 JPEG인지 TIFF인지를 인식할 수 있는 정보만 있다면 그것이 어떤 종류의 미디어라도 상관하지 않는다.
종래에는 기사작성시스템, 집배신시스템, 아카이브, 화상시스템, 배포와 출판 등의 응용시스템들이 각각 개별적으로 뉴스를 생산, 관리, 보관, 편집, 배포, 출판하는 방식을 취해왔다. 이로 인해 같은 뉴스가 여러 곳에 존재하는가 하면 뉴스 관련 정보를 통합 관리하지 못하는 불편함을 감수해야 했다. NewsML은 이런 문제를 해결하는 가장 최신의 방법을 제시한다.


1.2 NewsML은 XML문서이다

왼쪽 그림은 NewsML로 작성된 뉴스 콘텐트의 소스 일부를 보여주는 것이다. NewsML 은 웹 문서인HTML과 비슷하지만 데이터의 형식과 구조에 대한 정보만 포함할 뿐 디자인에 대한 어떠한 정보도 포함하지 않는다.

뉴스 콘텐트의 상호 교환에는 디자인적 요소가 포함될 필요가 없으며 콘텐트의 내용과 이를 설명하는 정보(메타데이터)만 포함하면 되기 때문에 XML기반의 NewsML이 이상적인 교환 수단이 된다.
1.3 NewsML 계층구조로 이루어져 있다

뉴스 콘텐트의 교환은 콘텐트 그 자체인 내용 뿐만 아니라 내용을 설명하는 정보(이것을 ‘메타데이터’라고 부른다)와, 어떻게 그 콘텐트를 처리할 것인가 하는 정보(기사 관리 정보), 그리고 그 콘텐트가 전달되어지는 경로와 과정 등에 대한 정보들과 함께 교환이 이루어진다. 이같은 다양한 정보를 체계적으로 기록하기 위해 NewsML 문서는 네 가지 계층으로 구성되어 있다.
- ContentItem : 도표의 가장 안쪽에 위치한 콘텐트아이템(NewsItem)은 뉴스 콘텐트의 내용에 해당하는 것으로 뉴스 환경에서 다루어지는 정보의 기본단위이다. 여기에는 텍스트문서, JPEG사진, Flash애니메이션 등과 같이 어떤 종류의 미디어도 수용할 수 있다.

ContentItem은 기사의 본문에 해당하는 내용과 함께 이것이 텍스트인지 아니면 멀티미디어 데이터인지를 인식하기 위한 부가정보를 포함하고 있다.

- NewsComponent : ContentItem을 감싸고 있는 구조계층인 뉴스컴포넌트 (NewsComponent)는 뉴스의 개체를 담는 컨테이너 기능을 한다. NewsComponent는 여러 개의 ContentItem 즉 다수의 콘텐트를 포함할 수 있다. 일례로, 텍스트 기사와 이 기사와 관련된 여러 개의 사진(섬네일, 인터넷용, 출판용), 그리고 사진에 대한 별도의 설명문 등으로 구성될 수 있다.

NewsComponent는 해당 콘텐트의 제공자, 작성자, 출처, 파일이름, 작성일자, 저작권정보, 사용권한 정보, 주제 분류값, 장르와 같은 다수의 다양한 정보를 기록할 수 있다.

- NewsItem : 관리계층으로 불리는 뉴스아이템(NewsItem)은 NewsML에서 뉴스를 관리하는 가장 중요한 단위이다. NewsItem은 개별적으로 식별이 가능하고 출고할 수 있는 뉴스의 단위 조각이다. 이것은 정보제공자가 생성하고 보관하고 관리하고 재사용하며 다른 NewsItem에 참조시키거나 참조를 하게 할 수 있다.

NewsItem은 식별정보를 포함해 제공된 뉴스에 대한 변경정보, 상태정보, 긴급도 등처럼 뉴스 콘텐트 관리에 필요한 메타 데이터로 이루어져 있다.

일례로 변경정보(Revision)는 제공된 뉴스 콘텐트가 최초의 것 또는 수정된 것인지에 대한 정보와 변경이력을 기록할 수 있으며, 상태(Status)정보는 제공된 콘텐트가 사용가능한지(Usable), 추후 별도의 통지가 있을 때까지 출고를 제한하거나(Withheld), 특정 시점에서 출고를 허락하기 전까지 제한하거나(Embargoed), 기 제공된 뉴스가 어떤 이유로든 출고되지 않도록 조치(Canceled)할 수 있게 해준다.

- NewsEnvelope : NewsML 문서의 가장 바깥쪽에 위치한 교환계층인 뉴스엔벨로프 (NewsEnvelope)는 우편물의 봉투에 있는 정보처럼 뉴스 콘텐트를 배포시키는 역할을 한다. 해당 뉴스 콘텐트를 누가 제공하는지, 누구에게 제공되는지와 제공되는 날짜와 시간, 그리고 서비스나 상품에 대한 정보 등이 포함된다. 지금까지 설명한 네 가지 계층이 담당하고 있는 기능을 중심으로 NewsML의 문서구조를 도식화하면 다음과 같다.
1.4 NewsML은 Lifecycle 전체를 관리할 수 있다

뉴스 콘텐트의 본문 내용 이외에 이에 대한 관련 정보인 메타데이터가 다양하다는 것은 콘텐트의 활용도가 그만큼 높다는 것을 의미한다. 콘텐트 관리의 효율성도 그만큼 높아지게 된다. 각각의 계층에 포함된 메타데이터의 항목들을 간략하게 살펴보면 아래와 같다.
□ NewsEnvelope
□ NewsItem
□ NewsComponent
□ ContentItem
1.5 NewsML은 방대한 분류체계를 제공한다

NewsML이 DTD[3]를 통해 문서 구조를 표준화하는 방식으로 국제 표준의 뉴스 포맷을 제공하는 것에 못지않은 또 하나의 특징은 콘텐트 분류와 용어에 대한 표준을 함께 제공하고 있다는 점이다.

뉴스 콘텐트의 원활한 교환을 위해서는 콘텐트 포맷(구조)의 표준화 뿐만 아니라 콘텐트를 설명하는 각종 용어에 대한 표준화도 동시에 이루어져야 한다. 그렇게 하지 않으면 비록 NewsML로 제공했다 하더라도 부가정보를 인식할 수 없거나 다른 의미로 받아들여 오류가 발생한다. 일례로 A사가 콘텐트의 주제 분류값을 ‘경제’로 분류해 전송한 것을 B사는 ‘Economy’로 표현하고 있다면 시스템적 오류가 발생하거나 사람이 인식하기에도 불편이 따르고 나아가 별도의 변환이 필요하게 되어 NewsML로 제공된 목적을 잃게 된다.

이 문제를 해결하기 위해 반복적으로 자주 사용되거나 정해진 표현으로 명기해야 하는 각종 용어를 미리 정의해 두었는데 이런 용어를 ‘통제용어’라고 부르며, 통제용어를 유형별로 묶어 토픽셋(TopicSet)이라는 XML문서 형태로 제공하고 있다. IPTC는 통제용어가 등록된 토픽셋을 각국 언어로 번역해 사용할 수 있도록 웹사이트에 공개하고 있다.

모든 뉴스 공급자와 이용자들이 공통적으로 통제용어와 토픽셋을 사용함으로써 콘텐트의 유통을 손쉽게 하고 관리의 효율을 높일 수 있게 된다. 토픽셋이 어떻게 기능하는지를 알기 위해 장르와 주제코드인 Genre, SubjectCode 토픽셋을 예로 설명해 보기로 한다.

<Topic>

  <TopicType FormalName="Subject" Scheme="IptcTopicType" />

  <FormalName Scheme="IptcSubjectCodes">11000000</FormalName>

  <Description>정치</Description>

 </Topic>

<Topic Duid="A022">

  <TopicType Scheme="IptcTopicType" FormalName="Genre" />

  <FormalName Scheme="IptcGenre">Press Release</FormalName>

</Topic>                                                           ※이 코드를 이해하지 않아도 됩니다.

위 예제의 정보를 지닌 특정의 기사는 Subject 토픽셋의 ‘정치’라는 Topic 값으로 분류되어 있다. 이 값은 11000000의 고유코드(IptcSubjectCodes)를 가지고 있다. 만약 이것이 일본어로 된 NewsML문서라고 한다면 코드는 같고 Description만 ‘政治’로 대치된다.

또 특정의 기사가 Genre 토픽셋의 ‘Press Release’라는 Topic으로 분류된 것을 알 수 있는데 이 토픽을 참조함으로써 해당 콘텐트가 보도자료인 것을 자동적으로 인식해 시스템적으로 처리할 수 있게 된다.

토픽셋과 여기에 등록된 통제용어는 사전의 역할을 하는 동시에 뉴스 콘텐트를 분류하는 기능 때문에 토픽셋은 뉴스 콘텐트 분류체계(Taxonomy)이기도 하다. NewsML최신 버전에 포함된 토픽셋의 종류는 다음과 같다.

◇ 신뢰도                     ◇ 긴급도                  ◇ 전달 우선 순위                 ◇ 중요성
◇메타데이터의 중요성   ◇ 독자와의 관련성     ◇ 공개 지시 주제 코드 포맷   ◇ 주석
◇ 뉴스 라인 타입          ◇ 마임 (MIME) 타입  ◇ 미디어 타입                     ◇ 토픽 타입
◇ 메타데이터               ◇ 뉴스 아이템 타입    ◇ 롤 (ROLE)                      ◇ Property ◇ 전달 방법
◇ 독자층                     ◇ 장르                     ◇ NewsItem 의 라벨           ◇ Product
◇ 언어                        ◇ 국가명                  ◇ 통화 ( 단위 )                   ◇ 단체명 [4]
◇ 지 (역)명◇(미)산업분류코드 ◇나스닥 회사 코드

2. NewsML의 필요성
2.1 콘텐트 제공자의 입장
Digital & Multi Device의 등장으로 뉴스 콘텐트의 유통 구조는 더욱 복잡하고 다양한 양상으로 확대되고 있다. 취재한 기사를 조판시스템(CTS)에서 편집해 인쇄만 하면 되는 종이신문과는 비교가 되지 않는다. 고객은 콘텐트를 더 이상 수동적으로 수용하지 않는다. 과거에는 매체(콘텐트 제공자) 선택권이 우선하였으나 이제는 이용자가 어떤 디바이스를 통해 보고 있는지가 우선시되고 있으며, 수많은 콘텐트 중에서 단지 자신이 원하는 것만 선택적으로 접근하는 경향은 더욱 커지고 있다. 따라서 실시간과 맞춤서비스라는 요구를 충족시켜 주지 못하면 뉴스 독자층은 점차 엷어질 수 밖에 없다.

고객지향의 콘텐트를 생산하기 위해 사전에 치밀한 계획을 세워야 하는 것은 물론 독자에게 전달되는 일련의 과정이 아주 빠르고 체계적으로 진행되어야 한다. 뉴스 콘텐트의 관점에서 시스템과 서비스를 설계해야 하는 이유가 여기에 있다.
위 그림에서 보듯이 콘텐트의 계획단계에서부터 고객의 반응을 확인하는 최종적인 단계까지의 라이프사이클을 통합 관리할 수 있도록 하려면 각 단계의 영역에 관련되어 있는 어플리케이션들이 상호 연계성을 가질 수 있어야 한다. (아래 그림 참조)
업무 중심의 어플리케이션은 같은 콘텐트를 여러 곳에 두는 경향이 있었고 이로 인해 관리 및 유통의 효율성이 저하되었다. 일례로 신문용 기사와 웹용 기사를 별도 관리함으로써 운영 및 보관에 필요한 시스템 투자를 각각 해야 하거나 각 시스템마다 콘텐트의 작성자, 편집자, 웹 기자와 웹 관리자를 배치할 수밖에 없었다.

앞 페이지에 하단 그림은 업무중심의 어플리케이션이 콘텐트 관점에서 볼 때 어느 영역과 관련되어 있는 지를 잘 보여주고 있다. 쉽게 알 수 있듯이 특정 어플리케이션이 특정 단계에 독립적으로 관련된 것은 어떤 것도 없다. 다양한 어플리케이션들이 각각 여러 단계의 영역에 중복해서 관련되어 있다는 것을 전제로 볼 때 콘텐트에 대한 체계적인 정책이 더욱 절실해 진다고 볼 수 있다.

NewsML은 각종 어플리케이션과 하드웨어 시스템이 독립적으로 운영되면서 콘텐트를 효과적으로 다룰 수 있는 이상적인 수단을 제공한다. 언론사의 업무 흐름에서 NewsML이 적용되는 범위를 살펴보면 이를 쉽게 이해할 수 있다.
NewsML을 채택하지 않은 기존의 어플리케이션과 NewsML을 채택한 것과의 차이는 단지 NewsML에 기반하고 있다는 것의 차이에 지나지 않는다. 그러나 NewsML에 기반함으로써 뉴스 콘텐트를 다루는 견고함과 확장성이 뛰어나기 때문에 그것이 가져다 주는 영향은 무한하다.

경쟁력 있는 콘텐트를 생산하고 이를 효과적으로 관리함으로써 기회비용을 줄이는 한편 시장의 요구에 즉각 대응할 수 있는 상품을 구성하려면 NewsML과 같이 표준에 기반한 시스템 통합 운영이 이루어져야 한다.
2.2 콘텐트 시장의 관점
<콘텐트 유통구조의 개선> 종이신문을 제외한 디지털 뉴스 콘텐트 시장은 B2C와 B2B로 양분되어 있다. B2C는 콘텐트 제공업체가 직접 서비스를 제공하는 경우가 많은데 주로 웹, 이메일, 모바일 서비스가 여기에 속한다. B2B형태의 서비스는 그 유형이 매우 다양하다. 언론사는 콘텐트를 직접 소비하는 기업이나 단체, 포탈이나 은행처럼 개인 기반의 서비스를 제공하는 곳, 콘텐트를 전문으로 중개하는 기업, 제휴사를 비롯해 통신/언론사, 그리고 해외 송신 등이 여기에 속한다.

거래 유형이 다양한 만큼 유통 구조가 단순해야 하지만 그렇지 못한 것이 국내 실정이다. 전송방식은 그나마 인터넷 표준 프로토콜[5]에 의존하고 있으나 뉴스 콘텐트의 포맷과 메타데이터는 천차만별이다. 각 언론사마다 포맷이 고유하기 때문에 시장에 참여한 언론사 만큼이나 다양한 유형이 존재하는 셈이다. 이것은 마치 고속도로에 차선이 없는 것과 같이 매우 복잡하고 비효율적인 유통체계라고 할 수 있다
위 그림에서 보듯이 언론사4는 자사 고객들에게 상황에 따라 여러 포맷으로 콘텐트를 제공한다. 또 고객1 역시 여러 언론사로부터 각기 다른 포맷의 콘텐트를 제공받는다. 상품이나 시스템 변경이 있을 때마다 추가적인 작업이 병행되어야 하는 불편함과 비용의 부담도 감수해야 한다. NewsML은 이 같은 콘텐트 유통 구조의 복잡성과 기술적 낙후로 인한 시장 성장의 방해 요인을 제거하기 위해서도 꼭 필요한 수단이다.
<콘텐트 품질향상> 유통구조의 개선 못지않게 뉴스 콘텐트의 상품성도 향상되지 않고 있다. 뉴스는 그 자체가 가장 신뢰할 수 있는 콘텐트이지만 이들 콘텐트를 기반으로 만들어진 상품은 예전이나 지금이나 별반 달라진 것이 없어 콘텐트 제값 받기의 돌파구를 쉽게 찾지 못하고 있다.

일례로 콘텐트 시장에 참여하고 있는 언론사가 판매하고 있는 대부분의 콘텐트는 소위 RAW Data 수준의 속보 패키지가 주류를 이루고 있다. 언뜻 종이신문에 한번 사용한 것을 원자재 형태로 판매하고 있는 느낌을 주는데 상품성이 떨어지는 것은 당연하다.

언론사가 콘텐트의 품질향상과 상품개발에서 멀어져 있는 동안 언론사로부터 콘텐트를 제공받은 서비스업체들은 적극적으로 소비층을 발굴하고 서비스를 개발하는 노력을 아끼지 않았다. ‘뉴스는 포탈에서 본다’는 말이 당연시되었고 특정 언론사가 제공한 뉴스를 ‘A포탈 뉴스에 의하면’이라는 인용어가 나올 정도면 뒤바뀐 판세를 부정할 수는 없겠다.

콘텐트 관리 체계가 표준화되면 업무 프로세스도 표준화되어 생산성이 증대된다. 표준화는 콘텐트의 품질향상과 상품개발에도 큰 영향을 미친다. 아래 그림에서 보듯이, 기존 포맷으로 된 뉴스 콘텐트(좌측)로는 매우 제한적으로 상품을 만들 수 있고 멀티 디바이스에 대응하기도 어렵다. 그러나 NewsML 표준에 의한 뉴스 콘텐트(우측)로는 다양한 메타데이터를 활용함으로써 상품 개발과 콘텐트 자동처리가 매우 용이하고 멀티 디바이스로 콘텐트를 제공하는 것도 쉽게 이루어진다. 표준 즉, NewsML이냐 아니냐가 콘텐트 사업의 출발점이 되는 것이다.
<저작권보호> 한편, 뉴스 콘텐트의 무단 도용과 같이 저작권을 침해하는 일련의 상황들도 뉴스 콘텐트 시장의 성장을 방해하는 요인이다. 텍스트에 기반한 뉴스 콘텐트는 그 특성상 복제를 막을 수 있는 방법이 사실상 없다. 때문에 기술적인 방법으로 저작권을 보호하는 것은 한계가 있을 수 밖에 없다.

언론사가 자사의 웹사이트에 저작권 보호를 위한 기술적 장치[6]를 했다고 하더라도 포탈이나 기업 등에 콘텐트를 판매해 이들 매체를 통해 제3자에게 무제한 공개된다면 기술적 접근 방식을 통한 보호는 무용지물에 지나지 않는다.
더군다나 언론사가 제공하는 뉴스 콘텐트에는 저작권과 관련한 필수 정보[7]가 거의 명시되어 있지 않기 때문에 콘텐트 제공시점에서 이미 저작권 침해의 단초를 제공하고 있다. NewsML은 뉴스 콘텐트의 저작권을 보호하기 위한 필수 정보를 모두 기록할 수 있다. (오른쪽 그림 참조)

해당 콘텐트에 대한 소유권이 누구에게 있으며 그것이 발효된 날짜, 그리고 해당 콘텐트를 이용할 수 있는 권한에 대한 상세한 정보는 물론 저작권
보호를 위한 안내 문을 상세하게 기록할 수 있다. 특히 물리적으로 제3자에게 제공되는 콘텐트인 경우 이런 내용을 명시해 둠으로써 도용과 무단 전재 등을 예방하는 효과가 매우 크다. 아울러 개인이나 기업 등이 합법적인 범위 내에서 콘텐트를 인용 전재할 수 있도록 ‘인용허가에 관한 기능’을 NewsML 문서에 포함해 공급하는 것도 방법일 수 있다. [8]
3. NewsML도입시 효과
3.1 콘텐트 제공자
NewsML을 채택하면 뉴스 처리의 표준화가 가능하다. 관리 및 송수신 처리가 표준화되기 때문에 콘텐트 제공자가 콘텐트를 생산해서 상품을 만드는 과정은 물론 계약된 거래처에 전달하기까지의 기간을 단축시킬 수 있다. 급변하는 뉴스 시장에서 경쟁사에 비해 보다 빠르고 깊이 있는 콘텐트의 생산과 배포를 원한다면 NewsML 도입을 먼저 검토해야 한다.

NewsML은 콘텐트의 구조가 통일되어 있기 때문에 콘텐트의 질 향상을 가져오고 콘텐트간 품질 비교가 매우 용이하다. 또 용어가 통일되어 있어서 콘텐트의 글로벌화에도 어려움이 없다.

NewsML은 뉴스 제작 업무의 전반에도 영향을 미친다. 관리는 물론 고객에게 제공할 각종 정보 등 세세한 부분도 놓치지 않고 관리하며 이들 정보를 시스템적으로 자동 처리함으로써 콘텐트 패키징도 용이하다.

NewsML은 조판시스템과 웹용, 모바일용 등 각기 다양한 목적의 출판에 필요한 요소 정보들을 체계적으로 제공하기 때문에 최종적으로 콘텐트의 활용도를 증진시킬 수 있다.

각종 어플리케이션 시스템간 인터페이스의 표준화가 가능해 개발기간을 대폭적으로 단축시킬 수 있으며 데이터 형식이 표준화되어 있어 솔루션업체나 시스템 벤더들의 경쟁을 자연스럽게 유도할 수 있다. 특정 업체에 대한 의존도가 높았던 그간의 관행을 넘어 필요에 따라 얼마든지 여러 업체를 협력사로 둘 수 있다.
3.2 콘텐트 시장
뉴스 유통이 NewsML과 같은 표준 환경에서 이루어진다면 콘텐트 시장의 유통 체계가 단순화, 표준화된다.

뉴스 제공자는 하나의 단일화된 포맷으로 모든 고객에게 뉴스를 제공할 수 있다. 여러 종류의 상품이라도 문제가 안 된다. 뉴스를 제공받는 고객은 많은 제공자로부터 뉴스를 공급받더라도 모두가 단일 포맷이다. 송수신, 콘텐트 변환과 관리 등에 필요한 개발과 자원의 운영에서 제공자와 공급받는 측 모두 초기 비용이 대폭 절감되고 거래 건수가 늘어나도 비용은 거의 발생하지 않는다.

상품의 다양성과 거래의 촉진에도 영향을 준다. 고객은 필요한 콘텐트를 언제든지 요구할 수 있어야 하고 콘텐트 제공자는 고객이 원하는 시간에 원하는 콘텐트를 제공할 수 있어야 한다. 종래의 거래방식과 인프라에서는 거의 불가능했으나 NewsML은 이를 용이하게 한다. 콘텐트 제공자가 콘텐트 패키징을 하는데 별다른 제약을 받지 않음으로써 새로운 시장의 발굴과 확대도 가능하다. 특정 뉴스 콘텐트에 대한 수요가 있으면 언제든지 상품을 만들고 또 폐기할 수 있다. 나아가 NewsML이 글로벌 스탠다드이기 때문에 세계시장 진출을 위한 사업기회도 자연스레 주어진다.
4. NewsML과 기간시스템과의 연계
NewsML은 뉴스 콘텐트의 포맷을 표준화한 것이기 때문에 뉴스 콘텐트의 작성에서 배포에 이르는 전과정에 관련된다. 따라서 뉴스 시스템 전체 또는 일부에만 NewsML을 적용하는 것이 가능하다.

뉴스 시스템을 전면적으로 새로 구축할 계획을 세웠다면 완전한 NewsML기반에서 구축을 검토하는 것이 바람직하다. 기사작성시스템, 편집시스템, 화상시스템, 검색과 저작권관리, 출판시스템, 배포시스템, 아카이브시스템, CMS, CRM 등 모든 어플리케이션에 전면적으로 NewsML을 적용할 때 가장 큰 효과를 얻을 수 있다. 뉴스 포맷과 각종 용어의 표준화를 통해 어플리케이션간 인터페이스의 통일과 관리의 용이성을 제공해 주며 업무 프로세스를 단축시킬 수 있다.

NewsML을 뉴스 시스템 일부에만 적용하는 것도 가능한데 특히 NewsML이 최초에 교환을 위해 설계된 것인 만큼 교환과 연관된 업무에 적용될 경우 효과가 크다. CMS를 NewsML 기반에서 구축했다면 웹, 모바일, 이메일, eBook 등 디지털 디바이스로의 출판이 자유로우며 배포시스템에 의해 NewsML로 된 콘텐트를 외부로 전송할 수 있다. 디지털 콘텐트 시장에 적극적으로 참여하고자 하는 뉴스 제공사는 우선 NewsML 기반의 CMS구축을 고려해야 한다. 일부에 적용된 NewsML은 타 시스템으로의 적용을 촉진시키는 계기도 되며, 이후에 적용되는 시스템과의 통합에도 기술적 어려움은 발견되지 않는다.
5. 한국표준 NewsML-KR 개발
IPTC는 NewsML을 뉴스 제공사가 쉽게 채택할 수 있도록 NewsML과 관련한 소스와 정보를 무상으로 공개하고 있다.[9] 현재 NewsML V1.2가 최종 Edition인데 소스와 용어, 문서 등의 원문은 영어로 되어 있다. 영어 기반의 시스템 구축이라고 한다면 NewsML v1.2를 그대로 따르면 된다.

또 NewsML을 각 나라마다, 뉴스 제공사마다 변형하거나 확장하는 것도 가능하다. 이 경우 모두 타 NewsML 시스템과의 호환을 고려해야 한다.

NewsML-KR은 NewsML v1.2를 한글화하고 확장한 것이다. 한글화의 대상은 NewsML이 제공하는 토픽셋이다. 토픽셋은 NewsML이 사용하는 각종 용어들의 집합이다. 토픽셋 중 일부는 국내 실정에 맞게 확장했다. 예를 들어 SubjectCode[10]는 정치·경제·사회·문화와 같은 주제분류 코드(=토픽)를 등록해둔 토픽셋인데 여기에는 북한-북핵-청와대 같은 국내에 필요한 토픽이 존재하지 않는다.

NewsML의 일부 TopicSet(필요한 경우 새로 만들기도 함)은 국제적으로 통용될 수 있도록 IPTC 통제되지 않고 뉴스 제공사가 독자적으로 관리할 수 있다. 제공처, 수신처, 출처 등의 정보를 위한 토픽셋인 기관(Party), 인명(Person), 회사(Company), 발생처(Location), 기관명(Organization) 등이 여기에 속한다.

토픽셋은 뉴스 콘텐트에 대한 다양한 메타데이터인 동시에 뉴스 콘텐트의 분류체계 (Taxonomy)를 제공하기 때문에 매우 중요하다. 특히 교환시 이들 정보를 상호 참조할 수 있게 해야 하므로 NewsML에서 정의한 표준을 따라야 하며, 국내에서 확장된 부분에 대해서는 NewsML을 채택한 국내 뉴스 제공사가 공동으로 사용할 수 있어야 한다.
본 연구보고서의 마지막에서 공개하는 NewML-KR은 NewsML v1.2의 사양을 그대로 준수해 한글화하고 확장한 것으로써 모든 뉴스 제공사가 즉시 사용 가능한 국내 표준으로 설계되었다.
NewsML-KR 보급방안
한국표준으로 설계된 NewsML-KR 을 국내에 조기에 확산시키기 위해서는 NewsML에 대한 뉴스 제공사의 이해를 넓히는 것이 무엇보다 중요하다. 뉴스 제공사의 정책결정자나 관리자, 종사자들을 대상으로 한 관련 정보의 공개는 물론 교육 프로그램도 준비될 필요가 있다.

NewsML을 가장 잘 활용하고 있는 일본은 일본신문협회가 NewsML팀을 별도로 구성해 NewsML을 최초 제안한 로이터통신사에 연수팀을 파견하기도 하였다. 이 NewsML 팀에는 기술적인 한계를 극복하기 위한 효과적인 방법 중 하나로 뉴스 시스템 개발업체들이 함께 참여하였다.

본 연구보고서에 포함된 가이드라인, 기능명세서 등의 자료는 뉴스 제공사와 이용자, 뉴스시스템 개발업체 등에 공개하기 위해 제작된 것이다.

특히 NewsML-KR의 Source[11]는 향후 www.NewsML.or.kr에서 공개된다. NewsML-KR을 채택한 뉴스 제공사는 이 사이트를 통해 최신의 자료를 제공받을 수 있다.
참고로, NewsML-KR을 조기 확산시키고 디지털 뉴스 콘텐트 시장의 활성화를 위해서 한국언론재단이 NewsML 홍보 활동에서 한발 나아가 관련 기술의 개발과 보급에도 주도적으로 참여하는 것이 바람직하다. 최근 불어 닥친 언론사의 급격한 매출감소와 시장위축으로 인해 투자여력을 상실한 만큼 시장 상황에만 맡겨두게 될 경우 국내에서의 NewsML 확산이 아주 장기적인 과제로 남을 수도 있다. NewsML의 보급과 확산이 국내 뉴스 시장 전체에 미치는 영향을 고려할 때 특정 뉴스 제공사 그룹이 아닌 국내 뉴스 제공사 전체를 상대로 하는 것도 간과해서는 안될 부분이다.
7. NewsML 적용사례
7.1 해외에서의 사례
NewsML은 1998년 로이터통신이 처음 설계해 1999년 IPTC에 표준화를 제안함으로써 시작되었다. IPTC는 로이터의 제안을 검토 보완해 2000년 NewsML V1.0을 국제표준 뉴스 포맷으로 결정, 발표하였다. 로이터통신은 NewsML 포맷으로 전세계에 뉴스를 전송하고 있다. 로이터는 내부적으로 관리하는 약 400여개의 주제분류를 NewsML로 변환해 제공한다.

AFP는 대부분의 뉴스 콘텐트를 NewsML 기반으로 제공하고 있다. 멀티미디어 뉴스 콘텐트의 경우 약 150여개 고객사에 하루 평균 400여건을 제공하고 있으며 6개 국어로 된 텍스트 뉴스는 하루에 7천여건을 소화하고 있다. 내부적으로 XML로 생산된 뉴스 콘텐트를 배포하기 위해 NewsML로 변환하는 방식을 채택하고 있다. 아래 그림은 AFP가 제공하는 모바일 서비스의 실례를 보여주는 것이다.



AP는 2004년 초부터 eAP 제1단계 프로젝트를 추진 중에 있다. eAP는 2003년부터 개념이 개발되기 시작하였는데 IPTC표준을 수용하면서 ‘고객 지향 맞춤식 서비스 시스템 구축’을 목표로 하고 있다.

일본은 NewsML을 성공적으로 도입해 활용하고 있는 사례로 꼽히고 있는데 국내 시장환경과 유사성이 있는 만큼 그 과정을 구체적으로 살펴볼 필요가 있다. 일본신문협회 소속의 기술위원회는 2000년 NewsML팀을 별도로 구성해 현재까지 3기 팀이 활동 중에 있으며 이 팀에 의해 만들어진 nskNewsML이 일본 표준 NewsML이다. 언론사 종사자들이 기술적인 전문 지식이 부족하다는 인식에서 초기부터 외국통신사나 메이커, 벤더, 프로바이더 등의 기업에 소속된 기술자들이 NewsML팀에 함께 참여한 것이 특징이다.

NewsML팀은 초기 각 신문사 기사를 기초로 NewsML의 각 요소들과 비교분석을 실시해 표준안에 모두 수용될 수 있는지 그 타당성을 검증하였다. NewsML 기능사양서를 일본어로 번역한 것은 기술적으로 생소한 관계자들이 NewsML을 이해할 수 있는 결정적인 계기가 되었다고 NewsML팀은 평가하고 있다. 여기서 멈추지 않고 NewsML을 최초 설계한 로이터통신에 연수팀을 파견하는 열성을 보이기도 했다.

[그림] 기존의 국제 표준 뉴스 포맷도 NewsML로 전환해 가고 있다.


NewsML팀은 기능명세서 번역과 연수, 그리고 자체 워크샵 등의 활발한 활동을 통해 NewsML 가이드라인(해설서)을 자체적으로 작성해 관계자들에게 배포하는 한편, 교토통신사에 NewsML 도입을 제안하여 2001년 교토통신은 차기 뉴스 전달 포맷으로 NewsML을 공식 채택하였다.

2001년 일본 표준의 NewsML인 nskNewsML level 1이 정식 발표되었으며 마이니치 신문사가 nskNewsML level 1에 기초한 NewsML 소스를 공개하였다. 이 같은 일련의 과정 덕분에 일본에는 NewsML을 채택한 뉴스 제공사가 지속적으로 증가하는 추세이다.

일본 내에서 신문산업과 관련한 각종 전시회나 세미나에서 전국지, 지역지, 통신사 할 것 없이 NewsML을 전략적으로 채택했거나 채택할 것을 홍보하고 있을 만큼 NewsML은 일본 내 유일한 표준으로 자리잡아 가고 있다. 다음 그림은 NewsML 시스템이 일본에서 구현되고 있는 현황을 보여주는 그림이다.

7.1.1 마이니치신문(MAINICHI)의 MAITY와 PALACE 시스템
마이니치의 MAITY시스템은 멀티미디어와 지면편집(Pagination) 시스템을 위한 완성도 높은 CMS솔루션이다. 콘텐트의 입출력을 위해 NewsML을 사용하는 것뿐만 아니라 저장하고 관리하는 데에도 NewsML을 사용한다. 이 시스템은 콘텐트에 대한 정보와 워크플로우를 재구성하는 일련의 과정을 공유할 수 있게 해준다. 이를 위해 약 400여대의 PC에는 마이티 터미널 소프트가 설치되어 있다. MAITY시스템은 NewsML을 사용함으로써 텍스트 이미지 오디오 영상 등 기타 미디어의 관리를 모두 통합하였다.


아래 그림은 MAITY시스템이 NewsML을 사용하는 Workflow를 보여주고 있는데, NewsML을 사용해서 워크플로우를 재구성할 수 있으며 다른 지면의 워크플로우나 기사작성, 편집, 지면구성, 검토, 다양한 종류의 미디어를 통합하는 것이 가능해 졌다.



콘텐트 관리 시스템인 MAITY시스템과 함께 운영되는 PALACE시스템은 다섯 가지의 구성요소를 통합한 미디어 시스템이다. 다섯 가지 구성요소는 텍스트 또는 소재를 입력, 뉴스 소재를 편집하거나 조합, 구성 요소를 출력, 전송이나 배포관리, 용어(사전)를 관리하는 부분으로 구성되어 있다. (아래 그림 참조)

7.1.2 교토통신(KYOTO NEWS)
교토통신은 일본의 가장 대표적인 통신사이다. 일본 내에서만 1백여 개 이상의 신문사와 라디오 TV에 뉴스를 공급하고 있으며 AP, REUTERS, ITAR-TASS, UPI, XINHUA NEWS,
YONHAP NEWS 등 해외 대부분의 통신사와도 제휴를 맺고 있다.

교토통신은 2002년 6월부터 NewsML에 기반한 신시스템을 개발하기 시작해 2004년 2월부터 NewsML 방식으로 공급하고 있으며 오는 2008년까지 교토통신으로부터 뉴스를 공급받는 곳은 모두 NewsML을 수신할 수 있는 NewsML Receiving System을 보유해야 한다.
7.1.3 주니치신문(CHUNICHI )
하루 5백만부를 발행하는 주니치신문은 Photo 데이터베이스를 NewsML에 기반하여 구축하였다. 한 장의 사진은 무려 100여 항목에 이르는 MetaData를 저장하고 있다.
7.1.4 니케이신문(NIKKEI)
일본의 대표적인 경제신문인 NIKKEI는 다양한 종류의 미디어 시스템에서 NewsML을 사용하고 있으며 시스템의 명칭은 ‘NEWS SYSTEM’이다. NEWS는 Nikkei Economic-data Wire Service의 약자이다. 이 시스템은 NewsML로 된 니케이 콘텐트를 인터넷 등을 통해 빠르게 배포할 수 있도록 한다.
텍스트나 이미지와 같은 멀티미디어 콘텐트가 편집된 후 전자적으로 사용자들에게 배포된다. 즉각적이고 규칙적으로 스케쥴된 전송 서비스에 의해 빠른 배포를 가능케 해 준다. 니케이 뉴스시스템은 NewsML로 콘텐트를 제공받고 NewsML로 콘텐트를 제공하는 최적화된 시스템을 보유하고 있다.
7.1.5 산토 프로젝트(Santo Project)
산토 프로젝트는 NewsML 기반의 시스템 자원을 공동 개발하여 공동 이용하는 대표적인 성공 사례로 꼽힌다. 이 프로젝트는 서로 다른 지역에서 발행되고 있는 Kyoto신문, Kohbe신문, 그리고 Chugoku신문이 NewsML Data Center를 공동으로 설립해 콘텐트 관리와 관련한 시스템은 공유하고 지면편집 시스템만 각자가 보유하는 방식의 사업모델이다.
NewsML Standard를 채택함으로써 전체적인 구축비용 절감은 물론 3사가 공동으로 분담함으로써 이중의 절감효과를 얻었다. 별도의 회사가 NewsML Data Center를 운영하고 호스팅을 제공하는 것으로 알려져 있다.

이상에서 살펴본 외에도 뉴욕타임즈, 월스트리트 저널, 워싱턴 포스트, ANSA, PA, ATS, UPI, Business Wire 등의 통신사 신문사를 비롯한 여러 기업이 NewsML을 채택한 시스템을 운영하고 있다.
7.2 국내 NewsML 도입 사례와 분석
국내에 NewsML이 처음 도입된 것은 로이터통신이 2002년 국내에 뉴스 공급을 재개하면서 촉발되었다. NewsML 기반으로 뉴스 콘텐트를 제공하는 로이터는 당시 국내 파트너사인 뉴시스 통신사에 NewsML 기반의 뉴스 시스템 구축을 권고하였다.

당시 로이터가 제공한 NewsML은 현재와 같은 완전한 NewsML 스펙이 아니라 내부 시스템이 생산한 콘텐트를 NewsML로 변환해 제공하는 방식이었다. 당시 NewsML에 기반한 기사작성시스템, 송수신 및 배포시스템, 콘텐트 자동분류 시스템 등을 구축하였던 이뉴스네트웍은 이 경험을 바탕으로 CMS솔루션을 개발해 네이트, 야후, 팍스넷 등의 뉴스 서비스에 CMS솔루션을 구축했다.
국가기간통신사인 연합뉴스는 입체화된 뉴스 정보의 전달을 위해 기존의 텍스트 방식이 갖는 한계를 해결하고자 NewsML을 응용한 kNewsML을 개발했다. 대우정보시스템이 구축한 kNewsML은 내부 사용 보다는 외부 전송을 위해 CMS에서 kNewsML로 변환해 주는 방식을 취했다. 연합뉴스 관계자에 의하면 kNewsML은 NewsML 1.x와 일치하지는 않는다. 전면적인 NewsML 도입이 아니기 때문에 불필요한 요소들은 제거하고, 필요하다고 판단되는 것은 새롭게 추가하는 식의 응용모델로 개발되었다. 현재 kNewsML로 뉴스를 공급받는 곳은 닷컴 언론사와 포탈 일부인 것으로 알려져 있다. 다음은 연합뉴스의 kNewsML로 작성된 기사 예제이다.
한편 조선일보사의 자회사인 디지털조선은 ‘뉴스 정보의 표준화 및 전달기술’이란 주제의 연구과제를 수행한 바 있으며 이에 대한 자료는 언론사에 공개되지 않았다.

SBS 뉴스룸을 구축한 바 있는 IBM은 해외에서 NewsML 기반의 SI수주 경험을 십분 활용해 국내 신문 시장에 진출을 모색 중인 것으로 알려졌으며 2004년 들어 관련 세미나를 지속적으로 개최하고 있다. 이뉴스네트웍 기술부문에서 분사한 와이즈미디어는 NewsML기반의 자동변환, 자동분류, 맞춤검색 기능이 포함된 CMS솔루션을 발표하였다.

정리하자면, 국내에는 NewsML 관련한 프로젝트가 일부 있어 왔으나 NewsML 한국표준은 사실상 존재하지 않는다. 또 한국 표준을 위한 노력도 그 동안 거의 없었던 것이 사실이다.

지금까지 설명한 바에 근거하더라도 NewsML 한국 표준의 제정과 보급은 뉴스 산업의 활성화를 위해 최우선 해야 할 과제이며 이를 위해 뉴스 제공사간 이해관계를 초월한 협력이 필요한 시점에 와 있다.

[1] NewsML : News와 XML의 합성어로 ‘뉴스엠엘’이라 읽으며 영어로만 표기함.
[2] IPTC : International Press Telecommunications Council의 약자
[3] DTD : Document Type Definition, XML문서에 사용되는 구성요소를 정의해 두는 문서로 NewsML에서는 뉴스 콘텐트의 내용과 관련 정보 표현에 필요한 각종 항목을 정의해 둔다.
[4] 일부 토픽셋은 각 나라마다 독자적으로 정의하거나 확장해서 사용하도록 되어 있다.
[5] 예를 들어 FTP전송이나 Socket전송
[6] 예를 들어 DRM이나 유료화, 회원가입 등과 같은 일련의 조치.
[7] 대부분의 언론사는 뉴스 콘텐트에 저작권 표시를 않거나 정도의 최소 정보만을 표기하고 있다.
[8] 예를 들어 언론사와 언론사로부터 콘텐트를 제공받아 서비스하는 포탈 등이 콘텐트 뷰 화면에 [인용] 버튼을 공통적으로 삽입해 두고 이것에 의해서만 인용, 전재하도록 유도하는 캠페인.
[9] www.IPTC.org 또는 www.NewsML.org 참조
[10] 참고로 NewsML의 SubjectCode 토픽셋에는 약 1,200여개 이상의 토픽이 등록되어 있는데 이는 기존의 뉴스 제공사가 보유한 주제 분류 카테고리보다 훨씬 세분화된 것이며 한 개의 뉴스 콘텐트가 여러 개의 주제분류값(Topics)을 가질 수 있도록 설계되어 있다.
[11] DTD와 TopicSet을 비롯해 NewsML로 작성된 콘텐트 예제 등이 제공된다
출처 : 한국NewsML포럼(www.newsml.or.kr)  
이올린에 북마크하기(0) 이올린에 추천하기(0)
크리에이티브 커먼즈 라이선스
Creative Commons License

'뉴스ML' 카테고리의 다른 글

NewsML의 이해  (0) 2008/01/09
Posted by JP 뉴미디어산업팀