韓国NAVERのデジタルニュースアーカイブ
2009-05-13 Wednesday Posted in Korea IT Trend | 9 Comments »
韓国NAVERから「デジタルニュースアーカイブ(Digital News Archive)」というサービスが2009年4月30日にベータバージョンをリリースした。
「デジタルニュースアーカイブ」とはネット時代以前の新聞をデジタイジング(Digitizing)*して紙の新聞感覚でWeb上に構築したデータベースサービスである。今回のベータバージョンでは1976年から1985年の間の記事がサービスされが、本サービスでは1920年から1999年までの記事がサービスされる予定。
単純にスキャンしたイメージを提供するのではなくて記事全文(Full Text)を提供してキーワードや日付などを指定して過去の新聞記事を手軽に検索できる。
このサービスが持っている一番大きい意味はWeb上ではなかなか手に入れることが難しかったネット以前の信頼性のある情報をWeb上で入手できることだ。
NAVERが韓国で最初に成功を掴んだのもWeb上にない情報をユーザーが作成するように誘導した知識INというサービスの役割が大きかったのを考えるとこのサービスの位置が理解できる。
デジタイジング(Digitizing)

新聞を一枚ずつスキャンしてイメージ領域と文字領域を分けて、各領域に存在する多様な構成要素(テキスト記事、写真記事、広告など)に固有の属性値を与える。また、抽出された個別文字別に座標値を指定する過程の後、最終デジタイジング産出物が完成される。
















