§ 情報資産としてのWebページ

Goodpic:RemixのためのWEBページ構造化とDomインスペクタ

なんで構造化を気にする必要があるかというと、それはRemixのためなんですね。

まさに。

----

時々物好きな団体から、「HTML(あるいはXML)について語ってください」みたいな内容の講義や講演を依頼されることがある。面倒だなぁと思いながらも、メインとなるリスナーのレディネスを考慮しつつプレゼンのアウトラインをあれこれ思案するのだが、いつも必ず盛り込むトピックがある。それがまさに、いわゆるWebページとして公開されているデータの加工(あるいは再利用)に関するトピックだったりする。

あくまでも個人的な意見なのだが、著作物をWebに公開する最大のメリットは、データの加工あるいは二次利用による利便性の向上にあると考える。

自身の知識を広げたり思考を深めたりする際に、資料となるドキュメントを加工して用いた方が利便性が高まることが多い。自分の問題意識にそって必要な記述のみを筆写したり、コピーしたりしてページから抽出し、スクラップすることは利用できるメディアが紙媒体しかなかった時代から一般的に行われていたことだ。そのことから考えても、ドキュメントを加工して利用することは利用者の立場からするとごく自然な行為であるような気がする。

Webの場合、この「ドキュメントの加工」が重要な意味を持つ。

まず根本的な部分に着目すると、ブラウザでHTMLドキュメントを閲覧する行為そのものがドキュメントの加工というプロセスを既に含んでいる。HTMLを用いて書かれているドキュメントのソースを読んで内容を即座に理解できる人というは少数であって、多くの場合ブラウザなどのツールを用いて人が受け入れやすいカタチにデータを変換するからこそ、新聞や雑誌を読むようにWebページを読むことができる。

それとは別の事例で最も身近なものは「検索エンジン」だと思う。検索エンジンは、Web上に公開されているドキュメントを勝手にというか自動的に読み込み、そこに含まれるデータを解析しインデックスする。そうして蓄積されたデータがあるからこそ機能し、我々はその恩恵にあずかることができるわけだが、この「解析、インデックス」というプロセスが、まさにドキュメントの加工にあたる。

また、利便性の向上という観点から言うと、ECやポータルにおいて提供されるパーソナライズド・ページはその典型ということになるだろう。収集したデータをなんらかの基準(属性等…)によって各ユーザ毎加工し提供するという行為は、感覚的には資料をスクラップしてノートにまとめる行為と大差ない。(Google Newsなどは、新聞のスクラップを地でいくようなサービスだ。)

それらを踏まえて現実的なレベルで考えると、プログラムに解析しやすい構造をドキュメントに与えることこそ、そのドキュメントの利便性を高めるための重要な手段となる。

例えば公開したドキュメントを多くの人に利用してもらいたいと考えるなら、クローリング・ロボットにそのページを読ませることを考えなければならないが、そのためにはロボットが読みやすい構造をドキュメントに与えてやらなければならない。そのテクニックの一つとしてSEOが注目されたりしたが、それは局所的に見ると検索エンジンというプログラムが利用しやすいデータ構造の最適化を狙ったものだ。しかし、収録しているコンテンツをより相応しいかたちで検索エンジンに解析させインデックスさせることで、そのコンテンツを必要としているより多くのユーザにリーチできるようになるため、結果としてみると多くのユーザの利便性を高めることにつながるわけだ。

そのような視点から考えると、HTMLが提供している構造は汎用的であるが故にいかにもユルい。収録しているコンテンツや利用手段にあわせて、相応しいデータ型を定義してユーザに提供したいという欲求が出てくるのは当然で、そういったニーズを満たすのはXMLの役目となる。

このようなコンテクストで眺めてみると、近年のRSSの興隆は充分にその必然性を備えている。例えば、RSSと検索の統合などの流れを見ると、それだけユーザがWebを利用するシーンが多様化し要求が変化しつつあるということのあらわれだと感じる。

もし情報資産として価値の高いページを持ちたいと考えるなら、内容を吟味するだけでなく、HTMLの構造を簡潔にしたり同時にRSSをフィードするなど、さまざまな「Rimix」に耐え得る対策を持つことを真剣に考えなければならない。今はもう、そんな時期なのだ。

Posted by tomo at May 24, 2005 5:05 PM | ESSAY | TrackBack |

Comments

Post a comment

Thanks for signing in, . Now you can comment. (sign out)
(If you haven't left a comment here before, you may need to be approved by the site owner before your comment will appear. Until then, it won't appear on the entry. Thanks for waiting.)

サイン・インを確認しました、 . さん。コメントしてください。 (サイン・アウト)
(いままで、ここでコメントしたとがないときは、コメントを表示する前にこのウェブログのオーナーの承認が必要になることがあります。承認されるまではコメントは表示されません。そのときはしばらく待ってください。)


Remember me?