Share!

調べ物やデータを集める際、似たようなデータなのに、違うサイト上で全く異なる形式で公開されていて、処理に困る、という経験、ありませんか?

そうした課題を解決するために生まれたのが、コンピューターで処理しやすい形式で公開されたデータを公開する技術、リンクトオープンデータ(LOD)です。

ユーザーにとってありがたいリンクトオープンデータですが、実は企業にとってもメリットがあるんです。

そこで、今回は、リンクトオープンデータとリンクトオープンデータが秘める可能性について解説いたします!

従来のデータは人間向けに作られている

これまで、ウェブサイトでデータを公開する際には、人間が視覚的に見て、わかりやすい形式が選ばれてきました。

つまり、ウェブ上で公開されるデータは、基本的に人間向けのものだったのです。

しかし、コンピューターの情報処理能力が著しく向上し、あらゆる分野でビッグデータの活用が謳われる今、ウェブ上のデータの下処理を人間が主導で行なっていても解析のスピードがとても追いつきません。

そこで、現在、ウェブ上でデータを公開する際に、コンピューターが処理しやすい形式を採用する企業が増えています。

そして、コンピューターにとって最も処理しやすい形式が、リンクトオープンデータなのです。

特定の書式であらゆるデータをリンクさせる

リンクトオープンデータはその名の通り、各要素にURI(Uniform Resource Identifier)が割り振られたオープンデータです。

各要素にURIを割り振る為に使われる規格がRDF(Resource Description Framework:資源記述の枠組み)と呼ばれるものです。

RDFでは、ウェブ上の情報データ(メタデータ)を主語、述語、目的語の三つの要素(トリプル)に分類し、特定の書式で記述することで、コンピューターで処理しやすくしたデータ規格です。

例えば、「データのじかん(主語)」の「運営会社(述語)」は「ウイングアーク1st株式会社(目的語)」のように、あらゆるものの関係を明示しながらリンクすることができます。

そのため、性質が異なるデータでも同じプログラムで情報の取得ができるため、情報収集の手間が省けるのです。

ウェブの創始者が提案するオープンデータの評価のスキーム

ウェブ上で公開されるデータは、コンピューターの処理のしやすさで星がつけられています。

  • JPEGやPDFのように機械で判別困難な形式は星一つ
  • XLSやDOCのように機械で判別可能な形式は星二つ
  • CSVやXMLのように機械で処理しやすい形式は星三つ
  • RDFは星四つ
  • RDFの要素にURIが設定されているデータ(リンクトデータ)は星五つ

この五つ星オープンデータスキームを考案したのは、ウェブの創始者とも呼ばれる計算機科学者のティム・バーナーズ=リー(Tim John Berners-Lee)なんです。

ティムは、欧州原子核研究機構で研究を行っていたロバート・カイリュー(Robert Cailliau)とともにWorld Wide Web(WWW)を考案し、URLやHTTP、HTML の最初の設計を行いました。一連のティムの仕事は、まさにウェブの発明といえるでしょう。

では、なぜコンピューターにとって良質なデータをオープンデータとして、公開する必要があるのでしょうか?

信用経済において良質なデータの公開は重要な役割を待つ

多くのユーザーにとってデータが処理しやすい形式で公開されることは多大なメリットがあります。

一方で企業側はどうでしょうか?

リンクトオープンデータは、信用性や活用性が高い反面、管理が大変であるというデメリットがあります。オープンデータであるという特性上、常にURIの監視を行い、リンクの修正や改善を行う必要があるため、公開にかなりのコストがかかります。

例えば、研究機関ならば、そのコストを支払っても、データの活用や、成果の公開という意味でデータの公開は大きなメリットを与えてくれます。

しかし、企業にとって、データの公開は一見、メリットがないように思えます。大きなコストをかけ、自社で集めたデータを競合に利用されたら?なんて思うと、データの公開に踏み切ることはなかなかできませんよね。

では、オープンデータを公開することで企業はどんな利益を享受できるのでしょうか?

キーワードとなるのが「信用経済」です。

信用経済とはその名の通り、経済活動において、信用が大きな役割を果たす、というものです。

情報の拡大や技術の発達が加速度的に進む今、商品自体の質は日々向上しています。

つまり、高い技術が速い速度で流通することで、ほとんどの製品において、企業やブランド問わず最低限の質が保たれている、という状態が生まれています。

そこで、商品を選ぶ際に「信用」や「共感」が大きな判断基準になるのです。

例えば、2017年に18〜64歳を対象に行われた「消費意識に関する意識調査」では、商品を選ぶ際に企業が発信する情報を見る、という回答がどの世代でも50%を超えており、18〜49歳においては60%以上を占めています。

また、近年、企業の道徳的な流通や動向に着目し消費行動の参考にする「エシカル消費」を行う人々も増えてきています。

社会における経済のあり方が変化する今、成果を自社のみのために利用する企業やブランドよりも、成果を消費者や社会のために広く活用しよう、という企業の姿勢が、結果的に消費者の消費意欲を刺激し、大きな利益に繋がりうるのです。

まとめ

高度情報化社会において、良質な公開方法で公開されたデータの需要は日々高まっています。

今回はオープンデータの中でも特に評価の高い、リンクトオープンデータについてご紹介しました。

今回ご紹介した内容をまとめると、

  • リンクトオープンデータはその名の通り、各要素にURI(URL)が割り振られたオープンデータのことをいう
  • リンクトデータで使われる規格はRDF(Resource Description Framework: 資源記述の枠組み)と呼ばれるもの
  • RDFは、ウェブ上の情報データ(メタデータ)を主語、述語、目的語の三つの要素(トリプル)に分類し、特定の書式で記述することで、コンピューターでの自動処理を可能にする
  • オープンデータを、情報の公開方法によって評価したものが、五つ星スキーム
  • オープンデータを公開するにあたり、企業はコストを支払う必要があるが、信用や共感を得ることができる

データをきちんと管理し、信頼性を高めることで多くのユーザーがデータにアクセスしやすくなります。

その結果、情報が広く流通し、社会のよりより発展につながります。

また、企業は認知度や信用度という観点で企業価値を高めることができます。

データを公開することには常にリスクやコストが伴いますが、情報の流動性が高まる中、情報の公開が持つ可能性をぜひ考えてみてください。

【参考引用サイト】
・ ミレニアル世代の消費行動は「共感できる情報」がカギ
・ 5つ星オープンデータ

(大藤ヨシヲ)

この記事を読んだあなたにおすすめのタグ

この記事を読んだあなたにおすすめのタグ

「データ活用」ランキング

人気のカテゴリ