オントロジーの基礎知識|主な種類と仮想通貨やAIへの活用事例

空に映された地球のデータベース

コンピュータ科学や人工知能(AI)など、21世紀に入ってからのテクノロジーの発展には目覚ましいものがあります。その背景には半導体技術の発展や社会情勢などさまざまな要因が存在しますが、間違いなくその一つとして挙げられるのが「オントロジー」です。

オントロジーは、コンピュータに知識を獲得させる方法に関する概念・技術です。今回は、そんなオントロジーの概念や活用事例についてご紹介します。

オントロジーの基礎知識

情報科学におけるオントロジーの概要についてご説明します。特に、人工知能や機械学習の分野で重要な意味を持つ概念であることを理解していただければと思います。

オントロジー(Ontology)とは

オントロジーは、もともと哲学用語で「存在論」を意味していました。目の前にある具体的なモノ(存在者)の個別的な性質を超えて、そうしたモノを存在させるメカニズム(存在)を問題化し考察する形而上学の一分野がオントロジーでした。

転じて情報科学の分野では、「概念化の明示的・形式的な仕様」と定義されます。知識やデータ処理について記述する際のルールブック、仕様書が必要であるという考え方です。コンピュータに「パソコン」と入力しても、オントロジーがなければコンピュータにとってはそれが何を意味するか理解できず、単なる文字の羅列でしかありません。

オントロジーの概念を取り込むことで、「パソコン」の意味を推論し、「PC」や「コンピュータ」と同意語であることを理解し、その推論や理解に基づいて次にどう行動すればよいかを計画できるようになります。また、構造化されていない生の文章からスケジュールやコストなど必要な知識を整理して提供できるようになります。

つまりオントロジーとは、情報を理解しネットワーク化するための枠組み(フレームワーク)であると言えるでしょう。対象世界をどう捉えたかを明示し、どんなシステムでも共有できる形で知識を記述するための共通概念やルールを提供する枠組みです。特定領域の語彙と領域における制約、そして語彙の解釈を制限する言明などがオントロジーの構成要素となります。

オントロジーはコンピュータが知識を理解するために必要な枠組みであることから、特に機械学習や人工知能(AI)の分野で活用が進んでいます。より洗練されたオントロジーを組み込むことで、コンピュータは自らの事前知識で意味を補い、情報を理解できるようになります。

機械と異なり、人間の話す会話や書く文章には多義的な表現や省略、語順の転倒などが含まれます。従来のコンピュータは単語単位でその意味を理解しようとしていたものの、どうしても限界がありました。

しかしオントロジーを導入し改善させていったことで、人間の会話や文章に対してコンピュータが適切な反応を返しやすくなりました。これによって、機械学習や人工知能を組み込んだサービスの利便性が大きく高まったのです。

オントロジーは、世界を構成するモノ(存在者)を明示するとともに、モノの相互関係(同意語・包含・依存など)を定義することで、コンピュータが世界を正確に理解するための基盤を構築しようとする試みと言えます。

オントロジーの発生した背景

情報科学におけるオントロジーは、人工知能の研究の発達を背景に議論されるようになりました。1970年代の中頃、コンピュータの機能や管理できるデータ量の問題から人工知能研究は停滞期に突入しており、コンピュータが効率的にデータを蓄積・処理するためのブレークスルーが求められていました。

オントロジーは、推論を導く知識表現を研究する人工知能分野において、コンピュータが知識を獲得するための理論モデルとして提唱されました。知識を獲得し、ネットワーク化して人間の脳のような「システム」とするために、哲学用語としてのオントロジー概念を仮説的に導入することを考えたのです。

その後1990年代になって、技術用語としてオントロジーを具体的に定義する動きが進んでいきました。先にご紹介した「概念化の明示的・形式的な仕様」という定義も、この頃に固まったものです。

オントロジーの主な種類

オントロジーにはいくつか種類があります。ここでは、対象とする知識分野のレベルに応じて4つのオントロジーをご紹介します。

上位オントロジー

上位オントロジーは最も汎用性・抽象度の高いオントロジーであり、特定の分野や知識領域の範疇を超えて、世界全体に適用されます。知識の原理的な性質を分析するオントロジーであり、哲学用語におけるオントロジーに近い考え方と言えるでしょう。

「もの」「こと」といった抽象度の高い概念を最上位に持ち、これらを具体化した各概念(たとえば「具体物」と「抽象物」など)を下位要素として持っています。できるだけ広い範囲に適用でき、幅広く応用できるオントロジーの構築が課題となります。機械による知識の表現や、推論システムなどに利用されます。

ドメインオントロジー

ドメインオントロジーは、特定のドメイン=領域を対象としたオントロジーです。法律や医学、遺伝子工学など、専門領域で用いられることが多いです。ドメインオントロジーを用いることで、専門的な知識内容でも語彙の定義が可能となります。

タスクオントロジー

タスクオントロジーは、特定の問題解決のプロセス、すなわち行為を表現し体系化したオントロジーです。人間の知識のデータベース化や、人間と親和性の高い問題解決を実現します。上位オントロジーやドメインオントロジーではもの(対象物)的存在を記述するのに対して、タスクオントロジーでは行為やプロセスを記述するという違いがあります。

多次元オントロジー

多次元オントロジーは、一義的な意味や用法だけではなく、そうした意味や用法が文脈や市場、人物などによって変容することを前提とし、変容の要因まで含めて構造化するオントロジーです。

「クリスマス」の意味が家族や恋人のいる人といない人とで大きく異なることを踏まえて、コンピュータはコミュニケーションデータを基に複数の意味を学習していきます。ユーザーの発言に対して個別的な反応を示すことができると考えられます。

オントロジーの主な活用事例

ややオントロジーに関する抽象的な説明が続きましたので、最後にその活用事例をご紹介することで理解を深めていただければと思います。

人工知能(AI)

もともとオントロジー概念が初めてコンピュータ科学に導入されたのも、人工知能の研究の文脈の中でした。特に、文脈依存的な知識を処理できる多次元オントロジーを学ばせるケースが増えています。

一つの名称に対する複数の意味合いと、それぞれの意味になりうる要因を併せて学習できるため、個々のユーザーに対してより個別的な対応を可能にします。たとえば企業やサービスに対するWeb問い合わせをチャットボットで処理させたいときに、多次元オントロジーを適用した人工知能はこれまでのシステムより飛躍的にスムーズな対応ができるようになるかもしれません。

セマンティックWeb

セマンティックWebとは、コンピュータの自立的な処理を促しWebページ内の利便性を向上させる技術(プロジェクト)のことです。Web(World Wide Web)で使用される技術の標準化推進団体であるW3C(World Wide Web Consortium)の設立者であるティム・バーナーズ=リー氏によって提唱されました。

セマンティックWebでは、OWLなどのオントロジー記述言語によって記述を行います。名前の表す概念=メタデータを「クラス」と呼び、いくつかのクラスとその属性を規定するプロパティなどを記述します。これによって文書の意味を構造化し、コンピュータが自動的に情報を収集したり分析したりすることが可能になります。これによって、検索エンジンの利便性が格段に高まるとされます。

仮想通貨オントロジー

仮想通貨の一種にも「オントロジー(Ontology、ONT)」が存在します。ここまでご説明してきた情報科学におけるコンピュータの知識獲得技術とは異なり、仮想通貨におけるオントロジーは特定の仮想通貨およびプロジェクトを指す固有名詞であり、ビットコイン(BTC)やリップル(XRP)と同じようなものです。

仮想通貨のオントロジーは、ブロックチェーンを使って契約や業務の遂行を可能とするためのプロジェクトです。仮想通貨の基盤技術である「分散型台帳」と「スマートコントラクト」を合わせたような仕組みを持ち、専門知識のない人でもブロックチェーン技術によって処理速度の向上と業務コストの削減を実現できるようにすることを目的としています。

次世代技術を支える知識構造化技術オントロジー

人工知能の研究者たちは、いかにしてコンピュータに効率よく知識を身に付けさせるか考え抜いた末に、古代ギリシャ時代から綿々と受け継がれてきた古い哲学用語であるオントロジーにたどり着きました。「知識とは何か」「存在とは何か」を突き詰めて、人工知能研究は2010年代のブレークスルーを迎えるきっかけの一つを手に入れることができたのです。

オントロジーの技術は未だに発展途上であり、今後も新たなタイプのオントロジーが考案されコンピュータや人工知能など各種テクノロジーの発展の契機になる可能性があります。一般消費者には見えにくい技術ではありますが、これからもぜひオントロジーに関するニュースを追いかけていただければと思います。

    関連記事

    1. 日本と各国を繋ぐ世界地図

      IoTプラットフォームの基礎知識|主な種類と利用するメリット

    2. VR体験中の少女

      AR(拡張現実)とは?活用方法やVR・MRとの違いを解説

    3. プログラムコード一部

      アルゴリズムとは?日常生活に浸透する身近なシステムの基礎知識

    4. 手でパズルのピースを持っている

      インダストリー4.0|「第4次産業革命」がもたらす日本への影響とは?

    5. キーボードを操作する少女

      ネットリテラシーとは?インターネット上のリスクから子供を守る方法

    6. 未来の技術

      SQLとは?初心者が押さえておきたい基礎知識と効果的な学習法