ArcGIS が地理空間データを FAIR にする

最近、政府の事業などでデータ連携基盤といった用語が多用されています。地理空間データ及び GIS のコミュニティにおいては、地理空間データの利用可能性や相互運用性を向上させる取り組みとして、空間データ基盤 (SDI: Spatial Data Infrastructure) が政府を中心に長年にわたり取り組まれてきました。

こうしたデータ連携という課題において、データを公開或いは提供する際にデータプロバイダー (提供者) が考慮するべき事項をまとめた原則として FAIR データ原則 (以下、FAIR) があります。この記事では、FAIR の概要と ArcGIS との関係に触れます。

※この記事は米国 Esri の ArcGIS Blog に掲載された記事をもとに再構成したものです。詳しく知りたい方は後述するフルバージョンの記事もご参照ください。

原文: Help to Make Your Data FAIR: Part I (esri.com)

FAIR とは?

FAIR とは、Findable (検索可能)、Accessible (アクセス可能)、Interoperable (相互運用可能)、Reusable (再利用可能) の4つの言葉の頭文字をつなげた造語です。FAIR は Nature Scientific Data 誌に発表されたことをきっかけに注目を集めました。この原則には、データの作成者や提供者が、データの作成・管理・提供に亘るワークフローにおいて念頭に置くことが望ましい概念がまとめられています。

FAIR はオープンデータと同義に捉えられがちですが、FAIR においては、データが無償でなければならないとか、ライセンス条件に邪魔されないようにしなければならないとは言及していません。FAIR は、データソースが適切に文書化され、アクセス可能な状態で、データとインフラの相互運用性を向上することにフォーカスしています。オープンデータとは補完的な関係であると言えるでしょう。

さて、GIS コミュニティはどのように FAIR と向き合っているのでしょうか。2021年、標準開発組織である Open Geospatial Consortium (OGC) は、この原則を取り入れたミッションステートメントを更新しました。また、米国政府が運営する地理空間データプラットフォームである GeoPlatform.gov は、Making Federal Geospatial FAIR というメッセージを掲げています。世界の主要なコミュニティが地理空間データマネジメントにおいて FAIR を念頭に置いていることが分かります。

FAIR 4 つの原則

  • Findable (検索可能)
    • 検索可能なデータは、再利用可能なデータへの第一歩です。機械判読可能なデータとメタデータは、SEO と組み合わせることで、Web 検索エンジンがデータを見つけやすくし、機械や人間が探索できるようにします。
  • Accessible (アクセス可能)
    • アクセス可能なデータにより、ユーザーは、認証等の手段を含め、発見したデータにアクセスする方法を知ることができます。アクセス可能なデータは、オープンなパブリックデータ、許可されたユーザーだけが利用できるクローズドデータにも適用できます。
  • Interoperable (相互運用可能)
    • 相互運用可能なデータは、オープン標準やオープン仕様を活用して、他のデータやシステムと統合することができます。
  • Reusable (再利用可能)
    • 再利用可能なデータは、メタデータによって豊富に記述され、透過性のあるデータ使用ライセンスで公開され、ドメインに関連するコミュニティ標準に準拠しています。再利用可能性は、FAIR の主要な目標です。

ArcGIS : FAIR の実装を支援

データは自動的に FAIR になるわけではありません。FAIR は、組織の努力とそれをサポートするツールによって実現されます。例えば、組織はデータをWebサービスとして公開し、コンテンツに適切なメタデータを付与し、適切なライセンスを付与する必要があります。メタデータとライセンスが付与されたデータは、適切なアクセスコントロールのもとで利用者に提供します。データの提供時には、そのデータの利用目的に応じて、プライベートデータ、オープンデータ、特定のグループに絞られたクローズドデータとする等の対応も必要です。

この図は、FAIR なデータを公開するまでのプロセスを ArcGIS がどのようにサポートするのかを表したものです。データの作成、公開、コラボレーション、共有、使用、再利用を行う際には、さまざまなソフトウェアや SaaS を横断して作業する必要があります。ArcGIS は、ワークフロー全体で FAIRを実行できるように支援します。

最終的なデータ公開のフェーズでは、ArcGIS Hub がソリューションになり得ます。データ提供者、ArcGIS Hub を用いて、メタデータ、ライセンス、データのダウンロード及び Web サービスのエンドポイントの提供、そして DCAT によるカタログ連携まで、地理空間データカタログに求められる要件を備えたサイトを速やかに立ち上げられます。

FAIR の実践例(各国の地理空間データ基盤)

さいごに、FAIR の実践例を含む海外事例をご紹介します。

地理空間データ基盤を表す用語として、空間データ基盤 (SDI) が古くから使用されてきました。Esri は最近その概念をアップデートする用語として統合地理空間インフラストラクチャ (Integrated Geospatial Infrastructure) を多用しており、その構成要素に FAIR が含まれます。海外諸国では、FAIR を念頭に置いて開発された SDI が散見されます。以下はその一例です。

ArcGIS と FAIR について詳しく知りたい方は、下記の和訳記事をご覧ください。
ArcGIS が地理空間データを FAIR にする

フォローする