IPT3を介したカメラトラップデータの登録開始について

2024年2月に IPT3 がリリースされ、カメラトラップデータの標準形式である Camtrap DPがGBIFに登録できるようになりました。 2011年にIPT2がリリースされて以来のメジャーバージョンアップです。 IPT3では、GBIFの登録様式であるDarwin Core Archiveに加え、新たに Frictionless Data に準拠したデータセットに対応しました。 その第一弾としてCamtrap DPがサポートされました。

Camtrap DPはカメラトラップを用いて観察された野生動物の情報を記載するために、Biodiversity Information Standards(TDWG)のコミュニティによって、新たに提唱されたデータセット形式であり、Frictionless Dataに準拠しています。 Darwin Core Archiveのスタースキーマ構造( )では表現しきれなかった複数のIDによるテーブルの関連付けが可能となっています。

図1. Darwin Core Archive のデータ構造
図1. Darwin Core Archive のデータ構造
(2023年12月開催GBIF technical support hour for Nodes の資料より抜粋; CC BY 4.0)
必須のコアファイル(Core)を中心とし、放射状に任意の拡張ファイル(Ext.)が配置される。各拡張ファイルはコアファイルのIDでコアファイルと関連付けられる。 コアファイルは一つのみ、拡張ファイルはゼロ~複数のファイルを含めることが可能である。

Camtrap DPには delpoyments.csv、media.csv、observations.csv の3つの表形式データが含まれ、各ファイルはIDによって関連付けされます( )。 カメラの位置情報や設置期間などは deployments.csv に、撮影された野生動物の映像・画像・音声(メディア)のリストは media.csv に記載されます。 メディア本体は外部サーバに格納され、メディアへのアクセス用URLが media.csv に含まれます。カメラに映った野生動物の観察記録(種、性別、行動など)は、observations.csv に記載されます。 メタデータ(datapackage.json)はWebと親和性の高いJSON形式で記述され、データ作成者、調査地、調査期間、記載された分類群の範囲、方法、プロジェクト、各ファイルの定義などが含まれます。

図2. Camtrap DP のデータ構造
図2. Camtrap DP のデータ構造
(2023年12月開催 GBIF technical support hour for Nodes の資料より抜粋; CC BY 4.0)
各ファイルの関係性はER(エンティティ・リレーションシップ)図の多重度で表される。 deployments.csv と media.csv の関係性は1対0以上、media.csv と observations.csv の関係性は1対0以上、deployments.csv と observations.csv の関係性は1対1以上である。 media.csv および observations.csv は deploymentID で deployments.csv に関連付けされ、observations.csv は mediaID で media.csv に関連付けされる。

GBIF登録の際はDarwin Core形式データに変換する必要がありますが、ユーザ側でデータ変換する必要はありません。 IPT3からGBIFにデータセットを登録すると、コンバータを用いてCamtrap DPがDarwin Core Archiveに自動変換されます( )。 GBIFのパイプラインでデータが解釈された後、ポータルサイトでDarwin Core形式のデータが公開されます。

日本からカメラトラップデータをGBIFに登録する際には、JBIF構成機関が運用するIPTサーバを利用します。登録を検討されている方は JBIF窓口までご相談ください。

図3. Camtrap DP のデータ出版ワークフロー
図3. Camtrap DP のデータ出版ワークフロー
(2023年12月開催 GBIF technical support hour for Nodes の資料を改変; CC BY 4.0)

IPT3は頻繁に更新されており、2024年12月にはFrictionless Data に準拠したCatalogue of Life Data Package(ColDP)もサポートされました。 最新情報は IPT3のリリースをご参照ください。

※1 IPT:GBIFにデータセットを登録する際に用いるデータ出版ツール。
※2 Frictionless Data:Open Knowledge International により提唱された研究データの標準形式。表形式データ、データ構造、データの説明をパッケージ化することで、機械判読しやすく相互運用性が高い。
参考文献