テクノロジー・データ科学

データ利用の植民地主義を脱却せよ

データ・コロニアリズム(データの植民地主義)が根強く残っているがそれを変えなければ真のエンパワーメントは実現できない。

※本稿は、SSIR Japan 編『スタンフォード・ソーシャルイノベーション・レビュー 日本版 03 科学技術とインクルージョン』より転載したものです。

ニティヤ・ラマナサン|ジム・フルヒターマン|エイミー・ファウラー|ガブリエル・カロッティーシャ

ソーシャルセクターでは、自力で変化を起こせるようなツールや知識を提供することで、コミュニティの人たちのエンパワーメントを実現しようとしている。それは、外部から強制的に変化を起こそうとするよりも、コミュニティ主導で生まれる変化のほうが持続的なインパクトをもたらす可能性が高いからだ。社会的インパクトの創出にますます不可欠になりつつある「データ」に対しても、この考え方を当てはめるべきだ。今日では、社会課題の解決を目指す活動をより効果的に実践し、継続的に改善していくうえで、データの収集および分析が欠かせなくなっている。

しかし、研究者を含むソーシャルセクターの実務者が、自身の目的のために個人やコミュニティや国家からデータを集めておきながら、提供者に対してデータへのアクセスはおろか、提供者の目的のために利用することすら制限しているケースがあまりにも多い。充分な情報に基づいた意思決定を行うためにはデータへのアクセスは必須である。

ことデータに関しては、「コミュニティのエンパワーメント」という基本原則をソーシャルセクター自体が無視しているという不都合な真実がある。ソーシャルセクターの資金提供者や名だたる実践者たちは、一方が他方を支配したり搾取したりするような支援活動における「植民地」的文化からの脱却を目指して懸命に取り組んでいる。しかし、その「脱植民地化」を本当の意味で実現しようとするなら、データの所有権と扱い方についても問い直すべきだろう。

データの脱植民地化が実現すれば、正当な所有者にデータの便益が直接もたらされるようになるだけでなく、彼らの意図に沿った情報共有が可能になる。そしてここでの正当なデータ所有者とは、私たちがエンパワーメントしようとしているコミュニティの人たちだ。

データ・コロニアリズムの問題

2019年に刊行された書籍『ザ・コスト・オブ・コネクション』(The Costs of Connection)において、著者のニック・クドリーとウリセス・メヒアスは「データ・コロニアリズム」という考え方を発表した。これは、植民地主義の時代に行われた天然資源の搾取や、先住民に対する上からの権力行使によって、地元の人たちに植民地としてのパラダイムを植え付けていった慣行にきわめて似た方法でデータが収集されている状況を指すものだ。

私たちが調査したデータ・コロニアリズムに関する記述で最も古い資料は、アメリカの先住民コミュニティのものだ。彼らは長年にわたって、地元の情報が第三者から利益目的で収集、搾取される状況に対抗してきた。現在「先住民のための、先住民によるデータの脱植民地化」に取り組む組織の1つがアメリカのシアトルにあるアーバン・インディアン・ヘルス・インスティテュート(Urban Indian Health Institute)だ。ここはアメリカ先住民とアラスカ先住民コミュニティの公衆衛生に関する研究センターである。

データ・コロニアリズムは、営利セクターだけでなく開発援助団体においてもみられる。私たちは、「データ・コロニアリズム」を現時点でこのように定義している。

「自分以外の誰かが作成者である、あるいはその人たちの利益のために作成されたデータについて、所有権を要求し、そのデータから生まれる価値の大半を占有する行為」

本稿の共著者であるフルヒターマンは、テクノロジーを活用した社会的事業を立ち上げるべくアフリカで予備調査を行った際、ケニアのナイバシャ湖地域のリーダーの1人にインタビューした。彼の話によると、地元はアフリカのグレートリフトバレー(大地溝帯)のエコシステム研究でも最も盛んな地域の1 つであるという。しかし現地の人々は、気象や水利用、生産性などに関するデータやその分析結果にほとんどアクセスできない。それどころか、こうした情報は大学や国際NGO、企業、公的機関のデータベースに囲い込まれており、使える場合でも高い利用料を請求される。

データ・コロニアリズムは、以下のような重大な問題をはらんでいる。

  • データとそこから得られる知見が、正当なデータ所有者(そのデータが収集された国、コミュニティ、または個人)の同意や彼らへの通達もないままに、その国やコミュニティから持ち出されている。
  • データが収集された国やコミュニティの外部で、正当な所有者が関与することなく、データが分析され知見が抽出されている。
  • データの収集によって、収集者と正当な所有者の間に存在するアンバランスな力関係が表面化する。その力関係は、データ収集以前から存在している場合もあるし、データ収集の結果として生じる場合もある。
  • データ収集者が、データの占有状態を強化して正当化するシステムやイデオロギーをつくり出す。その際、研究の厳密さのためだとか、モニタリングや評価が必要だからとか、営利目的のビジネスのやり方で管理しているといったことを理由に挙げる。いずれにしても、往々にしてそのシステムがリソースの配分先や配分方法を決めている。

私たちの経験上、データ・コロニアリズムは少なくとも3つの点で悪影響がある。

まず、「意思決定の質の劣化」をもたらす。当該コミュニティの関与なしに分析が行われるため、導き出された結果が現場の実状や正当なデータ所有者の考え方や関心からかけ離れてしまうことが少なくない。

2つ目は、「ディスエンパワーメント(力を削ぐこと)」だ。データ・コロニアリズムは、直接影響を受ける国やコミュニティから意思決定権を奪ってしまう。一例を挙げると、東アフリカの国の保健省高官は、とある会議で自国に関するデータが、現地で調査した他国の研究者によって発表されているのを初めて目にしたときの不満と屈辱を語った。研究成果がすべてその研究者の功績にされてしまっただけでなく、その国の意思決定者がデータを利用して自分たちが進むべき方向性を模索したり提示したりする機会も奪われたのだ。

3つ目は、リソースの不適切な使用である。データ分析は、予算配分の際に使われることが多い。データ・コロニアリズムはそのプロセスから、データの正当な所有者を排除する。たとえば、これまでの大規模な保健プログラムでは、病気の発生率や有病率などのデータに基づいて多額の資金の出入りが対象コミュニティに発生するが、そのデータの収集にも分析にも当事者となるコミュニティは関わっていない。開発分野では成果連動型の資金提供(resultsbased financing)の仕組みがあるが、対象地域やプログラムへの資金の抑制を正当化するためにデータを利用することが可能なため、その分析にコミュニティが関与していないと、事実上コミュニティに不利益をもたらす意思決定が行われてしまうのだ。

社会変化にはデータの共有が不可欠だ

歴史的に植民地では、主に原油やダイヤモンドといった有限の天然資源が収集されてきた。こうした資源の希少性と需要が、その価値を高めたのである。しかし、データは原油とは性質が異なる。データはコストをかけずに複製、共有することができるにもかかわらず、なぜ私たちは、まるでデータが希少なものであるかのように扱うのだろうか?

民間セクターでは、企業が所有データの大部分を社外秘として管理しているが、それは情報を独占することが企業の競争優位性の基盤となりつつあるからだ。大手のテック企業では、データの所有と収集にますます力を入れ、膨大な占有データベースは巨大な富の源泉となって企業に利益をもたらしている。

ソーシャルセクターにおいても、データは有限の資源であるかのように扱われている。今日のデータ・コロニアリズムは、民間セクターにおけるデータの扱い方を踏襲する慣習が背景にあり、コミュニティを抑圧しようとする悪意から生まれたわけではないと私たちは考えている。

データの共有は、それぞれの利害関係者が目指す方向性をそろえ、実効性のある解決策が採用されれば、共通のインパクトを加速させるだろう。

統合され匿名化されたデータセットが共有されれば、既存システムを長期的に改善するための知見が共有され、複雑な環境でも明確な見通しを立てられるようになるだろう。

このような実例もある。2017年にモザンビークで政府の公衆衛生担当の高官が集まり、同国の保健省がリアルタイムセンサーを用いて収集していたワクチン保冷庫の性能データに関する議論を行った。タンザニア保健省が、これと同じ保冷庫を複数購入することを検討していたため、モザンビークは保冷庫の性能データをタンザニアと共有することを決定した。これはシンプルな行為だが、他の多くの国では、データが第三者(多くの場合企業)に保有されているため、このように自国や隣国のために活用できない。

もちろん、すべてのデータを拡散し、オープンにして共有すべきだと言っているわけではない。人権問題に関する証言データ、児童虐待の通報、個人の健康記録、HIVの検査結果などはすべて、共有すべきではない個人情報である。私たちが共有すべきと考えるデータは、設備やインフラに関するもの、プログラムや薬剤の効果、土地利用など、個々の責任範囲のなかでより広く利用可能なものだ。

データ・コロニアリズムを脱却する4つの原則

データは国家やコミュニティの外に持ち出されたり第三者に独占されたりするものであってはならない。もし、ソーシャルセクターに携わる人間が、世界中のコミュニティと連携して本質的なシステム変化を起こしたいのであれば、その連携する範囲を、現時点で最も耐久性のある資源である「データ」まで拡大する必要がある。データを脱植民地化し、データ収集元のコミュニティが力を取り戻すための指針として、私たちはデータの「所有権」「プライバシー」「共有と同意」「適切な使用」に関する4つの原則を提示する。

❶データは収集元のコミュニティや国によって所有されるべきである

データの使用、分析、アクセス、解釈がどうなされるべきかは、データの正当な所有者が主導して決定すべきであり、また正当な所有者はデータを解釈し行動するためのツールやリソースも持つ必要がある。

GAVIアライアンス(ワクチンと予防接種のための世界同盟)は、それを実践してきた先駆者だ。それぞれの国家が自国のデータを所有すべきだと主張し、たとえばワクチン保冷庫から得られるデータは現地国所有の原則があることを繰り返し訴えている。

❷どのデータを非開示にするかは、正当な所有者が決定すべきである

この原則は、国際的に規制が強化されつつある「個人を特定可能な情報」の保護にとどまらない。天然資源の鉱床や遺跡の位置情報など、地元コミュニティが保護を希望する機密情報も含まれるだろう。

❸データは意味のある同意に基づき、意味のある価値に対してのみ共有されるべきである

データが貴重なものとして扱われるのは、迅速な学習に活用できるという性質があるからだ。データは、個人やコミュニティのリスクを高めることのない方法で共有されれば、正当な所有者とソーシャルセクターの利益になるかたちで、その価値を最大化させられるようになるだろう。意味のある同意や価値というのは、正当な所有者への敬意(彼らの文化的規範を尊重し、彼らの学習と利用を優先させ、あくまでも彼らに管理権限を渡すこと)を通じて得られるものだ。こうした考え方でこの原則を実践すれば、データによる搾取ではなく、データ共有における真の価値交換が促進されていくだろう。

❹データを懲罰的な用途に使わない

現代社会ではデータの一般的な用途は学習や改善だが、そのためには質の高いデータが必要になる。ただし、懲罰を目的とすると、それを回避するために不正確なデータをつくろうという逆のインセンティブを生んで、学習とインパクトをもたらすデータの価値を無効化してしまう。

データ・コロニアリズムからの脱却は、簡単には進まないだろう。あらゆる取り組みにおいてデータ・コロニアリズムを明らかにして根絶するために必要なのは、謙虚さと内省、そしてやり抜く覚悟だ。もしこの変化を実現できれば、私たちは集合的(コレクティブ)なアクションを強化して、データによって得られる利益をすばやく直接的に、データの収集元である人々や地域に還元できるようになるだろう。

これこそがデータの脱植民地化が目指している世界であり、ソーシャルセクターの中心に据えられるべき価値観なのだ。

【原題】Decolonize Data (Stanford Social Innovation Review Spring 2022)

Copyright©2021 by Leland Stanford Jr. University All Rights Reserved.

Leave a Comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

*

CAPTCHA