私たちは2つのデータ寄付モデルの間で選択を迫られている。一方は企業が決定権を支配するモデルでありもう一方は草の根の市民行動によってコントロールされるモデルである。どちらが勝つかによって人々が自らのデジタル情報に対してどれほどの決定権を持つかが決まる。
※本稿は、SSIR Japan 編『スタンフォード・ソーシャルイノベーション・レビュー 日本版 03 科学技術とインクルージョン』より転載したものです。
ルーシー・バーンホルツ|ブリジット・ポーリウ・フライ

新型コロナウイルス感染症(COVID-19)のワクチンがアメリカで初めて入手可能になったとき、需要は供給を大きく上回った。公衆衛生関連のウェブサイトは使いづらく、郡(カウンティ)ごとに異なり、EC(オンライン販売)業界が培ってきた使いやすいデザインからは程遠かった。するとアメリカ各地で、ウェブサイトから特定のデータを抽出するウェブスクレイピングのスキルを持った人たちが、ワクチン接種会場の検索と予約をやりやすくする仕組みをデザインし始めた。彼らは自分たちのことを、ワクチンハンターと呼んだ。
2021年3月には、同様の動きがカナダなど他の地域にも広がった。ウェブデベロッパーのアンドリュー・ヤングは、父親のワクチン接種の予約に苦労したことをきっかけに、トロントでワクチンハンターの取り組みを開始した。彼は数名の仲間とともに、たった1つのツイッターアカウントと、その時々のワクチン在庫状況を報告するディスコード(discord)のサーバーを使い、ワクチンハンターズ・カナダ(VHC)を立ち上げた1。この2 つのツールと熱心なボランティアチームの協力のもと、VHCは接種会場に関する最新情報を収集して整理する仕組みを迅速に築いた。
ボランティアたちが活用したのは、薬局や公衆衛生関連のウェブサイトに掲載されているデータと、接種会場にいる人々がダイレクトメッセージやタグ付きツイートでVHCのツイッターアカウントに送ってきた情報である。こうした集コレクティブ合的な取り組みによって、VHCは接種会場がワクチンを切らした際にそれを速やかに情報発信できた。また、どの会場でどのワクチンが接種できるか、どの言語に対応しているか、誰に接種する権利があるのかについて最新の情報を提供することができた。ワクチン接種に行ったトロント市民が報告した、各会場の新しいルールには、市や国の議員でさえ把握していないものも含まれていた2。
VHCは、人々がデータを通じて集合的アクションを推進した事例の1つである。接種会場の運営者、公衆衛生機関、さらには自分の体験を報告してくれる個人など、さまざまな人々が情報提供者となってこの取り組みに加わった。ウォールマートや小売チェーンのソビーズといった企業も情報を提供した。こうした雑多な情報源を統括し、利用しやすいようにまとめ、各会場のリアルタイムな報告をもとに情報の新しさを担保する。VHCチームは、極めて慎重に情報を収集・活用し、特定の個人の行動だけを取り上げるのではなく、あくまでも集合的なワクチン確保とアクセスに重点を置いた。
データ活用による集合的アクションは、シビックサイエンス、医療研究、芸術と文化、消費者保護などの分野に広がっている。こうした多種多様な取り組みに共通しているのは、これまで人々が社会正義のために金銭や時間を提供してきたように、デジタルデータを提供することで貢献しようという発想である。金銭や時間の提供に関しては、法律や慣例によって一定のルールが定められており、非営利団体の運営、慈善事業への寄付、ボランティア活動などもその対象である。これらの法律は、個人による時間の提供を搾取的な労働行為と区別すること、そして金銭の提供を恐喝や詐欺と区別することを義務づけている。いずれの場合もリソースを提供する側に選択権があることが重要だ。個人には特定の活動にお金や時間を捧げるかどうかを自由に決める権利があり、リソースの提供者と受領者の双方に一定の法的保護が与えられている。時間や金銭の提供をめぐるルールはかなり前から存在するため、政策提言者や研究者、あるいは改革推進者でもない限り、それについて意識している人はあまりいないだろう。だがデータの提供に関しては一からの整備が必要であり、その決定はあらゆる人にとって重要な意味を持つ。データの提供の有無、提供の手段、誰が提供するべきかをめぐる議論は、まだ始まったばかりだ。
私たちには2つの大きく異なる未来が待ち受けている。一方の未来はVHCの事例が示すような世界だ。人々は、収集が困難な情報や、知的財産権の壁に阻まれていた情報を、VHCのような取り組みを通して共有するようになる。本稿では、鳥やキノコの写真から、ケーブルテレビの料金、健康データまで、さまざまなものが共有される事例を取り上げる。どの事例においても、データの利用に関するルールを設定したり、技術を管理したり、新たなサービスや分析を提供したりする役目はコミュニティが担う。これは市民主導型のアプローチである。つまり、どのデータを集めるべきか、どのような条件の下で集めるか、どのような保護を提供するかの判断は、多くの場合、データを提供する当事者によって行われる。また、取り組みの基盤となるソフトウェアのコードはオープンソースであることが多く、管理者はどんな目的であればデータの利用を許可するのかを慎重に判断する必要がある。
もう一方の未来は、10年以上前から目の当たりにしてきた世界である。つまり、トップダウン式で企業主導型のデータ・フィランソロピー・モデルである。この概念の提唱者である国連の言葉を借りると、データ・フィランソロピーとは「民間セクターがデータを共有することによって、より適時的かつ焦点の絞られた政策決定を後押しする」ことである3。このアプローチでは、大規模なデータセットを有する企業(近年においてはほぼすべての企業が該当する)が、研究者にデータへのアクセスを許可することで、特定の課題解決に貢献する。例としては、通信事業者が携帯電話の位置情報データを集積・分析してパンデミック時の人々の動きを把握する取り組みや、ソーシャルメディアの投稿を分析して災害救助に役立てる取り組みが挙げられる。このアプローチでは、企業は自社のデータに対して絶対的な権限を持つことができ、さらに社会課題の解決に貢献することで社会的信用が得られる。
一方で、自分のデータが企業に所有されている人たちは、その使い道について何ら口出しする権利はない。また、分析結果やその基となったデータセットを第三者が検証することもほとんどない。さらに、意思決定プロセスはそれぞれの企業が独自に設定した利用規約に拘束される。
企業がデータ提供の指針を決定することを許してしまえば、寄付の自由意思的側面は損なわれる。また、企業が説明責任を回避し、市民社会を抑圧するための抜け道ができてしまうと、民主的な利益も損なわれる。2021年だけ見ても、フェイスブック(現メタ)が、ニューヨーク大学の研究者や市民社会団体アルゴリズムウォッチが調査に使っていたデータへのアクセスを遮断することによって、いとも簡単にそれらのプロジェクトを妨げた。また同社は、自社が所有するツールで、研究者がソーシャルメディアを調査するために広く使っているクラウドタングル(CrowdTangle)へのアクセスを制限し始めている。さらに懸念すべきことに、フェイスブックは2021年9月に、選挙に関する調査に対して共有したデータセットに欠陥があったことを研究者らに向けて発表した。これにより研究結果に疑義が生じ、同社がいかにさまざまな方法で監査機能を自社に有利な方向に歪めているかが明らかとなった4。
フェイスブックは自社のデータをコントロールしているため、調査や監査において不当に大きな発言権を有しているのである(グーグル、アマゾン、アップル、ツイッターなども同様だ)。実施してほしくない調査があれば、それを中止に追い込むことができる。調査にどのデータを提供するかをコントロールする(あるいは、まったく提供しない)ことによって、企業は外部機関による調査でどのようなことを質問され、検証されるかを左右することができる。こうした制約を取り払うためには、フィランソロピーを口実に、誠実な説明責任や調査を回避することができないようにしなければならない。
この2つの未来の間で対立しているのは、公共の利益のために自分のデータを使用されることに関して私たちが選択権を持つことができるかどうかである。第一の道、すなわちコミュニティ主導型のデータ提供モデルにおいては今のところ、方法が確立しておらず、誤用や詐欺に対する防護策も足りていない。断片的な市場しかなく、成功に至るのは容易ではない。
だが、その動向は目を見張るような創造的なエネルギーにあふれており、誰にとっても使いやすく、信頼のできるモデルとなる可能性を秘めている。個人がデータを提供する「手段」はまだ発展途上だが、共通しているのは自由意思の尊重である。手段やルールの開発者たちは、取り組みへの参加はあくまでも任意かつ自発的なものであり、当事者のみがデータを提供するかどうかの決定権を持つことを可能な限り明確にしたいと考えている。ボランティア活動における労働搾取を防ぐためのルールがあるのと同様に、データ提供に関しても企業による搾取を防ぐルールが必要だ。
公共の利益のためのデータ活用や、データ収集の取り組みには、さまざまな可能性がある。たとえば、ワクチンハンターの事例では、企業のデータベースや個人提供の情報を集めることで実用性の高いデータセットが得られることがわかった。こうして得た多様なデータは、人々の行動につながるようにキュレートされ、管理される。本稿では、いくつかの事例を取り上げるが、いずれも異なる種類のデータを扱い、異なるコミュニティを対象とし、まったく異なる課題に取り組んでいる。これらの事例は、さらに検証すべき課題や解決策を示してくれると同時に、共通した課題を浮き彫りにする。
第一に、いかにして参加を促すか。次に、プライバシーについて人々が抱くさまざまな懸念や、コントロールに関する数多くの疑問など、情報をめぐる課題についても熟考する必要があること。デジタルデータは多くの場合、個人の行動と同じぐらい、人と人の関係を映すものである。メールには送り手と受け手の情報が含まれ、DNAは複数の世代にまたがる情報である。
そうした関係性を含む情報はいかに保護されるべきか。どのような同意やオプトイン(宣伝広告を配信する際、事前に許可を求めること)の仕組みなら、人々に理解され、信用されるか。データのセキュリティ、二次使用、削除に関してはどのような保護や約束をすることができるか。個人の利害や集合的なプライバシーを尊重するようなデータ提供プロセスは、どうすれば構築できるか。本稿では以下に、iNaturalist、コンシューマー・レポート、医療研究の事例を取り上げる。彼らが開発しているプロセスは、安全で公正なデータ提供方法を構築する際に私たちが何を決めなければならないかについてヒントを与えてくれるだろう。
地球を救うために写真を寄付する
キャット・チャンがスマホアプリiNaturalistを使い始めたのは、キノコの図鑑が重たかったからだ。ハワイ先住民であるキャットには、2つの明確に異なる知識世界があった。彼女は小さい頃、祖母と一緒に、彼女の一族が長年住んできた地域を歩き回り、一つひとつの植物に話しかけ、やさしくなでて、弱ったり傷ついたりしていないかを確認していた。キャットが高校生のとき、家族は北カリフォルニアへと移り住んだ。大学では植物学と園芸学を専攻し、今度は西洋科学やラテン語の分類法というレンズを通して植物を学んだ5。ランドスケープアーキテクトになってからは、土壌の健康やキノコに関心を持つようになり、観察するために長時間のハイキングに出かけている。森の中を歩き回るとき、図鑑で一杯のリュックを持ち運ぶことは困難だ。「友人にiNaturalistという、図鑑がわりになるスマホアプリがあると教えてもらったとき、すぐに興味が湧きました」と彼女は言う。「私は普段、あまりアプリは使わず、IT系にはあまり強くありませんが、このアプリは自分にピッタリでした」。
キャットはほぼ毎日iNaturalistを使っている。高画質の写真もぼけた写真もアップロードする。目の前の植物種が何であるか、推測も含めてできるだけ多くの情報を載せるようにしている。「ですが、それはほんの出発点に過ぎません」と彼女は言う。「写真がアップロードされると、オンラインのユーザーコミュニティがそれをチェックし、植物種の目星をつけます。十分な人数が同意すれば、写真は同定済みのタグ付けがされます。さらに、高画質の写真で、正確に同定されていれば、『研究ランク』のマークが付きます」。これらの写真はiNaturalistのデータベースに登録され、科学者らが利用できる。しかし研究ランクの品質に満たない写真であっても、キャットは多くの場合、写真を共有することで何かしらの学びを得ることができるのだ。
どの写真も、寄付されたデジタルデータである。2021年7月時点で、iNaturalistのデータセットには7800万を超える写真、動画、録音が含まれている。アプリとそれを支えるデータベース、400万人のユーザーコミュニティには、あらゆる自然科学分野の専門家や愛好家が関わっている。アップロードされた画像は、スマートフォンのカメラが自動的に写真に埋め込むメタデータ(位置や日時に関する情報)によって整理されている。
科学者は、iNaturalistのデータを利用して、世界中の生態系における経時的な変化を追跡している。愛好家は、目にしたものの名称を迅速に調べ、学んだことを共有し、他のユーザーの疑問に答えるためにiNaturalistを使用する。写真はすべて寄付されたもので、質問に答える行為もボランティアだ。このアプリを通じた協働の結果は目覚ましい。何百万もの人々の好奇心が満たされ、寄付された写真から他に類を見ない生物多様性のデータベースが構築され、関心を同じくする人々のコミュニティがオンラインでもオフラインでも生まれている。iNaturalistのデータは、画期的な科学的発見にもつながっている。
iNaturalistによく似たeBirdというアプリのコミュニティも、何百もの査読付き科学論文に貢献したデータベースを構築している。データの寄付においては、小さな貢献が大きなインパクトをもたらすのである。
iNaturalistのユーザーは、好きだからという理由で利用している。参加するためにはアプリをダウンロードするか、ウェブサイトを検索しなければならない。iNaturalistの運営者は、アップロードされた写真がどのように使われるかを可能な限り明瞭に説明する必要がある。また、 あらゆる段階でオプトインできるようにし、ユーザーが写真から情報を取り除いたり、アカウント設定を変更できたりする選択権を与えるべきだ。運営者は、科学研究のためには何がより望ましく、コミュニティの人々にとっては何がより望ましいかを考慮しなければならない。たとえば、植物種を確認するために写真をアップロードしたいが、ウェブサイトに位置情報を共有したくないというユーザーには、そのような選択肢を用意する。研究のために使うデータとしては品質が下がるとしても、撮影者のデータのコントロール権を保証するのだ。
iNaturalistのユーザーは互恵的な関係にある。ユーザーたちは自分が知りたい情報を得るために写真をアップロードし、そうして提供されたデータが科学者たちの研究を後押しするのだ。
コンシューマー・レポートとケーブルテレビ料金
市民主導型のデータ提供のもう1つの事例が、家電や自動車の厳格な審査を行うことで知られている、アメリカの消費者保護団体が母体であるコンシューマー・レポート(CR)だ。2021年7月、CRは「ファイト・フォー・フェア・インターネット」という取り組みを始動した。その目標は、アメリカ各地におけるケーブルテレビのサービスについて、テレビ会社がどのように宣伝しているかではなく、消費者の体験をもとに調べることである。この目標を達成するべく、CRは人々にテレビの請求書の内容を提供するよう呼びかけた。
そして、それらのデータをもとに、実際の請求額や地域別の価格設定における違いについて分析した。またCR は、12のパートナー組織と協働して、情報提供者のプライバシーが保護できるようなデータ登録の仕組みを構築した。さらに任意のアンケートでは、情報提供者の収入、人口統計学的属性、(ブロードバンドへのアクセスは党派横断的な問題であるという仮説のもと)政治的アイデンティティに関する調査を行った。
この取り組みには、これまでに3万6000人もの人々が参加している。CRは、協力への謝礼として無料のCRメンバーシップを提供した。この取り組みを立ち上げるうえで、CRはシビックサイエンスや医療研究の実例をいくつか参考にした。参加は、完全に任意である。どのようなデータが収集されるか、それがどのように使用されるか、そしてこの取り組みが何を目的としているかを明確に説明する。
データ提供者を尊重し、謝礼を贈る。提供者のデータは、他の用途にも活用できるものだが、この取り組みのためだけに使用されることを保証する。取り組みを主導するCRデジタルラボのスタッフは、マーケティングやメンバーシップ管理や研究部門など、組織全体のスタッフたちと連携し、データ提供者との関係性を健全に維持している。
CRは、調査の参加者にメンバーシップを無料で提供するだけでなく、参加者が興味を持つ社会課題に関する情報を提供することにより、互恵的な関係を築いた。ケーブルテレビの差別的な価格設定に関するCRの調査は、iNaturalistと同様、社会に貢献することを目的としている。ロンドンを拠点とするワーカー・インフォ・エクスチェンジも、互恵的な関係を築く取り組みをしている。この団体は、ライドシェア(相乗り)サービスの運転手のデータを提供してもらい、ライドシェア用プラットフォームとそのサービスを使う運転手たちとの力関係を明らかにしようとしている。これらの取り組みは、データを用いて企業と消費者、企業と労働者の間の公平性を保つことを目指すものである。
新たな規制は、往々にしてこうしたアクティビズムによってもたらされるが、新たなアクティビズムの起点ともなる。EUの個人データ保護を規定する「一般データ保護規則(GDPR)」は、事業が収集した個人データを開示するよう請求できる権利を人々に与えている。「カリフォルニア州消費者プライバシー法(CCPA)」も同様である。いずれの法律も、企業に個人データの開示を請求する、あるいはプロキシ(代理)として他人にそれをしてもらうという新たな慣行を生み出したのだ。EUの研究者2名による2020年の報告書では、保有個人データ開示等請求書(委任状)を集めることによりコミュニティが醸成されて新たなデータセットを生み出した事例が何十件も報告されている6。CRやワーカー・インフォ・エクスチェンジのような研究活動やアドボカシー活動が発展するにつれて、このようなデータ収集法は重要性を増していくだろう。研究者やジャーナリストにとって連邦情報公開法に基づく請求権が重要であるように、こうした研究において保有個人データ開示等請求書は重要な役割を果たすようになる。
データ収集のツールとして登場したこれらの手段は、非営利団体などがデータに関する新たなルールに対処するときの1つの方向性を示している。コミュニティ支援団体や非営利団体や慈善団体は、信頼関係を重視して自発的な参加が前提となる慣習や規制の下で活動しているため、こうした手段を取り入れていくのに適している。皮肉めいた言い方かもしれないが、資金提供者のプライバシーや選択権、影響力を保証するための現行のルールは、非営利団体がデータ提供者の扱い方について考えるための見本となりうる。とはいえ、デジタルデータはお金と同じではない。悪用された場合の被害は単なる詐欺よりもはるかに広範に及びうるため、既存のルールをそのまま翻訳すればいいわけではない。データ提供に係る規範や仕組みの設計において最も重要な原則の1つは、悪影響をどのように軽減するかという点になるだろう。
移動データと医療研究
デジタルデータがここまで普及したのは最近のことだが、これまでも医療研究の分野では長年にわたって寄付される情報に依存してきた。医学におけるデータ収集の歴史は、特に人種的マイノリティや女性たちにとって恐怖に満ちたものである。『不死細胞ヒーラ』(レベッカ・スクルート著、中里京子訳、講談社)などで描写されているものは、ほんの序の口だ。一般的な医療制度を利用する人々、とりわけ臨床研究の被験者の最も基本的な権利を保護するための仕組みづくりが意識的に取り組まれるようになったのは、ついこの半世紀のことである。こうした仕組みには、専門家としての誓約書、倫理審査委員会、免許制度、実施の基準、法執行などが含まれる。絶対的なものではないが、そうした仕組みがあるだけでも、他のほとんどの分野よりも進んでいる。医療研究の領域では、自動計測のデジタルデータの普及が、革新をもたらすものとして広く歓迎されてきた。ただし、これは個人を保護しつつ社会全体に貢献するようなかたちでデータを収集、使用、保護、および保管できた場合に限られるだろう。
いま、データ保管先としての信頼性が高く、データの使用法に関する選択権を提供者が持つような、新しい組織を生み出そうとする動きがあちこちで現れている。たとえば、提供されたデータを活用する協同組合、シビックトラスト、オープンコレクティブといった新形態の組織だ。こうした組織の数はまだ少ないが、そのうちのいくつかはきっと成功し、今日の非営利団体のように一般的な存在になるはずだ。こう考えればわかりやすいだろう。非営利団体は、寄付された時間や資金を活用して変化を生み出す組織として信頼されており、どんどん増えている。現在私たちが目にしているのは、安全安心なデータ提供を可能にする新しい組織を生み出そうという大きな動きなのだ。
2015年にアップルは、任意でスマートフォンのデータを医療研究者に共有することを可能にするソフトウェアフレームワーク「ResearchKit」を発表した。これを利用したパーキンソン病の研究プロジェクトmPowerには、シアトルを拠点とする非営利団体セージ・バイオネットワークスの研究チームが参加した。
彼らは、1日にどれだけ動き回るかという移動データを収集することによって、パーキンソン病の最大の特徴である震えが1日のなかでどのように変化するのか、震えと運動量に相関関係があるかどうかを検証しようとした。
セージ・バイオネットワークスは現在、信頼と尊重と保護に基づいた研究方法を模索している。これは、研究者と被験者が直接顔を合わせることができる場合であっても困難な試みだが、アプリを通して何万人もの人々に向けて実行するのはさらに難しい。このタスクを任せられたのは、セージ・バイオネットワークスでアウトリーチおよびエンゲージメントを担当するリサーチサイエンティストのバネッサ・バローンである。
公衆衛生学の修士号を持つバローンは、臨床研究に長く携わってきた。セージで働き始める前は臨床試験の現場で経験を積み、「被験者と人間らしい関係」を築くことに努めた。バローンの仕事は、対面またはメールや電話で人々に働きかけて、研究への参加を促すことだった。彼女は時間をかけて相手の懸念に耳を傾け、実施手順を説明し、質問に答えた。セージで働くことに魅力を感じたのは、移動データを健康改善に活かすモバイルヘルスが「これまでと異なるレベルで人々とやりとりするための興味深い方法だ」と考えたからである。また、彼女は研究者の採用をめぐる問題にも感心があった。
「誰も完全には解決することはできない、魔物のような難問ですが、倫理の問題や、組織全体における人材確保と離職防止といった課題に取り組みたいのです」。黒人女性であるバローンは、人種に基づく迫害の歴史を認識しており、信頼を損なわないかたちで多様な参加者を集める方法を見出すことにキャリアを捧げてきた。モバイルヘルスそれ自体は、信頼と多様性のいずれの問題も解決するものではない。
むしろ、こうした問題は根強く残り、新たなかたちとなって現れるだろう。オンラインで、かつ全国規模で募集するとなると、バローンは以前のように対面で人々に働きかけることができない。セージは、やろうと思えば広告会社と同じデジタルマーケティングツールを活用し、ターゲットを細分化して被験者の募集をすることもできた。しかし、セージはプライバシー保護や個人の同意に重点を置いているため、それらのツールは適切でないと判断している。
デジタル技術やデジタルデータは、モバイルヘルスの可能性そのものであると同時に、それを複雑化する要因でもあり、新たな問題を生み出している。すべての人がスマートフォンを持っているわけではないため、アプリを介して募集を行えば、新たなかたちで差別を生み出してしまうのだ。現代における広範なデータや人工知能の使用方法は、白人至上主義と深く絡み合っており、この点に関しては医療研究にも清算し切れていない過去がある。白人至上主義と人工知能の関連性については、サフィア・ノーブル、ルハ・ベンジャミン、およびティムニット・ゲブルをはじめとする研究者らが指摘している。医療倫理の歴史には、今日もなお人種やジェンダーに基づく暴力という恐怖の体験が綴られているのだ7。これらのシステムを現状のままモバイルヘルスに適用することは、進歩ではなくさらなる迫害をもたらしかねない。
医療研究の分野から学べることはたくさんあるが、参考にすべきでない部分もある。モバイルヘルスの研究で有色人種の被験者を募集したバローンの経験談やワクチンハンターの活動はいずれも、人と人の関係が依然として非常に重要であることを思い出させてくれる。デジタルデータは、こうした関係づくりに役立つかもしれない。たとえば、孫が祖父母のためにインターネットを使ってワクチン接種先を探したり、調査研究に懐疑的なデータ提供候補者がオンラインで情報を得たりすることを容易にしてくれる。しかし、バローンの成功を最終的に支えたのは、人間関係のネットワークや、研究活動に特定のデータは使わないという判断だった。
人の保護を第一に
本稿で取り上げているさまざまな分野のデータ活用の事例においては、データの種類も組織の形態も大きく異なる。だが、どれも人を中心に据えている。どのデータを使用するか、データをどのように取り扱うか、どうやって人々にデータについて理解してもらうか、どうやって人々に考えを変えてもらうか。こうしたデータのガバナンス面における問いは、管理者にとって重要な意思決定要素だが、あくまでも究極の目的は、人々が使いたいと思えるものをつくり出すことである。データを奪い取られたり、自動的に参加させられたりする人がいてはならないし、出口を明確に示して、いつでも退出できるように設計しなくてはならない。
これらは些細な工夫のように思えるかもしれないが、「任意の提供」と「搾取」の分かれ道になる。企業や政府のウェブサイト上でのデータのやりとりにおいて、こうした工夫は現状ほとんど見られない。インフォームドコンセントの概念はもともと複雑だが、デジタルの世界では輪をかけて複雑になる。しかし、VHCからセージ・バイオネットワークスまで、本稿で取り上げたすべての事例は、「参加してもらえるだけの信頼を得るにはどうすればよいか」という問いに対する答えが、データガバナンスの問題に対する答えのヒントになることを示している。
ネットワーク化されたデジタルデータは、時間や金銭と同じく寄付できるものだが、いくつかの重要な相違点がある。第一に、データには関連する情報が紐付いている。
デジタル化されたDNA情報だけでなく、テキストメッセージ、メール、連絡先のリストもそうである。また、自分のスマートフォンから友人のスマートフォンへとデジタル写真のコピーを送信する場合のように、一度に複数の場所にデータが存在しうる。さらに、莫大な量のデータを複数の場所に保管し、他の種類のデータとさまざまなかたちで組み合わせることができる。現状では、誰がどのデータにアクセス権を持っているか、データがどこにあるか、誰が何に使用しているかを把握することは非常に困難である。こうした複雑性は、デジタルデータを収集する側が意図的につくり出したものだ。このような特性を考慮すると、データを「提供する」というのは、実際にはデータの保持権を手放すことではなく、アクセス権の付与を意味することがわかるだろう。
このような考え方は、所有権だけでなく、社会貢献活動や寄付や管理に関する従来の考え方を覆すものだ。データの共有はたいていは、ほとんど手間がかからないが、だからこそ人々はデータがどのように使われるかを不安に感じる。この点でデータの提供は時間や金銭の提供とは異なるのである。
こうした理由から、デジタルデータの問題は、コモンズガバナンス(共通財管理)やデータスチュワードシップ(データの監督責任)に関する議論を再燃させている。データの所有者が誰であるかを定義するのが非常に困難であることを考慮すれば、この問題の捉え方自体を改めるべきではないだろうか。伝統的な知的財産権や個人所有権とは一線を画す、コモンズガバナンスの取り組みや公益信託は、デジタルデータのガバナンスについての代替案をもたらしうる。私たちは、いかにしてデータを共有し、新たな知見を見出していくかを検討する過程で、データ管理方法の捉え方も変えることができるだろう。つまり、データの所有権を誰か1人が持ち、その人以外は所有権を持たないのではなく、同意した持続可能なルールのもとに双方がアクセス権を持つと捉えることができるのだ。
データ提供について考察を進めていくと、データと権力に関するより大きな文脈に直面する。私たちは毎日のように、富と権力の集中によって、個人や地域社会、民主的ガバナンス、地球環境が脅かされていることを実感しているが、企業論理のデータ管理方法が富と権力の集中に拍車をかけている。地球温暖化、感染症の大流行、権威主義の台頭、現実に対する共通認識の減少といった集合的な問題に直面するときにこそ、私たちは目を覚まし、もっと新たな政治、知識、金融、権力のあり方がないだろうかと想像力が掻き立てられる。データ提供に関するルールが求められている現状は、新たなシステムを創造し、それを地球規模で導入しうる稀少な機会だといえる。関係性と互恵性の2つの価値観を中心に据えた、先住民族の伝統的な考え方や知恵を参考にすることもできるだろう。その2つの価値観は、私的所有よりもネットワーク化されたデータの管理方法に、よりフィットするからだ8。
データ提供を促進するシステムの設計は、幅広く公共に資するデータガバナンスプロセスを構築するというより大きな取り組みにおいて不可欠な要素であり、そのシステムは企業ではなく一般の人々やコミュニティに有利に働くように設計される必要がある9。それぞれの取り組みの方向性を揃えて過去の問題を修復し、公正な未来を追求することは可能だ。その際に乗り越えるべき問いは、いつどんなときにデータ提供の実行、許可、インセンティブの設定、阻止がなされるべきなのか、また、どのような場合にはデータ提供をするべきでないか、あるいはそもそも誰のデータが提供されるべきかである。新たな解決策についてより多くの知恵を持っているのは、悪影響を最も受けやすい人たちだ。既存の経済、政治、社会における抑圧や搾取行為によって不利益を被ってきた人々が主導権を持ってデータ提供のシステムを構想し、設計していくべきである。
データの提供は、さまざまな倫理上の問題や何世代にもわたる影響が伴うため、短期と長期の公正性の問題を提起する。その一例が、人工知能による顔認証技術において、学習データに偏りがあるため人種によって精度が異なり差別的であると指摘された議論だ。顔認証システムの能力を向上させて、すべての人種を高精度で識別できるようにすることは、これらのシステムの人種差別的な側面を短期的に「解決」することにはつながるかもしれないが、この技術が政府や企業の監視システムをより人種差別的なものにしてしまう可能性がある。新たなデータ提供の仕組みを構築するのであれば、そして特に社会的な不利益を是正するためにデータ提供を役立てようというのであれば、最初のステップは、すでに存在する抑圧的な仕組みからは答えを導き出せないという前提に立つことだろう。現行のデータエコノミーには、人種やジェンダーに基づく監視と差別の力学が設計上組み込まれてしまっている。データ提供を促進する仕組みを設計する際は、そうした既存システムの特徴に意識的に抗わなければ、すでに存在する強力で危険な搾取関係をより深く定着させてしまいかねない。
既存のデータエコノミーによって不利益を被ってきた人々に重点を置いた仕組みを構築すべき理由は他にもある。社会的な害をもたらすデータ収集の事例はすでに知られているが、そのようなデータの使い方は禁止されるべきだ。顔認証データや予測警備データの収集および利用においては、すでにそうした規制の動きがある。フィランソロピーや市民社会は、人々に選択権があること、活動への参加は本人が決めるものであることを前提にしている。私たちは(強制的な搾取ではなく)この慎重な選択というマインドセットを、データを提供するべきか、あるいはどのように提供するべきかという問題にも持ち込むべきである。そのためにはデータの提供について、どのような時間軸でどんな用途に使われるのか、関係者にはコントロールや選択の自由度がどれくらい与えられるのかを考える必要がある。
幸い、これらの問題の多くは金銭的なフィランソロピーのシステムのなかですでに議論されてきた。非営利団体に金銭を寄付する場合や社会貢献団体を立ち上げる場合、資金提供者は、寄付するかどうか、寄付するタイミング、何を寄付するか、どれくらいの額を寄付するか、何の目的のために寄付するか、どれくらいの期間にわたり寄付を続けるか、あるいは名前を公表するかどうかを決めることができる。また結果に満足しない場合に、是正する手段が数多く確保されている。少々意外ではあるが、金銭の寄付に関するこれらのルールは(主に富裕層にとって有利になるように設計されたものだが)、データの寄付(これは全員に便益をもたらす)について考えていく際の足がかりとなる。
現行のフィランソロピーのシステムについては、その大部分を見直す必要があり、改革の対象となりうるのは税制にとどまらない。より公正な社会をフィランソロピーを通して実現しようとする人々にとって、データ寄付をめぐる問題をその機会として活かすことで、フィランソロピーのあり方そのものも大きく転換できるかもしれない。私たち一人ひとりはデジタルデータの宝庫であり、スマートフォンやタブレットを使うたび、あるいは車を運転したり、電子書籍を読んだり、街を歩き回ったりするたびにデータを大量に生成する。だが、データをいつ・どのように提供するべきかというフレームワークはまだ社会に存在していない。私たちは、組織の義務や責任を明確化し、新しい法律をつくって、データ提供プロセスの指針としなくてはならない。ただし、現行のフィランソロピーにおけるお金の提供と同じ枠組みで考えてしまうと、効果は限られるだろう。地域コミュニティの伝統を考慮し、情報と知識がどう関連しているかを理解することが必要であり、それらに精通したリーダーやコミュニティの知恵を活かすことで、選択肢の幅を大きく広げることができる。
データ提供については答えが見えていない点も多くあるが、データの搾取がもたらす悪影響については十分承知しているはずだ。現行のシステムや仕組みに頼って新たなエコシステムをつくり出そうとすれば、こうした危害が持続するか、新たなかたちに変容するだけだと想定すべきである。従って、データ提供のシステムを考えるうえで最初のステップとなるのは、従来とは異なる人々に主導権を握らせることである。社会運動、歴史、理論、あるいは金銭的フィランソロピーの成功事例から学べることは、問題に最も近い当事者が一番熱心に解決策を追求するということである。現存のデータエコノミーによって最も危害を被ってきた人々が、新たなシステムを構築するうえで先陣を切っていくべきなのだ。つまり、黒人、先住民コミュニティ、有色人種、女性、性的マイノリティ、障害者、難民、低所得者、あるいはさまざまな信仰を持つ人々を中心に据えたアプローチである。
もし、私たちが直面する社会課題に対して、デジタルデータを活用した新たな解決策を確立する、真にグローバルな取り組みが実現したらどうなるかを想像してみてほしい。コミュニケーション学から、アフリカ系アメリカ人や先住民に関する研究、工学にいたるまで、分野を越えて研究者たちが提唱している、同意、主体性、支配、関係性、および表象についての知見が、実践的な意義を持つようになるだろう10。カースト差別、労働者虐待、権利剥奪、または環境的不正義に対抗する運動家たちによって築かれた人や環境を保護する方法は、データ管理においても安全保証のフレームワークとして機能しうる。オープンコレクティブ、共済組合、生活協同組合、シビックトラストなどの組織構造からも改めて学べることがあるだろう。
関係性の軸が、単にヒエラルキーの上下だけでなく、横方向にも時間的にも広がっていくため、説明責任が新たな意味を持つようになるだろう。さらに、人々、データ、コミュニティ、あるいは公益目的の違いを包摂するような多元的な取り組みには大きな力があり、それが、人々を保護し、選択権を提供する方法として広く認められるようになるだろう11。
データ提供に関する新たなルールの策定
デジタルデータが広く普及したいま、あらゆる人がその提供のあり方に関心を持つべきである。データ提供に関してフィランソロピーの新たなルールを構築する必要がある。100年余り前、アメリカは資本主義の急速な発展がもたらした金メッキ時代への反動として進歩主義の時代を迎え、フィランソロピーの新たなルールをつくって現代における慈善活動の礎を築いた。私たちはいま、同じような局面に立っている。公共の利益のためにデジタルデータを自由意思に基づいて安全に寄付する方法を、世界中の人々が求めているのだ。
この新たな動きはデータ・フィランソロピーとも呼ばれるが、その仕組みや実践はこれまでの寄付における最も基本的な前提を完全に覆す。国連が現時点で構想しているデータ・フィランソロピーのビジョンでは、データの使用目的、データセットの内容、誰がアクセス権を有するか、どの知見や発見がパートナー組織や一般に公開されるかなど、あらゆる事項を大企業がコントロールすることになっており、個人にはほとんど決定権がない。用途を選択する権利も、寄付に対する是正手段も持たず、何らかのかたちで役立つ情報を得たり、社会に貢献しているという満足感を得たりすることもない。企業は自社のサービス利用者に対して行使している強制力を、こうしたデータの利用においても行使しているのだ。それにもかかわらず企業は自らの気前のよさを装い、それが問題をさらに悪くしている。
このようなモデルから脱却するうえで重要なステップは、意思決定権をデータの提供者でユーザーでもある市民やコミュニティに移すことである。そうすることで、安全で公正な仕組みを確立して各コミュニティに真の変化をもたらし、市民社会がデジタル時代の主導権を握ることができるだろう。何がどこまで許容されるのか、どのようなデータは提供不可とするべきか、どのような悪影響を予測して阻止するべきかといった問題に取り組んでいるのが、iNaturalistのユーザーや開発者、セージ・バイオネットワークスの研究チーム、あるいはワクチンハンターを支える人々である。
他の非営利団体や市民やコミュニティも、データ提供のルール整備に貢献できる。そうした貢献を通じてそれぞれの領域に決定的な影響を与えるだけでなく、公正なデータ・フィランソロピーの実現へと社会全体の意識を向けられるだろう。非営利団体のモジラ財団は最近、Rallyという名の新たなウェブサイトツールを発表したが、これを使えばFirefox のブラウザから直接、関心のある調査研究にデータを提供することができる。つまり、提供者自身の選択権とコントロール権が中心に据えられているのである。
あらゆる社会貢献活動がそうであるように、データ・フィランソロピーをどのように設計するかは、私たちがどのような社会を望んでいるかが大きく影響する。たとえば、アメリカにおいて、大規模な私有財団に与えられている特権は、民間によるアクションを強く好むことを反映している。意図的であろうとなかろうと、こうした特権は、富裕層の納税負担を最小化して公的な財源を縮小させるような人々が、民間主導の名のもとに民主的な市民アクションを封じることを許してしまう。営利目的の企業がデータ・フィランソロピーに関するルールづくりを主導することになれば、同じような力が働くだろう。公益目的のためにデータを共有するかどうかという選択肢を企業に委ねることは、公共のニーズよりも企業利益を優先する傾向を強化することになる。また、そうしたデータの扱い方が常態化すると、公的な言論、民主主義への参加、個人や地域社会の生活に悪影響を及ぼす企業活動をみんなで監視しようという世界各国で広がる動きを弱めることになる。逆に、市民社会、特に企業によるデータの搾取の標的となって大きな脅威にさらされている人々が中心となってデータ・フィランソロピーのあり方を描くことは、個人とコミュニティの自由や主体性を約束することにつながる。
公共の利益のためのデータ活用には、政治的・倫理的問題、短期・長期的な公正性の問題がつきまとっており、現在の危険で根深い搾取関係を悪化させかねない。一方でその反対の未来を想像することも可能だ。生活のあらゆる場面でデジタルデータへのより公正なアプローチが実現されている社会だ。個人よりも社会全体としてより健全になることを重視する経済システムに関心を持つ人々やコミュニティには、データを人類の進歩に活用するための知識が蓄積されている。個人がデータ用途を選択する権利を持つためには、全員がこの局面の重要性を認識しなければならない。人を人として尊重するデータエコノミーの実装に向けた第一歩は、データをどのように提供するかを定義するという課題に対して、一人ひとりがその責任を負っていると認識することである。
【原題】The Looming Fight Over How We Give Our Data(Stanford Social Innovation Review, Winter 2022)
【イラスト】Project Twins
注
1 ディスコードとは、専用のサーバーを通して特定のトピックについてユーザー同士が音声や文字でやりとりできるアプリである。もともとは、オンラインゲーマーが会話するためのサービスだったが、現在はさまざまな話し合いの場として活用されている。こうした話し合いが行われる「場」であると同時に、その原動力となるデータが保管されるところは、ディスコードサーバーと呼ばれ、コミュニティのメンバーが管理・運営をする。
2 Courtney Shea, “At This Point, We’ve ProbablyHelped Thousands of People Book Shots” : Q&Awith Joshua Kalpin of Vaccine Hunters Canada,the Viral Website for Vaccine Appointment Intel.” Toronto Life , April 15, 2021.
3 Anoush Rima Tatevossian, “Data Philanthropy: Publ ic & Private Sector Data Sharing for Global Resilience.” UN Global Pulse , September 16, 2011.
4 Davey Alba, “Facebook Sent Flawed Data to Misinformation Researchers.” The New York Times , September 10, 2021.
5 Shea, “At This Point.”
6 事例の一覧は、René Mahieu and Jef Ausloos ,”Recogni s ing and Enabl ing the Col lective Dimension of the GDPR and the Right of Access.” LawArXiv , July 2, 2020.の付録を参照。
7 Yarden Katz, Artificial Whiteness: Pol itics and Ideology of Artificial Intelligence , New York: Columbia University Press, 2020; Jesse Daniels,”The Manifest Destiny of Computing.” Public Books, July 27, 2021; およびHarriet A. Washington, Medical Apartheid:The Dark History of Medical Experimentation on Black Americans from Colonial Times to the Present , New York: Doubleday, 2007.を参照。
8 Aaron Perzanowskl and Jason Schultz, The End of Ownership: Personal Property in the Digital Economy , Cambridge, Massachusetts: MIT Press, 2016.
9 Jathan Sadowski, Salomé Viljoen, and Meredith Whitaker, “Everyone Should Decide How Their Digital Data Are Used―not Just Tech Companies.” Nature, July 1, 2021.
10 たとえば、Ruha Benjamin、Safiya Noble、Marissa Duarte、Joy Boulamwini、Deb Raji、Sabelo Mlhambi、およびJasmine McNealyの研究を参照。ニューヨーク大学のCenter for Critical Race and Digital Studiesによって発行された以下のシラバスには、追加資料が掲載されている:CriticalRaceDigitalStudies.com/syllabus.
11 Matt Prewitt, “A View of the Future of Our Data.” Noēma, February 23, 2021.を参照。
Copyright ©2021 by Leland Stanford Jr. University All Rights Reserved.