未踏スーパークリエータが挑む「プライバシーテック」その展望とは

近年、個人情報を保護しながらデータ利活用できる技術としてEU圏を中心に注目を集めている「プライバシーテック」。

世界各国でプライバシーテックの技術開発が進んでいる中、日本ではプライバシーテックの発展にさまざまな弊害が生じているといいます。

そこで今回は株式会社Acompanyの研究開発チームに所属する櫻井碧氏に、プライバシーテックの概要や、今後の展望についてご寄稿いただきました。

個人情報を保護しながらデータ利活用できる技術

プライバシーテックとは「個人情報を保護する」「データを利活用する」という2つの要件を同時に満たす技術です。

個人情報は厳格に保護するべきものであり、クラウドサーバの出入口を保護していても、サーバ上で生のまま処理することはご法度とされています。

そのため「個人情報を保護してしまったら、そのままでは中身が見られないので計算に使えない」「計算に使うのであればデータの中身が見えてしまうので保護できない」といった、ジレンマが生まれているのです。

データを暗号化しながら計算できる「秘密計算」

従来の技術では、個人情報の保護・利活用を同時に実現することは難しいと言われてきました。そんな中、昨今はこの一見相反する二者を両立する技術が注目されています。その技術こそがプライバシーテックの要の1つである「秘密計算」です。

秘密計算は「そもそも秘密情報が保護されている状態、すなわち他者から見えない保護された状態のまま計算を行った結果が“使用された各情報を特定できない形(統計情報)”であれば、秘密を守りながら計算を行える」というアイデアにもとづいて生まれた技術です。

秘密計算を実装するために用いられる技術の候補はいくつかありますが、現在、一般的に有力候補と見なされているのは、「秘密分散」「TEE(Trusted Execution Environment:信頼可能な実行環境)」「完全準同型暗号」の3つです。ここで、簡単にこの3つの概要を説明します。

乱数化された断片に分割する「秘密分散」

まず秘密分散は、データを「シェア」と呼ばれる乱数化された断片に分割する技術です。通常、シェアを全て揃えると元のデータの復元が可能となりますが、秘密分散ではシェアが全部揃っていなくても計算が行えます。

そのため、各シェアを別々のサーバに配置して処理すれば、前述の秘密計算としての要件を満たすことができます。ちなみに、秘密分散はAcompanyが特に力を入れている技術です。

ハードウェア上の隔離領域で処理を行う「TEE」

TEEは信頼可能なハードウェア(SGXであればIntel製CPU)と、信頼可能なハードウェアやそれと密接に関わっているソフトウェアにより生成されたメモリ上の保護された隔離領域でデータを取り扱い処理を行うことで、終始一貫してデータを守りつつ処理を完遂させる技術です。

隔離領域に暗号化された状態で計算に使用する秘密情報を送り込み、隔離領域内で復号(暗号化の解除)および計算を行い、統計情報を出力させることで、TEEを秘密計算の実装に応用することができます。

暗号文の状態で処理を行う「完全準同型暗号」

3つ目の完全準同型暗号とは、暗号文の状態で足し算や掛け算を行うことができる暗号を指します。

完全準同型暗号で暗号化した状態で秘密情報同士の計算を行った後は、結果である統計情報を復号すればいいという、仕組みとしては最も秘密計算にマッチしている技術と言えるでしょう。

状況・目的に応じて技術を使い分けることが可能

秘密計算の面白い側面として、状況や目的に応じて実装に使用する技術を使い分けられる点が挙げられます。

例えば「暗号強度を最優先するなら完全準同型暗号」「速度を最優先するならTEE」「シェアを別々のマシンに配置して物理的に逆算できなくなる“情報理論的安全性”を優先するなら秘密分散」といったように、利用可能な技術同士でいろいろなシチュエーションに対応できます。

秘密計算の「完璧な」実装は難しい

ここまでの説明を受けて「プライバシーテックの根幹技術の1つである秘密計算を使えば、プライバシーテックを妨げるものない」といった印象を抱く人がいるかも知れませんが、現実はそう上手くはいきません。

秘密計算の実装に応用可能な技術を3つ紹介しましたが、実はこれらはいずれも無視できないデメリットを抱えています。

例えば、秘密分散の場合はある程度、性能の高い複数のマシンを用意する必要があります。さらに、秘密分散を進める上で発生する通信回数がかなり多いことから、秘密分散を用いた計算のパフォーマンスを落としてしまいます。

完全準同型暗号に関しては、特徴や秘密計算の応用方法だけ見るとかなり魅力的です。しかし、致命的な欠点として、絶望的に処理速度が遅いだけでなく、メモリの消費が激しい上に、計算を重ねるほど値にノイズが乗るという特性を抱えています(一応除去できますが、除去作業に膨大なリソースを要します)。

そのため、現代のコンピュータリソースではなかなか応用が難しい段階であると言わざるを得ません。TEEは、そもそも秘密計算を想定して作られている技術が存在しないため、実際に秘密計算へ応用しようと試みた際に不都合が発生するケースがあります。

例えばTEEの1つである「Intel SGX」を秘密計算に応用する場合は「プログラムが不正なものにすり替えられたり、改ざんされたりしていないか」をユーザが検証することが、かなり難しくなる現状があります。

技術だけでなく、法律にも精通する必要がある

秘密計算の実装に応用可能な技術の課題と同等以上にプライバシーテックにとって足枷になっているのが、「法律」そのものです。

先述した通り、完全準同型暗号・秘密分散・TEEという3つの技術は、本来状況に応じて互いに補い合うべき立場にそれぞれあります。

しかし、日本の個人情報保護法のガイドラインには「個人に関する情報とは(略)暗号化等によって秘匿化されているかどうかを問わない」という、控えめに言えば不思議な、直球で言ってしまうならばかなり異常な記載があります。

これにより現在の日本社会でプライバシーテックを打ち出すには、シェア化することにより物理的に復元できなくする秘密分散が一強となっており、プライバシーテックの日本における発展を大きく阻害している状況です。

この足枷により、本来3つの技術が一様に日本のプライバシーテックを回していくべき部分に、大きな遅れが生じている印象は否めません。

さらにグローバルに視点を移した場合、地域ごとに適用される個人情報の取り扱い関連の法律がバラバラであるというのも大きな障壁となります。

日本では許容されているものがヨーロッパやアメリカでは通用しないといったことや、またその逆のことも起こり得るので、グローバルでプライバシーテックを打ち出すのには大変な労力を要するでしょう。

このように、プライバシーテックは技術面・法律面の双方で困難を抱えている技術であるため、いざ個人情報を保護した状態での利活用を行いたいと思い立ったとしても、なかなか気軽に着手でないのが実情です。

「BI-SGX」開発でぶつかった壁

私が一個人の技術屋として取り組もうとしたときにも、やはり同様の理由により困難にぶつかる、ということがありました。

実際、2019年度IPA未踏事業においてプライバシーテックのコアの1つである秘密計算を実現する、生命情報解析向けのクラウドシステム「BI-SGX」を開発しましたが、そこから先の進出・展開は難しいものでした(というか半ば頓挫する形で放棄してしまっています)。

BI-SGXは「SGX(Intelから提供されているTEE技術の1つ)」の煩雑さから開発者やユーザを救うために、“完全にフリーで使用できるオープンソースのソフトウェア”として作られたシステムなので、有償で展開する場合に比べれば大分難易度は低かったと思います。

しかし、今になって考えてみれば、私個人の力で前述のような法律上の問題含めて的確に解決しつつニーズを見つけることは、やはり相当難しかったであろうと実感しています。

デジタル化の遅れを取り戻す技術「プライバシーテック」

ここまで、プライバシーテックにおいては、そのコアとなる技術である秘密計算を実装できる技術としていくつか存在すること、そしてそれぞれが別々の困難や課題を抱えていることを説明しました。

この事実は、見方を変えると「プライバシーテックは今後の技術の発展とともに目覚ましい進化を遂げることができる技術である」と解釈できると私は考えています。

例えば、将来的にコンピュータの処理速度やメモリサイズといったリソースが増強されたり、またはアルゴリズムそのものが改良されたりすれば、完全準同型暗号のパフォーマンスはどんどん現実的なものになっていくでしょう。

TEEにしても、将来的により質のいい製品が生まれれば効率や安全性が上がるでしょうし、あるいはまだ見ぬ新しい技術が、秘密計算やプライバシーテックにブレイクスルーをもたらしてくれるかもしれません。

同時に、プライバシーテックの理想的な姿に合わせた法律のアップデートも、プライバシーテックの台頭に直結することでしょう。

そのためにも、やはり時代にそぐわないような法律という“壁”は、(もちろん正当な方法で)乗り越えていかなければなりません。

海外で実績を上げた実例を参考にして国内に取り入れ、日本の法律下でも許容されるように政府や国際機関に働きかけて、法律を積極的にアップデートしないと、ほかの技術同様、確実に海外に遅れを取る結果となります。

実際、秘密計算に応用可能な技術であるTEEに関しては、私の研究経験上、すでに海外と比べて著しく遅れています。

業界団体の設立とそのねらい

左から、中村龍矢氏、高橋亮祐氏、今林広樹氏

このような「遅れ」を取り戻し、プライバシーテックを日本において発展させるにはどうすべきか。私が所属するAcompany主導で発足したプライバシーテック協会のような業界団体による活動は、かなり有効なアプローチなのではないかと思います。

そもそも、秘密計算はオープンな技術を利用して実現されていることが多いく、個人的にはかなり「開かれた技術」だと感じています。

もちろん、企業ごとにそれぞれ利益が必要なので、プライバシーテックを発展させていく上で、時には切磋琢磨という形で競合していくこともあるでしょう。

ただでさえIT技術に関しては悪い意味で過度に保守的で、法律もお世辞にも時代に即しているとは言えない、近年の日本社会。

その中でプライバシーテックを普及させていくのであれば「競合の立場であるさまざまな主体が業界団体のような形で協力しつつアップデートを重ねること」が秘密計算・プライバシーテックの風土的にも理にかなっているのではないか、と私は考えています。

<著者プロフィール>

櫻井碧
Acompany研究開発チーム所属

大学院における研究及び2019年度IPA未踏事業において、TEEの1つであるIntel SGXを取り扱った研究に着手し、スーパークリエータ認定を取得。


Amazonベストセラー

返信を残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA