データポータビリティの意味

生貝先生の「EU新規則案データローカライゼージョン法の禁止と「非個人データのデータポータビリティ」という記事がでています。

まずは、原文を押さえておきましょう「EUにおける非個人データの自由な流通フレームワーク規則」(REGULATION OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL on a framework for the free flow of non-personal data in the European Unionになります。

データローカライゼーションというのも、非常に、注目すべきもの(といっても、これは、EU域内だろうというツッコミは、さておき)ですが、むしろ、データポータビリティに注目します。

データポータビリティというのが、非常に大事なものになるだろうというのは、全く、そのとおりだろうとおもいます。
まず、最初に確認しておくべきことなのは、データというのが、これからの情報処理については、まさに、燃料となるべきものであるということです。

たとえば、それは、「ディープラーニングによるラーメン二郎全店舗識別と生成」というスライドを見てもらえれば、わかることですが、ラーメン二郎のラーメンを分類するのに目視で、自撮りや店舗概観等を除去していかなければならなかったということです。

また、ドキュメントレビューにおいては、サブセットに対する関連性の判断が、「ファインチューニング」(スライド 28頁)の役割を果たします。その場合に、その関連性の判断は、それなりの経験を積んだレビューアー・弁護士がするので、関連性の判断のデータセットは、それ自体、非常に、価値のあるものになります

ところで翻って、実際のこのような判断ツールで、手間暇かけて作成したデータセットをそのまま、判断ツールの運営者に渡してしまうというのがいいのか、という問題が生じます。
そのような手間暇かけたデータセットは、その手間の分に釣り合う価格が提示されてしかるべきではないか、と考えられるのです。しかしながら、実際は、判断ツールが、競争のもとで自由に選択することができるということがなかなかないように思えます。そのような場合に、やむを得ず、クオリティの低い判断ツールを使わなくてはならなくなったり、手間にきちんとした価格が支払われなくて、手間がかけられなくなったりするのではないか、ということが考えられるのです。

実感したところで、説明メモに移ります。

提案目的では、クラウド、ビッグデータ、AI、IoTなどが、理由としてあげられています。特に機会学習を通じて、効率が上がっていくことに注目がなされています。

規制当局が、データに対してアクセスしうることを求めることを確保しやすくするということなのですが、いままで、そのような理由から、国内にデータがあることを求めていたりしています。そのアクセスを保証する代わりに、データの移動を改善しましょうというのです。

いま一つは、プロバイダーを移転しやすくするというのは、重要なことである

とされています。

この提案は、European Cloud initiativeを含むDigitising European Industry (DEI) policyパッケージ

European Interoperability Framework
の見直しの上になりたっているとされているのですが、このあたりの分析は、またの機会にしましょう。

条文としては、6条ですね。
1項 委員会は、プロバイダーの切り替えを促進するためのベストプラクティスに関するガイドラインを定義し、専門家にデータの保存と処理の契約が締結される以前に、十分詳細で明確かつ透明な情報を提供することを保証するために、連合レベルでの自己規制の行動規範の開発を促進し容易化する。以下の論点のとおり。
(a)プロのユーザーが別のプロバイダに切り替えるか、またはデータバックアップのプロセスと場所を含む独自のITシステムにポートデータを戻したい場合に適用されるプロセス、技術要件、時間枠および料金。これらは、利用可能なデータ形式とサポート、必要なIT設定と最小限のネットワーク帯域幅;移植プロセスを開始する前に必要な時間、およびデータが移植可能な状態になるまでの時間、およびプロバイダの破産の場合のデータにアクセスするための保証、を含む。
そして
(b)ユーザーがデータをスイッチまたは移植するのに十分な時間をもつことができる、構造化され、一般的に使用され、機械可読なフォーマットでデータをスイッチまたはポートするための操作上の要件。

2項 委員会は、本規則の適用開始後1年以内に第1項に規定する行動規範を効果的に実施するよう、事業者に奨励するものとする。
3項 欧州委員会は、この規範の適用開始後2年以内に、このような行動規範の開発と効果的な実施、および提供者による情報の効果的な提供を検討しなければならない。

昔は、データポータビリティというと、クラウドのロックイン効果があって、それに対しての緩和効果という文脈で語られたものでした。が、今だと、機械学習の文脈で語ったほうが実感を持ってもらえるという感じかなとおもいました。覚えさせる労力はだれのものかとか、プライバシーポリシーが適用されないとかは、エントリで紹介してきたので、そのような文脈でとらえられる規則案が出てきたのは、注目に値するといえるでしょうね。