Régis Chatellier et Geoffrey Delcroix - "Nous entrons dans un autre rapport au territoire, directement en lien avec les données."

Obligation d’ouverture des données imminente pour une partie des collectivités, tensions croissantes avec de nouveaux entrants privés… Au milieu de ces enjeux, le respect de la vie privée des individus parait souvent sous-traité, quand il n’est pas malmené. Un terrain de réflexion idéal pour LINC, l’organe de prospective et innovation de la CNIL, sur lequel il se concentre dans son dernier cahier, intitulé « La plateforme d’une ville ». Régis Chatellier et Geoffrey Delcroix, responsables de la prospective et de l’innovation, livrent les résultats de cette étude et appellent à une implication plus active des citoyens dans la collecte des données.  Une interview à retrouver dans notre dossier n°2 sur la donnée dans la ville. 

Comment la CNIL travaille-t-elle d’un point de vue prospectif ?

Les activités de prospective et d’innovation à la CNIL ont été créées il y a 7 ans environ. La particularité de la CNIL, c’est qu’hormis les fonctions supports, il y a disons autour de 70% de juristes et 25-30% de profils techniques, car nous traitons toujours des sujets qui sont hybrides. Chez LINC, nous sommes les seuls à avoir une approche orientée sciences humaines qui apporte un regard différent et convergent, en se concentrant sur les usages, les enjeux économiques et les questions éthiques liées au numérique. Depuis la loi pour la République Numérique, l’activité d’animation de débats éthiques est même devenue une mission officielle pour la CNIL.

Cette exploration a un double objectif : aider la CNIL à anticiper et catalyser un débat sociétal autour des enjeux éthiques, de libertés publiques et individuelles de l’usage des données et des technologies. Pour ça, nous avons deux outils principaux : les cahiers, appelés « Cahiers IP », et le site linc.cnil.fr, qui existe depuis deux ans. Le fait d’avoir cette deuxième « marque » permet à la CNIL de s’exprimer sur des sujets émergents avant d’avoir une doctrine ferme.

Quelle a été la genèse autour de cette dernière exploration ? Pourquoi avoir choisi la ville comme sujet ?

Nous avons voulu nous focaliser sur un angle plus précis, à savoir « comment la donnée modifie la vie dans la ville ? », plus que « comment la donnée modifie la ville en tant que smart city ? ». Auparavant, les premiers acteurs de la « smart city » possédaient les infrastructures, mais n’avaient pas les données. Les suivants étaient producteurs de données, mais n’avaient pas de vision globale. Aujourd’hui, nous voyons émerger un nouveau type d’acteurs privés ayant pour coeur de métier la donnée. A côté de cela, les acteurs publics emmènent les populations vers une utilisation de services qui implique d’accepter des Conditions d’Utilisation entraînant une captation de données toujours plus importante. Ce cahier analyse les rapports de force entre les acteurs publics et privés, et comment ce rapport de force impacte les droits et libertés des individus en créant une forme de dépendance à ces écosystèmes. Or, un utilisateur de Waze n’est pas pour autant partie prenante dans la décision de partenariat entre la ville et cet acteur privé. Ce triangle-là n’existe pas en réalité, ce qui nous a interpellé.

Le fait qu’il n’y ait plus de contrat pose aussi beaucoup de questions, comme celle de la responsabilité. Par le contrat, on est lié à la collectivité, et les chaines de responsabilité sont assez claires. Dès lors qu’il n’y a plus de contrat, cette chaine se dilue, alors que la responsabilité reste importante du point de vue de la CNIL. En adoptant ce type de relation, la collectivité n’a plus la responsabilité de traitement mais conserve une responsabilité politique qui n’est pas moins engageante. Notre objectif était de repérer où se trouvent les responsabilités vis-à-vis des données personnelles, quel est le rôle de chacun, et d’explorer des solutions qui pourraient être viables selon une matrice à 4 entrées, soit avec des nouvelles obligations légales, soit à droit constant.

L’open data est un sujet central pour les collectivités, mais est-il toujours bien compris ?

Le sujet n’est pas très bien compris, ou plutôt victime de son succès. Il existe deux formes d’open data : l’open data au sens strict, impliquant la mise à disposition des données anonymisées le plus largement possible, avec une logique au départ de transparence, sans trop savoir à quoi ces données vont servir. Et puis il y a tout le reste, qui n’est pas vraiment de l’open data. Le fait de réfléchir à des manières de mieux les partager ou mieux les valoriser rend ces données « more open », mais ça ne veut pas dire pour autant qu’on les met sur une plateforme d’open data. Les collectivités risquent alors de briser les règles qu’elles ont eu tant de mal à mettre en place, et faire des grosses erreurs en confondant pseudonymisation et anonymisation et en ne prenant pas les garanties appropriées pour préserver les droits des personnes concernées. Créer une régie de données entre la collectivité et ses délégataires de service public et les équipes de recherche, ce n’est pas de l’open data.

La loi République Numérique a quand même stabilisé certaines choses. Maintenant, l’open data est obligatoire pour les collectivités de plus de 3500 habitants, avec un certain nombre de jeux de données d’une part, et l’obligation d’anonymisation d’autre part. La CNIL travaille avec la Commission d’accès aux documents administratifs (CADA) à un « pacte de conformité », sorte de boîte à outils de l’open data au regard des obligations concernant les données personnelles.

Au départ, certains se sont lancés dans l’open data en pensant que c’était simple et gratuit, mais ils se sont rapidement rendu compte que ce n’était pas toujours le cas, pour les trois grandes promesses (transparence, participation et développement de nouveaux modèles économiques). Si on se rend compte que l’open data ne constitue pas l’alpha et l’oméga de l’innovation par les données… Il y a toutefois un effet bénéfique dans les organisations, qui est de leur faire « penser la donnée » et de jouer un rôle actif dans la transformation numérique des collectivités. A Rennes, l’open data a eu un réel impact en interne : elle a permis de valoriser les compétences de certains, de casser les silos, de
rationaliser les process. Cet intérêt n’était pas le plus mis en avant parmi les promesses de l’open data à l’origine, mais in fine, il est vraiment intéressant.

Et quid de la promesse économique de l’open data pour le territoire, qui était l’argument le plus valorisé ?

C’était la promesse originelle, sur la phase 2009-2012, mais on en est revenu car pour la réaliser, on a besoin de données qui sont des données à caractère personnel. Il faut les acquérir ou les partager dans des conditions qui ne sont pas des conditions d’open data. Ça peut passer par des projets type régie de données, des programmes comme « Connected Citizens » de Waze ou par des obligations légales, comme ce qui existe pour des données des opérateurs de l’énergie et les données de transports suite aux lois Transition Energétique et Macron. La donnée publique seule n’est pas toujours suffisante.

L’entregent de grands acteurs privés comme Waze ou Uber a créé une certaine asymétrie avec les collectivités qui ont besoin de leurs données pour améliorer leurs propres services. Quels rapports ces acteurs privés développent-ils avec les collectivités ?

Ils sont dans un rapport de domination et de séduction. Il faut reconnaître à ces entreprises une bonne image, et un apport positif sur le plan technique par exemple. Il est même étonnant que les partenariats ne se généralisent pas plus vite, car si on les considère sans approfondir, il n’y a quasiment pas de point négatif. Les collectivités doivent se méfier… à raison ! En termes d’image, pour la ville de Versailles, annoncer la création d’un partenariat avec Waze reste un argument attractif. Nous observons également une activité de lobbying de la donnée, très claire dans le cas d’Uber. Ils sont parfois en lutte avec les collectivités, et donnent accès à leurs données pour se racheter une conduite ensuite. Le risque en se rendant indispensable, incontournable et omniprésent, c’est de tendre vers une véritable mais peu acceptable externalisation du service public qui ne dit pas son nom, un peu comme avec le Safety Check de Facebook. On se retrouverait dans une situation où on pourrait penser que l’Etat a intérêt à ce que tous les habitants soient sur Facebook, et à ce que Facebook prenne en charge les alertes à la population en cas de danger majeur. Facebook endosse un rôle qui n’est pas le sien : quel Etat laisserait Facebook décider ce qu’est une alerte grave ?

Un autre exemple du danger de l’intermédiation est celui de Sidewalk Labs avec son projet Flow et le projet d’aménagement d’un quartier à Toronto : Google a poussé ses solutions de paiement et de géolocalisation quand il tentait de développer son service de stationnement intelligent en arguant que les gens possédaient déjà des terminaux mobiles Android. Ce sont des formes d’externalisation qui donne à cet acteur la possibilité d’identifier les personnes et d’accroitre la portée de leur ciblage publicitaire, ce qui est problématique pour nous sur le plan du respect de la vie privée et des droits des personnes concernées.

Si on poussait la logique d’externalisation à l’extrême, Google deviendrait-il ainsi le nouveau maire ?

Non seulement il deviendrait le nouveau maire, mais il s’agirait du même maire partout. Leur grand pouvoir, c’est de pouvoir dire « les gens connaissent nos services et sont à l’aise avec notre interface ». Ce qui est vrai, mais cela tend à homogénéiser l’offre. Au départ, c’est toujours avantageux, mais ça peut devenir problématique dans la durée.

Comment les collectivités peuvent-elles contrebalancer et recréer un équilibre ?

La capacité de négociation des collectivités est un vrai sujet. Si on les laisse discuter une à une avec ces acteurs, elles vont se retrouver dans la même situation qu’un particulier vis-à-vis de ces contrats. Et quand on est un utilisateur privé, on ne négocie pas la nature du contrat que l'on souscrit sur Gmail ou Facebook... Il faut un travail collectif sur la manière de gérer ces questions de gouvernance des données, et décider de ce qu’il faudrait imposer par la loi et des moyens et ressources qui pourraient être mutualisés. Il n’y a actuellement pas de front commun, car les collectivités sont aussi en concurrence entre elles. Il faut mettre en place des dispositifs pratiques et un soutien concret avec des ressources mutualisées.

La définition de ces moyens et ressources serait-elle du ressort de l’Etat ?

Cela pourrait être son rôle, ou du moins celui des grandes associations et des regroupements de collectivités, qui ont un rôle extrêmement important sur ce sujet. Pour les problématiques liées aux données personnelles, les collectivités ont encore des difficultés : par exemple, se mettre en ordre de bataille pour se conformer au règlement général sur la protection des données (RGPD) reste un défi pour beaucoup d’entre elles, en termes de moyens comme de compétences. Nous travaillons avec l’Association des Départements de France et d’autres grands regroupements de collectivités pour mutualiser des bonnes pratiques, des conseils, des moyens. Le Délégué à la protection des données prévu par le RGPD peut également être mutualisé.

Une fois capitalisée, la donnée pourrait-elle être utilisée comme un outil d’aménagement pour la collectivité ?

La question de la maîtrise de l’espace public parait éloignée du domaine des données, mais elle est pourtant très reliée. Si l’on prend l’exemple des vélos en free-floating par rapport à un système de type Vélib’, il s’agit d’acteurs avec un modèle économique différent, hors de toute contractualisation traditionnelle, mais qui vont avoir à la fois un impact positif en favorisant la mobilité douce, et un impact négatif par l’effet de dégradations, de manque d’entretien ou encore d’occupation sauvage des espaces publics partagés. En termes de régulation, les acteurs du free-floating devraient avoir des obligations. Certaines villes américaines ont ainsi imposé que ces acteurs retirent un vélo signalé par un citoyen dans les 30 minutes suivant la plainte sur l’application de la ville. Cela touche au rôle d’aménageur de la collectivité en la sortant de la seule logique du zonage. Nous entrons dans un autre rapport au territoire, directement en lien avec les données.

Comment peut-on transformer la ville grâce aux données, non seulement d’un point de vue purement urbanistique, mais également en termes de service ?

Citymapper a par exemple conçu un nouveau système de transport en se basant sur les données que le service a accumulées, créant ainsi une ligne de bus beaucoup plus fluide tout en transformant l’expérience de transport par une myriade de détails. Cette expérience change aussi complétement la notion d’arrêt de bus. Pour l’instant, la ligne de bus est traditionnelle, mais elle va devenir de plus en plus évolutive par un recalcul constant des arrêts en fonction des lieux de prise en charge et de dépose des usagers. On voit bien avec cet exemple que l’usage de la donnée peut avoir un impact très concret sur les services urbains.

Quelles sont les modalités de partenariat avec ces acteurs, et à quel point peut-on laisser le champ libre pour créer des services bénéfiques pour l’ensemble du territoire ?

Un des points qui nous avait conduits à creuser la notion de données d’intérêt général, c’était le conflit entre Uber et la ville de New York. La ville a demandé à Uber de transmettre ses données de trajet avec points de départ et d’arrivée, ce qu’Uber a refusé de faire en utilisant l’argument de la protection de la vie privée de leurs utilisateurs. Il faut dire que la ville de New York avait précédemment obligé les taxis à transmettre ces informations et les avait rendues publiques après un travail d’anonymisation que l’on peut qualifier d’insuffisant au regard des réglementations en vigueur en Europe…

Une fois ouvertes et mises à disposition du public, des chercheurs ont montré qu’il était facile d’identifier des personnes, comme des célébrités, en recourant aux photos de paparazzi. La ville de New York a dit avoir toutefois besoin de ces données, pour savoir où aménager des places pour les taxis ou les VTC dans les rues. On s’est concentré sur ce cas, en faisant ressortir par exemple la question de la portabilité, et l’idée que les usagers pourraient décider eux-mêmes de transmettre certaines de leurs données à la collectivité, sans qu’il y ait besoin de passer par Uber, Waze ou autres. C’est une manière de recréer un lien entre citoyens et collectivités, avec l’idée d’une coopérative de données. Ça serait une manière de se passer des négociations avec les acteurs privés.

Comment faire appel au citoyen pour la collecte de leurs données ?

En s’approchant des utilisateurs de ces services pour demander à exercer un droit de portabilité tout en garantissant l’anonymisation des données lorsque cela est nécessaire. Cette démarche permettrait d’avoir les informations de tous les acteurs présents sur le territoire, et pas seulement celui avec lequel on a réussi à négocier. Il y a un vrai sujet sur la manière dont la donnée peut priver la collectivité de son pouvoir sur le territoire, au sens de terrain, ou au contraire le lui redonner. Les villes doivent réussir à opérer cette portabilité pour garder la maîtrise de leur territoire.