[MUSIQUE] Bonjour. Dans cette vidéo, je vous propose de nous intéresser aux données numériques qui sont générées lors de nos mobilités, et plus précisément aux données que l'on appelle les Big Data. J'évoquerai les opportunités que celles-ci offrent pour observer, décrire et analyser des comportements de mobilité de personnes, mais aussi certaines de leurs limites. Pour cela, j'ai organisé cette vidéo en quatre parties. Premièrement, je citerai trois phénomènes qui se sont produits en 2008, afin de rappeler l'importance des évolutions auxquelles nous sommes quotidiennement confrontés. Deuxièmement, je m'intéresserai à trois propriétés des Big Data, le volume, la variété, la vélocité, afin de saisir les changements de paradigme qu'elles introduisent dans l'étude des mobilités des personnes. Troisièmement, j'évoquerai les opportunités qu'offrent les Big Data dans le champ des mobilités, mais je soulignerai aussi quelques limites. Enfin, j'ouvrirai la réflexion sur les enjeux politiques relatifs à la gestion de ces données et à la gouvernance de nos mobilités. Il faut revenir en 2008 pour bien comprendre l'environnement socio technique dans lequel nous vivons désormais. Comme l'explique Anthony Townsend dans l'introduction de son livre sur les smart cities, notre civilisation a atteint trois seuils historiques en 2008. Le premier n'est pas le plus important quant au sujet qui nous réuni aujourd'hui, mais il n'est pas inutile de rappeler que pour la première fois dans notre histoire, la population urbaine mondiale est devenue équivalente à la population rurale mondiale durant cette année. Deuxièmement, pour la première fois également dans notre histoire, c'est en 2008 que le nombre d'abonnés à l'Internet mobile a dépassé le nombre d'abonnés à l'Internet fixe. Enfin, c'est aussi en 2008 que nous sommes passés de l'Internet des personnes à l'Internet des objets. Ces objets peuvent être mobiles, à l'image de nos téléphones portables, de nos GPS, de nos montres connectées, de nos cartes de transport munies de puces RFID, ou encore de nos voitures. Mais ils peuvent aussi être fixes, comme les caméras de surveillance ou encore les capteurs que l'on place dans les parkings pour informer les usagers du nombre de places disponibles. Le numérique est ainsi qualifié de pervasif, car les objets connectés se déploient dans l'ensemble de notre environnement quotidien, au point d'en constituer une peau digitale selon l'expression de Rabari et Storper. L'ensemble des capteurs ainsi que le web et les réseaux sociaux sur lesquels nous laissons des traces de nos activités sont producteurs d'une quantité phénoménale de données très variées, générées et traitées quasiment en temps réel, et parfois de manière continue. Ces Big Data, comme nous les appelons couramment, permettent de mesurer chacune de nos mobilités en fonction de nombreux indicateurs. Bien qu'il existe des modèles à quatre, cinq ou six dimensions, les Big Data sont généralement décrites au travers de trois dimensions. Soit le volume, la variété et la vélocité. On parle ainsi des trois V des Big Data. Quand on évoque les Big Data, on pense d'abord au volume, à la dimension Big de ces datas, c'est-à -dire à la quantité phénoménale de données numériques qui sont générées au moindre mouvement des individus, le plus souvent sans que ces derniers n'en aient connaissance. La récolte et l'analyse de millions de données permet à un territoire public de mieux connaître les itinéraires d'un très grand nombre d'usagers de ses réseaux de transport. Mais elles rendent également possible l'identification de modèles de comportement. En d'autres termes, de patterns. Il est alors possible de mieux adapter, diversifier, voire personnaliser une offre de transport en fonction de catégories de voyageurs et de leurs itinéraires. Dans le cas du trafic routier, c'est grâce à l'accumulation toujours plus conséquente de données qu'il est possible d'entraîner des algorithmes qui prédisent la formation de ralentissements ou de bouchons, et de réduire les approximations dans les estimations fournies. La variété illustre la possibilité d'associer des données structurées et non structurées issues de multiples sources et de formats différents : des chiffres, des textes, des images, des vidéos, des logs de connexion, etc. Ainsi, de nombreux services de mobilité agrègent désormais des données relatives aux transports publics urbains, aux vélos, aux trains, aux avions, à l'autopartage, ou encore au covoiturage, et ceci afin de proposer une offre de mobilité multimodale aux usagers. Les usagers ont ainsi la possibilité de comparer des offres et de faire des choix en fonction de plusieurs critères : le mode de transport, le temps de trajet, le coût du trajet, le type de voie empruntée, l'empreinte carbone du trajet, voire des critères plus subjectifs comme le type de paysages ou d'odeurs que l'on souhaite avoir sur son parcours. Enfin, la vélocité incarne la haute fréquence à laquelle sont produites et utilisées les données. Celles-ci sont générées, actualisées et analysées quasiment en temps réel, et parce qu'elles sont horodatées, elles permettent de suivre des pratiques spatiales dans le temps, donc des flux. De ces flux, il va être possible d'identifier des habitudes, des fréquences, donc des rythmes dans les pratiques de mobilité. L'optimisation, la fluidification, la prédiction ou encore la personnalisation sont autant de termes qui caractérisent les multiples promesses des Big Data dans le champ des mobilités des personnes. Pour un territoire public, les Big data ouvrent la perspective d'une meilleure optimisation et gestion des services proposés aux usagers des réseaux de transport. Pour les usagers, les Big Data sont la promesse d'une expérience multimodale plus simple, plus fluide, plus rapide, plus économique, voire plus sociale. Enfin, pour les entreprises, les Big Data représentent de multiples opportunités de valorisation économique au travers de la monétisation de services ou des données elles-mêmes. Pour ceux qui étudient les pratiques et les représentations des mobilités et de leurs évolutions, les Big Data se présentent souvent comme un nouvel eldorado, car elles donnent accès à des données qui renseignent des propriétés très spécifiques des individus à une granularité très fine, mais pour un grand nombre d'individus. De plus, elles sont composées de données considérées comme objectives, à l'image des traces obtenues à partir d'un GPS, mais aussi de données plus subjectives comme des photos ou des textes que l'on poste sur Facebook, Twitter, ou encore sur un blog pour décrire un voyage ou un trajet quotidien. Un autre intérêt de ces données et de ces traces numériques, c'est qu'elles sont produites en dehors de tout contexte scientifique, c'est-à -dire en dehors d'une situation d'enquête ou d'un laboratoire. D'une certaine manière, on peut dire qu'elles sont générées et captées sur le vif. Mais si les perspectives offertes par le Big Data pour l'étude et la compréhension des mobilités sont particulièrement stimulantes, elles ne doivent pas masquer des limites trop souvent oubliées. Il faut d'abord considérer que la quantité de données obtenues, aussi conséquente soit elle, ne signifie pas l'exhaustivité. Il y a toujours des personnes qui ne sont pas prises en compte, soit parce qu'elles ne sont pas équipées pour ou qu'elles n'utilisent pas le service adéquat, soit qu'elles ne le souhaitent pas, ou encore parce que le dispositif de captation, de recueil et de traitement des données a ses propres défaillances. De même, la quantité ne veut pas dire la représentativité. Relier des données numériques à des identités, quand ce n'est pas interdit, est parfois très compliqué, comme pour les réseaux sociaux où chacun est plus ou moins libre de se créer une identité alternative avec un pseudonyme et un âge qui n'est pas le sien. Enfin, quelles que soient les sources des données qui servent à l'analyse des mobilités, celles-ci ne sont jamais brutes. Toute donnée est toujours le fruit d'un processus de fabrication réalisé par un ou plusieurs opérateurs. Il importe donc de toujours connaître les choix qui ont été réalisés à chaque étape d'un processus qui va des données captées à ce que Bruno Latour appelle des obtenus, c'est-à -dire les données en bout de chaîne telles qu'elles sont présentées une fois qu'elles ont été collectées, stockées, nettoyées, traitées, analysées et mises en forme au travers d'un dispositif de visualisation pour enfin être communiquées et interprétées. Dès lors, il devient nécessaire d'ouvrir les boîtes noires des algorithmes pour comprendre quels sont les modèles qui permettent de prévoir des affluences, de prédire des trajectoires ou encore de recommander des itinéraires. De manière très simple, comment être sûr que l'application que nous utilisons pour nous orienter lorsque nous conduisons nous fait passer par le chemin le plus court, et non par une route sur laquelle se trouveraient des commerces qui paieraient l'application pour cela? Cela peut paraître inconcevable, mais lorsque vous recherchez sur Google Maps un restaurant à proximité de votre position, la liste qui s'affiche n'est pas simplement ordonnée par rapport à la distance qui vous sépare des différents établissements. En effet, celui qui apparaît en premier est parfois celui qui a payé pour obtenir cette place. Cet exemple peut sembler caricatural, mais il faut comprendre que les algorithmes sont conçus par des individus qui font des choix. Et ils sont, selon les mots de Dominique Cardon, comme toute entité technique, c'est-à -dire qu'ils construisent des formes et déploient des représentations statistiques de la société qui organise le monde d'une certaine façon, du moins les mobilités dans notre cas. Ces arguments prennent alors un tout autre sens quand on s'intéresse aux partenariats qui se tissent entre des collectivités publiques et des grands groupes comme IBM, Cisco ou encore Google, et qui ont par exemple pour mission d'optimiser et de fluidifier le trafic urbain. Un des problèmes de ce type d'approches est que ses acteurs ne font que chercher des solutions à une problématique. Ils ne repensent pas la problématique. C'est ce qui se passe quand un service comme Wise propose à un usager de la route de prendre une voie parallèle à un axe principal, afin d'éviter un bouchon. Les Big Data sont dans ce cas utilisées pour trouver une solution à un problème qui est la congestion du trafic. Pourtant, elles pourraient permettre de construire une nouvelle conception de la mobilité en étudiant par exemple les externalités sanitaires, environnementales ou économiques qui sont liées à l'usage de la voiture, afin d'inciter le développement de mobilités douces ou encore de repenser le covoiturage sur des trajets courts. Les enjeux et les problématiques qui sont liés à l'utilisation et à l'interprétation des Big Data dans le domaine des mobilités ne sont donc pas seulement d'ordre technique. Elles sont fondamentalement politiques. [AUDIO_VIDE]