Peut-on prédire l'avenir en analysant les données du présent ?

C'est sur ce vieux fantasme que les chercheurs en algorithmes se sont penchés ces dernières années. Dans le domaine médical, ces algorithmes permettent de déterminer les chances pour un individu de tomber malade en se basant sur toute une série de variables.

Mais si ces programmes promettent des avancées spectaculaires, ils posent aussi certaines questions éthiques, notamment l'utilisation de nos données privées.

Pour répondre à nos questions, nous avons interrogé Cédric Gouy-Pailler, chercheur au laboratoire Analyse de données et intelligence des systèmes du CEA.

"Il faut toujours se dire que quand on met quelque chose sur internet, ça peut être décrypté à un moment, ça peut être vu par quelqu’un d’autre et utilisé par quelqu’un d’autre. On met à disposition potentiellement des informations qu’on ne souhaite pas pouvoir être utilisées.

A quoi sert un algorithme prédictif ?

L’algorithme va utiliser ce qu’il connaît de la population pour voir si vous êtes plutôt dans une population à risque et essayer de donner une prédiction assez fine par rapport à votre personne. Par exemple pour un individu d’un certain âge, s’il a des chances de développer un cancer de la prostate, du sein ou du poumon. Dans ce cas, les données qu’on va mettre en entrées, ça va être le régime alimentaire, si vous êtes fumeur ou non et un tas d’autres informations.

Comment fonctionnent-ils ?

Un algorithme prédictif, c’est un algorithme qui sert à prédire des situations des fonctions. D’un point de vue mathématique, c’est une boîte qui prend en entrées un certain nombre de variables, l’âge de vos parents, l’âge auquel ils vous ont eu, votre adresse, le taux de fécondité de votre pays et à partir de toutes ces informations, il va essayer de prédire si vous êtes susceptible d’avoir un frère ou une sœur dans l’année.

Pourquoi peuvent-ils faire peur ?

L’utilisation des algorithmes prédictifs ça peut faire peur parce que ça va toucher de nombreux domaines de la société, la justice, la santé, l’économie, les sciences, le sport. Les gens ont en tête ces applications, tout le monde a vu des films comme Minority Report. Ils sentent que certaines choses peuvent leur échapper, qui vont soit limiter leur liberté, soit faire une société un peu trop homogène sur la créativité, sur le hasard, sur ce qui peut se passer demain, ça va peut-être contraindre les possibilités.

Quels sont les risques liés à leur utilisation ?

L’utilisation de ces algorithmes et de ces données peut être dangereuse dans certains pays. En Chine, les volontés du gouvernement sont à des fins de surveillance généralisée. Dans les systèmes de vidéosurveillance il y a de la reconnaissance de visage. Elle permet de suivre les individus dans leurs déplacements. Ces données aujourd’hui, on ne sait pas exactement à quoi elles vont servir. Si l’année prochaine il est possible que vous fassiez un séjour à l’hôpital, si l’information est récupérée par les assurances, on pourrait imaginer qu’ils vont ajuster votre cotisation afin de vous faire payer plus, parce que votre risque d’hospitalisation est plus grand. On entre alors dans une forme de discrimination basée sur le calcul d’un algorithme et il faut que cette utilisation soit encadrée.

Comment garder le contrôle ?

La loi a tendance à vouloir réguler l’utilisation des algorithmes, on le sent dans les derniers textes, comme le Règlement général sur la protection des données (RGPD) ou les textes informatique et libertés.

On a une volonté de remettre l’humain au centre de l’algorithme et que les données produites par l’humain soient contrôlées et qu’il y ait accès.

Il faut sensibiliser les gens au type de données qu’ils vont mettre à disposition sur internet, leur téléphone et même sur des messageries aujourd’hui sécurisées. Peut-être que les moyens informatiques actuels ne permettent pas de décrypter ces données, mais peut-être que les moyens de demain le permettront."