La Hadopi a fait connaître les grandes lignes de sa stratégie pour observer l'utilisation des plateformes de streaming et de téléchargement direct, et analyser la quantité et la nature des fichiers mis à disposition sur newsgroups ou les réseaux P2P. La Haute Autorité va notamment déployer toute une série d'outils pour regarder vers quoi pointent les liens diffusés sur les sites et forums pointés du doigt par les ayants droit. La Hadopi a publié hier le programme de travail de son Département Recherche, Etudes et Veille (DREV), qui a pour but d'établir la méthodologie permettant de répondre aux indicateurs imposés par le gouvernement. Dans un décret du 11 avril 2011, le ministère de la Culture a demandé à l'Hadopi de chiffrer l'utilisation licite ou illicite des oeuvres, selon les
"catégories d'oeuvres et d'objets protégés", et les "modes d'utilisation". Nous avons vu ce matin que dans ce cadre, la Haute Autorité voulait installer des sondes chez les FAI pour observer les données de trafic. Mais elle prévoit aussi une série d'actions plus ciblées.
Ainsi, le DREV a mis au point un protocole pour
"quantifier, qualifier et suivre de façon périodique les mises à disposition et consommations de contenus sur les différents canaux utilisés par les internautes". Il prévoit d'observer l'utilisation des sites de streaming, de téléchargement direct (DDL), les newsgroups, et les réseaux P2P, en établissant des statistiques à partir d'un grand échantillon de contenus et de plateformes.
Concrètement, pour le streaming et le DDL, le DREV va mettre au point un crawler qui aura pour but de trouver un maximum de liens vers les plateformes d'hébergement de fichiers et de vidéos, très certainement à partir des sites et forums où ils sont diffusés. L'outil devra alors télécharger le contenu et/ou en déterminer la nature (film, clip, album de musique, etc.), sans être toutefois capable de dire officiellement s'il s'agit d'un contenu licite ou illicite, l'Hadopi n'ayant pas d'autorité pour juger la légalité.
"Les contenus des répertoires personnels, chiffrés ou de manière générale non accessibles à n’importe quel internaute ne seront pas pris en compte", veut rassurer la Haute Autorité, dont l'outil ne ciblera que les contenus dont les liens sont diffusés publiquement.
Pour réaliser cet outil, le DREV devra nécessairement opérer un développement spécifique pour chaque plateforme. La première étape consistera donc à définir les priorités en ciblant d'abord
"les plateformes les plus prisées par les internautes". Mais certaines pourraient être épargnées si elles sont trop bien protégées contre l'automatisation des téléchargements.
"Les plateformes dont le temps estimé d'échantillonnage ne serait pas raisonnable seront exclues de l'ensemble des plateformes cibles", prévient ainsi le DREV.
Avec cet outil, l'Hadopi espère obtenir un tableau mensuel présentant le type d'oeuvres partagées sur les principales plateformes de streaming et de téléchargement direct, et lui permettant de suivre les migrations des internautes d'une plateforme vers l'autre.
Evaluer l'efficacité des demandes de retraits de liens Le DREV réalisera le même type d'outil pour observer les newsgroups (Usenet), parce que
"l'étude des contenus mis à disposition sur UseNet nous semble primordiale". Sur le même principe qu'avec le streaming et le DDL, le département de recherche de l'Hadopi va d'abord sélectionner les serveurs NNTP les plus pertinents,
"représentatifs de l'utilisation des internautes français". Puis un crawler devra
"sélectionner de façon aléatoire un certain ratio de news", qui seront
"analysées, comptabilisées et classées selon leurs
types". L'idée est d'être capable d'identifier le type de contenu à partir d'un seul message, alors que les contenus diffusés sur les newsgroups sont très souvent divisés en fichiers PAR qu'il faut rassembler.
Enfin, le P2P sera lui aussi observé aux mêmes fins statistiques.
"La phase de mesure débutera par la création de clients modifiés pour chacun des réseaux P2P", indique l'Hadopi, qui veut
"qualifier et quantifier au plus juste les contenus échangés sur les réseaux P2P", et voir quels sont les réseaux P2P les plus populaires.
"Une fois les clients modifiés prêts, ils seront déployés et mis en activité sur les réseaux P2P ciblés pendant une durée de collecte d'informations définie". L'Hadopi, qui n'a pas le droit de collecter elle-même les adresses IP des utilisateurs, précise que cette étude statistique serait totalement déconnectée de la riposte graduée.
Par ailleurs, l'Hadopi veut étudier les
"familles de liens", c'est-à-dire l'ensemble des liens qui permettent de télécharger ou de visionner un même contenu hébergé sur différentes plateformes.
"Le DREV se propose de parcourir automatiquement les sites et forums et d'y procéder à l'analyse des liens afin de déterminer la structure de ces familles de liens", indique le document de l'Hadopi. Ces sites seraient déterminés en collaboration avec les ayants droit, et/ou se basant sur la liste des sites qui font le plus d'objets de demandes de retraits de liens sur Google, grâce aux tableaux publiés dans le Google Transparency Report.
"La répétition de ces observations et le suivi de la proportion de liens partagés et du nombre de liens existant permettra de vérifier s'il existe une réaction et une adaptation des contrevenants aux demandes de retraits formulées par les ayants droit", indique l'Hadopi. S'ils découvrent que les pirates s'adaptent rapidement, la Haute Autorité pourrait proposer des moyens plus musclés...
Source : numerama.com