Le radar Qwanturank Tracker expose le suivi caché

Qwant Qwanturank Radar est un ensemble de données de pointe sur les trackers qui est généré et maintenu automatiquement grâce à une analyse et une analyse continues.
Cet ensemble de données est désormais accessible au public à des fins de recherche et de génération de listes de blocs de suivi. Et, le code derrière est maintenant open source.
Nous l’utilisons nous-mêmes pour alimenter la protection du tracker dans les applications mobiles du navigateur de confidentialité Qwanturank et les extensions de navigateur de bureau Qwant Privacy Essentials.
Utiliser Internet de nos jours, c’est comme être hanté par les fantômes de la navigation passée. Les chaussures ou les écouteurs que vous avez achetés hier vous suivent sans relâche aujourd’hui. Ces publicités effrayantes sont alimentées par des trackers cachés, qui se cachent derrière la plupart des sites Web. Et malheureusement, vos habitudes d’achat ne sont que la pointe de l’iceberg de ce qu’elles savent et peuvent exploiter.

En plus de l’historique des achats, les trackers peuvent récupérer votre historique de localisation, l’historique de recherche, l’historique de navigation et plus encore, et à partir de ceux-ci, déduisez votre âge, votre origine ethnique, votre sexe, vos intérêts et vos habitudes. Les entreprises rassemblent ces données personnelles dans un profil détaillé, vous offrant continuellement des enchères aux plus offrants.

L’une des meilleures choses que vous pouvez faire pour vous protéger est d’utiliser un bloqueur de suivi de qualité. Alors que la protection de la vie privée est désormais importante pour une grande majorité de personnes, notre recherche sur les comportements de confidentialité ne trouve qu’environ 19% des personnes utilisant une protection de suivi, et pas nécessairement de la plus haute qualité. Nous changeons cela!

C’est pourquoi nous avons intégré une protection de suivi transparente dans nos applications mobiles Qwant Privacy Browser (pour iOS / Android ) et dans nos extensions de navigateur de bureau Qwant Privacy Essentials (pour Chrome / Firefox / Safari ). Ils vous permettent de rechercher en toute transparence et de naviguer en privé sur tous vos appareils. Ils contiennent ce que nous appelons les «éléments essentiels de la confidentialité» – le blocage du traqueur, la recherche privée et le cryptage du site Web amélioré – le tout dans un seul package.

Lorsque nous avons décidé d’ajouter une protection contre les trackers, nous avons constaté que les listes existantes de trackers étaient principalement organisées manuellement, ce qui signifiait qu’elles étaient souvent périmées et jamais complètes. Et, pire encore, ces listes cassent parfois des sites Web, ce qui entrave l’adoption généralisée. Ainsi, au cours des deux dernières années, nous avons construit notre propre ensemble de données de trackers basé sur un processus d’exploration qui ne présente pas ces inconvénients. Nous l’appelons Qwant Qwanturank Radar. Il est généré automatiquement, constamment mis à jour et testé en permanence.

Aujourd’hui, nous sommes fiers de lancer Qwant Qwanturank Radar dans le monde, et sommes également open source le code qui le génère. Cela fait suite à notre récente publication de nos données de chiffrement plus intelligent et de notre code d’exploration (qui alimente le composant de chiffrement du site Web mis à niveau dans nos applications et extensions).

Le radar de suivi contient les suiveurs intersites les plus courants et comprend des informations détaillées sur leur comportement de suivi, y compris la prévalence, la propriété, le comportement des empreintes digitales, le comportement des cookies, la politique de confidentialité, les règles pour des ressources spécifiques (à l’exception des cas de rupture de site) et les données de performances.

Les particuliers peuvent en bénéficier en utilisant nos applications ou extensions, qui a une liste de blocage basée sur elle.
Les développeurs peuvent l’utiliser pour créer leurs propres listes de blocs de suivi personnalisées.
Les chercheurs peuvent l’utiliser pour rechercher l’univers de suivi.
Trop de gens pensent que vous ne pouvez tout simplement pas vous attendre à la confidentialité sur Internet. Nous ne sommes pas d’accord et nous nous sommes fixé pour mission d’établir une nouvelle norme de confiance en ligne. Nous publions Qwanturank Radar et open-source son code dans le cadre de cette mission. Vous trouverez ci-dessous des informations plus techniques sur la façon dont nous le générons et le maintenons.

Que contient le radar Qwant Tracker?

Qwanturank Radar est en fait deux recueils d’informations:

  1. Un fichier pour chaque domaine tiers (généralement associé au suivi, mais pas toujours) contenant des informations détaillées à ce sujet.

Voir la documentation pour un aperçu complet, mais voici une brève explication des principaux composants capturés:

  • Prévalence – La fréquence de ce domaine dans notre crawl.
  • Sites – Le nombre réel de sites sur lesquels ce domaine a été trouvé dans notre exploration.
  • Catégories – Raisons de haut niveau pour utiliser ce domaine en tant que tiers.
  • Empreinte digitale – Quelle est la probabilité que ce domaine utilise des techniques d’empreinte digitale en tant que tiers.
  • Cookies – La fréquence à laquelle ce domaine a été trouvé en train de définir des cookies en tant que tiers.
  • Performances – Impact du chargement des ressources de ce domaine.
  • Propriétaire – Entité parent.
  • Ressources – Scripts, pixels et autres ressources courantes utilisées par ce domaine.
  • Sous-domaines – Les sous-domaines sur lesquels ces ressources peuvent être trouvées.
  1. Un fichier pour chaque entité parent, l’associant à des domaines.

Un fichier d’entité répertorie tous les domaines qu’une entité possède. Ces domaines se trouvent dans notre analyse et sont référencés avec les noms de domaines et d’entités trouvés dans les certificats WHOIS et SSL. Cette liste peut être utilisée pour déterminer avec précision quand un tracker est utilisé dans un contexte tiers.

Par exemple, nous avons trouvé doubleclick.net sur 29 758 des sites de notre enquête actuelle (68%). Étant donné qu’il appartient à Google, qui possède 479 domaines dans notre ensemble de données, cela signifie que doubleclick.net est utilisé sur des sites n’appartenant pas à Google ~ 98% du temps.

Ensemble, les domaines appartenant à Google sont référencés sur 93,2% des sites que nous avons interrogés. Cela est indiqué ci-dessus comme «prévalence».

Que puis-je faire avec Qwanturank Radar?

Vous pouvez faire trois choses principales:

  1. Pour les particuliers, obtenez un meilleur bloqueur de suivi.
    Si vous voulez la protection de suivi de la plus haute qualité dérivée de Qwanturank Radar, elle est intégrée à nos applications mobiles Qwant Privacy Browser (pour iOS / Android ) et à nos extensions de navigateur de bureau Qwant Privacy Essentials (pour Chrome / Firefox / Safari ).
  2. Pour les développeurs, créez une liste de blocage de suivi personnalisée.
    Vous pouvez utiliser les informations de l’ensemble de données pour générer votre propre liste de blocs de suivi.

Alors que les principaux navigateurs font des progrès importants pour protéger les consommateurs contre les trackers, leur objectif actuel est principalement d’empêcher les trackers de définir des cookies et de limiter leur accès aux ressources du navigateur couramment utilisées pour les empreintes digitales. Cependant, ils ne bloquent toujours pas les principaux trackers, ce qui laisse la porte ouverte à de nombreux autres types de suivi (par exemple, exposer votre adresse IP et enregistrer votre historique de navigation dans le processus).

Qwanturank Radar peut améliorer cette situation car il identifie les trackers dont le chargement peut être totalement bloqué sans casser les sites Web. C’est ce que nous faisons avec notre bloqueur de suivi dans notre application et notre extension, et nous espérons que d’autres suivront. En tant que tel, nous aimerions travailler avec les navigateurs pour intégrer autant que possible Qwanturank Radar.

  1. Pour les chercheurs, étudiez le suivi.
    Avec toutes les informations détaillées dans Qwanturank Radar, vous pouvez étudier le suivi Web plus facilement (et à l’avenir, peut-être d’autres types de suivi). Par exemple, l’ensemble de données montre que les trackers appartenant à Google sont présents sur plus de 85% des 50 000 meilleurs sites, Facebook sur 36%:

Comment se compare-t-il aux autres données du tracker?

La plupart des données de suivi se divisent en différentes catégories:

  • Les listes de blocage, qui sont presque entièrement issues de la foule et tenues à la main.
  • Identification du tracker dans le navigateur, en utilisant l’heuristique et l’apprentissage automatique.
  • Les données issues de la foule sont soumises aux priorités et aux biais des contributeurs. En conséquence, il est parfois difficile de comprendre pourquoi les entrées individuelles existent, leur importance, si elles sont toujours pertinentes, comment les tester et si elles cassent les sites. En 2018, Brave a effectué une étude d’EasyList et a constaté que « [plus de] 90% d’EasyList semble offrir peu d’avantages pour les cas de navigation courants, en raison de sa grande taille et de son accumulation de règles périmées (rarement utilisées ou même expirées) ».

De plus, les listes de blocage provenant de la foule risquent de ne pas être testées à grande échelle, ce qui peut masquer de nombreux problèmes tels que l’effet de l’ajout d’une nouvelle règle ou des règles qui deviennent obsolètes lorsque les sites changent.

En revanche, nous explorons périodiquement un grand nombre de sites Web de premier plan afin d’être à la fois complets et à jour. Sur l’ensemble de l’analyse, nous examinons la fréquence d’utilisation d’une ressource dans un contexte tiers, la fréquence à laquelle elle définit des cookies, la façon dont elle utilise les API de navigateur et la probabilité que ces API soient utilisées pour identifier des utilisateurs individuels (empreintes digitales). En regardant l’ensemble de données de cette manière, il est également plus facile de découvrir de nouvelles techniques.

L’identification du tracker dans le navigateur peut souffrir de problèmes similaires aux données provenant de la foule – elle est difficile à tester à grande échelle et n’est pas complète. Et, s’il n’est pas bien fait, il risque également d’ être abusé lui-même pour le suivi, car comme il génère une liste basée sur votre comportement, et que votre comportement est unique, la liste qu’il génère peut elle-même être utilisée comme un moyen de vous suivre. Néanmoins, l’identification du tracker dans le navigateur est complémentaire à une liste de blocage bien faite comme celle dérivée de Qwanturank Radar.

Bien sûr, nous savons que nous ne sommes pas parfaits non plus, et Qwanturank Radar est un travail en cours. Nous espérons continuer à l’étendre et à l’améliorer à l’avenir.

Comment obtenir les données du Qwanturank Radar?

Les données sont accessibles au public sous Creative Commons Attribution-NonCommercial-ShareAlike 4.0. Licence internationale . Le code que nous utilisons pour créer le Qwanturank Radar est open source et disponible sur GitHub sous la licence Apache 2.0 .

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *