Du spam chez les proxies web ? Le cas Appspot !

le 28 Sep 2011
2 min de lecture
Du spam chez les proxies web ? Le cas Appspot !

Suite à l’article de Paul Sanches sur Don’t be evil concernant le Google Washing de sites par des proxies hébergés chez Appspot.com, qui appartient à Google, nous avons fait tourner des outils internes qui ont sorti quelques résultats interessants.

Tout d’abord, concernant les types de requêtes Françaises sur lesquelles Appspot.com se positionne : il apparait que le site ne remonte pas sur de grosses requêtes génériques, mais sur un grand nombre de requêtes long tail. Du coup, si le site est classé en 3 124eme position en terme de nombre de mots clés sur Google.fr, il n’est en revanche qu’en position 6 122 en matière de « Score de positionnement », un indicateur maison basé sur les positions et la concurrentialité des requêtes.

evolution visibilité google appspot
Nous pouvons d’ailleurs constater que le potentiel du site en matière de ranking se situe principalement en page 2 des résultats de Google :

Répartition ranking

Nos analyses ont également montré que les positions de ce domaine sont extremement mouvantes d’une période à l’autre. Il semble que de nouveaux proxies gagnent rapidement en visibilité à leur lancement, puis retombent ensuite rapidement. Peut être suite à une intervention de l’équipe anti spam de Google ?

Là où ça commence à devenir rigolo, c’est lorsque l’on analyse la visibilité par sous domaine, c’est à dire par application hébergée sur ce service. Nous avons détecté 434 sous domaines ayant un minimum de visibilité sur Google FR. Et quelques perles parmi les plus puissants, dont voici le top dix :

Sous domaines proxies appspot.com

La palme revient incontestablement au premier de la liste : wikien4.appspot.com qui reprend l’intégralité de Wikipedia, en remplaçant chaque lettre ‘l’ minuscule en ‘w’ et ‘th’ en ‘d’ !
Ainsi par exemple William Kempe devient Wiwwiam Kempe, un acteur de tewevision 🙂

Et Google a l’air d’aimer cela, un signe qu’il ne faut pas forcément aller chercher bien loin pour passer outres les filtres anti duplication 😉

Vous avez un projet ?

Vous aimerez aussi

Google ouvre une nouvelle voie au sujet des cookies tiers sur Chrome

Google ouvre une nouvelle voie au sujet des cookies tiers sur Chrome

Webanalytics

Et si les cookies tiers demeuraient sur Chrome ? Google a subtilement émis l’hypothèse le 22 juillet 2024 lors d’une [...]
Google leak – Part 4 : du machine learning à tous les étages

Google leak – Part 4 : du machine learning à tous les étages

SEO

Jusqu’en 2013, avec l’invention de Word2vec par Google, et le déploiement de Hummingbird, le premier vrai dispositif de query expansion, [...]