Page 404 : Est-ce que Google suit les liens ?

le 01 Fév 2015
4 min de lecture
Page 404 : Est-ce que Google suit les liens ?

404 error of not found

Existe-il un seul site qui ne présente aucune erreur 404 ? Hum, pas à notre connaissance. Les bonnes pratiques recommandent l’utilisation d’une page d’erreur 404 personnalisée.

Google conseille notamment de créer des pages d’erreur 404 utiles pour inciter les visiteurs à rester sur votre site et les aider à trouver les informations qu’ils recherchent :

404 google

La recommandation officielle de Google concernant les pages 404 personnalisées (source)

La saviez-vous, Google propose même un widget d’amélioration des pages 404 pour ajouter une zone de recherche à votre page 404 personnalisée !

Certains sites redoublent d’imagination pour nous proposer de magnifiques pages 404, quelques beaux exemples sont recensés sur bonjour404.fr ou sur 404notfound.fr. Cela peut-même être l’occasion de dynamiser votre linkbaiting comme le raconte Romain Brasier.

Google crawle plusieurs dizaines de milliards de pages web chaque jour !

Compte-tenu de l’appétit sans fin de GoogleBot, nous pourrions penser que Google va aller crawler les liens présents dans ce type de page.

Par exemple, on sait que Google Webmaster Tools peut parfois remonter des erreurs 404 inattendues dans les erreurs d’exploration. Cela est lié au fait que GoogleBot va tester des liens dans du JavaScript, des fichiers Flash ou dans d’autres contenus intégrés.

Par exemple, pour le cas ci-dessous, Google peut tenter d’explorer l’URL http://www.example.com/télécharger-bonjour, même s’il ne s’agit pas d’une vraie page et qu’elle renverra un 404 :

<a href="bonjour.pdf" onClick="_gaq.push(['_trackPageview','/télécharger-bonjour']);">PDF Bonjour</a>

Liens des pages 404, qu’en dit Google ?

En 2008…

En 2008, les équipes de Google publiaient un billet de blog dans lequel ils indiquaient pouvoir suivre les liens d’une 404 si cela pouvait leur être utile pour mieux comprendre le site :

"Do you index content or follow links from a page with a 404 response code?"

« Do you index content or follow links from a page with a 404 response code? » (source)

En 2015…

Plus récemment (le 18 janvier 2015), John Mueller indiquait sur Twitter que Google ignorait tout ce qu’il trouvait sur une page répondant en 404 ou 410 (Gone) :

john mueller 404

La réponse de John Mueller à la question « Est-ce que les liens des pages 404 ou 410 transmettent du jus ? »

Voilà un bel exemple de communication floue de la part de Google.

Mais qu’en est-il aujourd’hui pour les liens dans une page 404 ?

Pour être fixé, nous avons effectué quelques tests visant à analyser le comportement de Google vis à vis des liens présents dans une page répondant avec un code d’erreur 404.

Attention, il s’agit bien ici d’une page avec un code réponse en « 404 Not Found » renvoyé par le serveur, à ne pas confondre avec une soft 404 ou une 410.

Résultat du 1er test

Pour ce premier test, nous avons créé volontairement une page 404 que nous avons maillée depuis la page d’accueil (à ne pas reproduire à la maison, , ce test est réalisé par des professionnels entraînés !). Cette page 404 présentait un lien texte classique vers une page répondant en 200, nouvellement créé et maillée depuis nulle par ailleurs.

Résultat : Après plusieurs semaines d’attente, Google s’est finalement décidé à crawler et à indexer la page test. John Mueller ne nous dirait pas tout ?

Test de lien vers une page depuis une 404

Test de lien vers une page depuis une 404

Résultat du 2ème test

Pour ne pas tirer de conclusions trop hâtives, nous avons renouvelé l’expérience sur notre blog (oui, on aime prendre des risques !).

Particularité de ce 2ème test, le lien a été fait sur une image.

2nd test pour analyse le comportement de Google face aux liens d'une page 404

Google 404 netlinking

Résultat : Cela a pris du temps (au moins un mois) mais la page maillée s’est finalement retrouvée dans l’index du moteur.

Conclusion : Google suit les liens présents dans une page 404, mais…

Contrairement à ce qu’à pu affirmer récemment John Mueller sur Twitter, Google semble bien suivre les liens que l’on peut retrouver dans les pages 404, même si le délai d’indexation fut très long.

Il est toutefois possible que la popularité transmise soit faible voire nulle et que Google ne se serve de ces contenus que dans une démarche d’identification de nouvelles URLs…

Bien entendu, il est également possible que Google ait indexé ces pages par d’autres biais, c’est pour cela que nous aimerions savoir si vous avez déjà observé la même chose. N’hésitez pas à nous partager votre expérience !

Edit 03/02:

Résultat du 3ème test:

Par acquis de conscience, un 3ème test a été effectué en parallèle: page crée sur WordPress et liée depuis la 404 personnalisée, avec une ancre de lien dont nous seuls avons le secret (quelque chose du genre « zerdifpotremolichan »).

Nous avons constaté via les logs que Google a mis 5 jours avant de crawler la page. Et pour répondre aux questions de certains:

– Aucune commande site:, info:, cache:  ou autre n’a été effectuée

– Page absente du sitemap.xml

– Page qui n’a jamais été ouverte dans un navigateur (surtout pas Chrome // Don’t be evil)

La page liée depuis la 404 via notre ancre tordue « zerdifpotremolichan » est bien indexée, mais elle ne remonte pas sur l’ancre: pas de transfert de sémantique donc via les 404, et donc a priori pas de popularité !

Vous avez un projet ?

Vous aimerez aussi

Pourquoi et comment challenger vos parcours de navigation ?

Pourquoi et comment challenger vos parcours de navigation ?

Webanalytics

Ca y est vous avez réussi ! Grâce à votre stratégie d’acquisition pointue et vos efforts de longue haleine, votre trafic [...]
Google leak – Part 5 : Clic-tature : quand l’Empire Google vous observe

Google leak – Part 5 : Clic-tature : quand l’Empire Google vous observe

SEO

Google traque tout ce que vous faites dans ses pages de résultats Et c’est une évidence déjà bien connue  La [...]

Nos expertises

EXP ERT ISES