De la réciprocité du web

Le Web est basé sur l'échange de liens entre les différents sites web. Les moteurs de recherche exploitent cette particularité pour mettre en exergue les sites vers lesquels beaucoup d'autres sites font des liens. Mais actuellement plusieurs techniques faussent le jeu et remettent en cause ce principe de base.


Le principe des rétroliens (backlinks)

Quand un site web contient un lien hypertexte vers un autre site, on dit que ce dernier possède un rétrolien (ou backlink en anglais) depuis le premier site. Les rétroliens sont donc les liens provenant d'autres sites pointant vers le nôtre. C'est en partie sur cette notion de rétroliens que se basent les moteurs de recherche pour calculer la pertinence d'un site web. Théoriquement, plus le nombre de rétroliens est important, plus vous êtes considéré comme une référence sur Internet.

L'attribut rel="nofollow"

Tout allait dans le meilleur des mondes quand les moteurs de recherche en vogue s'appelaient Altavista, Lycos ou Yahoo!. Les pages web étaient maintenues par leur auteur respectif, les liens entre les sites étaient donc pertinents. Et puis est arrivé PHP avec sa simplicité de mise en oeuvre qui a permis de créer des sites enfin dynamiques où les visiteurs d'un site ont la possibilité d'agrémenter le contenu des pages du sites en faisant des commentaires par le biais de formulaires.

Hélas, c'est peu après que sont apparus les premiers robots spammeurs, capables de poster de faux commentaires remplis de liens vers des sites à la moralité douteuse. Ces liens permettent d'augmenter artificiellement le nombre de rétroliens que ces sites comportent. C'est donc de la bonne grosse triche pour avoir un meilleur référencement. Google, le moteur de recherche nouvellement leader, décide donc de réagir, et décide de prendre en compte une valeur non-standard d'un attribut de la balise HTML pour faire un lien.

<a href="http://url-suspecte.com" rel="nofollow">

Cet attribut indique aux robots indexeur qu'il ne faut pas considérer ce lien comme un rétrolien pour le site pointé. Désormais, la plupart des plate-formes des blog adopteront cette technique pour marquer tous les liens des commentaires en "nofollow", afin de décourager les commentaires Spam. Malheureusement, cela n'a pas eu l'effet escompté, et il fallut attendre l'arrivée de vraies solutions anti-spam pour endiguer le raz-de-marée.

Même Wikipédia utilise le "nofollow" pour les liens externes, ce qui anime un débat entre webmasters sur cette fameuse réciprocité du web. Si je fais un lien vers Wikipédia, ne suis-je pas en droit d'en attendre un en retour ? Ce n'est évidemment pas si simple, et si certains wemasters critiquent les fondements de Wikipédia qui ne serait pas capable de vérifier ses liens sortants, ce n'est que pour masquer une réalité bien plus pragmatique : à partir d'un certain poids sur Internet tu fais ce que tu veux de tes liens sortants, éthique web ou pas.

Pour voir l'étendue des dégâts, je vous propose un petit script pour faire apparaître les liens comportant l'attribut rel="nofollow", à installer via Greasemonkey dans Firefox, ou directement dans Chrome.

Les autres techniques de déréférencement

Comme si ces infractions aux règles de base du web n'était pas suffisant, il existe d'autres techniques pour empêcher les rétroliens, comme celui du faux lien interne. Par exemple, pour ses liens externes, Facebook utilise un script PHP interne qui se charge de rediriger l'utilisateur vers la bonne adresse Internet. En théorie, le lien est bien un lien externe, mais en pratique, les robots indexeurs ne voient que l'appel au script interne de Facebook, même pas besoin de l'attribut "nofollow". Pis, cela masque aux outils de statistiques la véritable provenance d'un utilisateur qui a cliqué sur un lien Facebook.

Ainsi, dans Google Analytics, toutes les personnes venant de Facebook semblent avoir cliqué sur un lien de l'énigmatique page "l.php" qui n'existe évidemment pas, il s'agit du fameux script de redirection vers un lien externe.

Autre arme du déréférencement, les sites permettant de raccourcir une URL trop longue, comme tinyurl.com ou plus récemment bit.ly, voire ix.lt ou is.gd. Ils masquent le nom du site de destination de ces liens, détournant un rétrolien de son destinataire légitime. Mais bon, la majeure partie des endroits où ils sont utilisés appliquent l'attribut nofollow sur tous les liens sortants, leur impact est donc assez faible.

Amusons-nous avec les rétroliens déréférencés : le Google Bombing

Le Google Bombing est une technique de référencement sauvage qui ne doit rien à des compétences en intrusion informatique, mais à l'utilisation des leviers de référencement existant.

Mettons que quelqu'un veuille que si les gens tapent "Le meilleur site du monde" dans Google, ils arrivent sur Le Refuge d'Aerie's Guard quand ils cliquent sur "J'ai de la chance". Cela revient à placer AG en première position des résultats de recherche pour ces termes. Pour cela, il y a plusieurs manières d'y arriver : soit il modifie AG pour que les termes "le meilleur site du monde" apparaissent dans les pages, dans les titres et dans les mots-clés cachés (les fameux champ "meta"wink, soit il demande à plusieurs sites amis de faire un rétrolienvers AG avec comme libellé du lien "Le meilleur site du monde". Comme il ne peut pas modifier le site du Refuge de fond en comble, c'est plutôt cette dernière technique qu'il va utiliser.

Le Google Bombing c'est exactement ça. Depuis ce week-end, quand on tape "trou du cul" dans Google et que l'on clique sur "J'ai de la chance", on tombe directement sur la page Facebook de Nicolas Sarkozy. Il a suffit pour ça de contacter directement ou indirectement plusieurs milliers d'internautes pour qu'ils ajoutent à leur site personnel des liens vers cette page s'intitulant "trou du cul". Etant donné que c'est Google qui est visé et qu'il prend en compte le "nofollow", il est du coup facile pour ces anonymes de le rester, car Google ne prendra pas en compte les rétroliens, même s'il prend en compte l'association des termes avec la page liée. Impossible de remonter simplement ces internautes qui suppriment de toute façon rapidement ces liens quand la farce a duré.

La politique du Refuge concernant les rétroliens

Si je vous parle de tout ça, c'est évidemment parce que je me suis posé la question : devrais-je moi aussi mettre ce fameux attribut rel="nofollow" sur les liens sortants du Refuge ? La réponse est bien évidemment non, pour plusieurs raisons :

  1. Il n'y a presque aucun spam à déplorer sur le Refuge, grâce à une architecture peu commune. Les plates-formes de blog/forum populaires sont des cibles beaucoup plus évidentes pour les spammeurs.
  2. Les commentaires anonymes sont désactivés, ce qui fait qu'on se connaît à peu près tous, je peux donc vous faire confiance sur les liens que vous postez dans vos commentaires et vos réponses, même si je ne suis pas forcément en accord avec leur contenu (n'est-ce pas superdjidane wink )
  3. Des outils existent pour savoir si un lien vers votre site a été marqué en "nofollow", je ne veux pas qu'on puisse voir apparaître notre site négativement dans ces outils.
  4. Au-delà des considérations philosophiques sur ce que doit être le web, je suis pour laisser faire la nature quand elle n'est pas maligne, voir 1. et 2.
  5. J'aurais la flemme de mettre le système en place. Quand on voit à quel rythme je mets à jour le Refuge, cette modification prendrait des mois à être mise en place.

Maintenant, vous le saurez, tous les liens externes du Refuge sont "en dur" et comptent bien pour un rétrolien supplémentaire vers le site lié. wink

Laissez un commentaire

10 Commentaires

  • Je plussoie, bonne initiative ! sourire

    Ah, le weub et ses dérives... razz

  • Merci pour cette explication c'était très intéressant. Je ne pense pas que ta décision soit mauvaise, en l'état actuel des choses j'aurai opté pour la même résolution.

    Ça tombe bien en fait puisque je pense que je vais rédiger pas mal de mini-présentation avec pas mal de liens sous peu. smile

  • En même temps, étant donné la relative dévalorisation des rétroliens (le Google Bombing est encore d'actualité), les moteurs de recherche ne se basent plus vraiment sur leur nombre pour évaluer la pertinence des sites web. L'analyse des termes qu'ils contiennent et la fréquence de mise à jour sont des éléments beaucoup plus pertinents.

    Je n'ai pas parlé du PageRank non plus, qui est une valeur de pertinence sur 10 attribuée par Google. Il paraît que si un site à fort PageRank fait un lien en dur vers un site à faible pertinence, cela augmente le PageRank du site lié tout en diminuant le PageRank du site de provenance. Mais bon, passer du temps à optimiser son site web pour être conforme à des rumeurs (car dans le domaine du référencement, le secret et la rumeur règnent), c'est moins de temps passé à rédiger des contenus pertinents.

    Encore une fois, j'ai fait mon choix. smile

  • J'ai un peu du mal à voir où est-ce que le "nofollow" est mal vu (même si l'exemple de Wiki est assez clair).

    En gros, ça pose problème question donnant-donnant entre deux sites ?

  • Bref, on met un lien vers un site dans l'espoir qu'il nous renvoie la balle et qu'on en profite tous les deux.

    Mais tout le monde met des nofollow pour éviter d'aider la concurrence, pour garder un bon référencement sur son site Internet seul !!

    Une bande d'égoïstes... razz

  • D'accord, donc effectivement, ça fait pas très joli d'en mettre sur le sien (rapport au point 3.)

  • Merci pour cette information intéressante je trouve smile

    Une question : Comment fonctionnent les Google Bombing ?

  • Le Google Bombing c'est une technique de référencement qui ne doit rien à des compétences en intrusion informatique, mais à l'utilisation des leviers de référencement existant.

    Mettons que tu veuilles que si les gens tapent "Le meilleur site du monde" dans Google, ils arrivent sur Le Refuge d'Aerie's Guard quand ils cliquent sur j'ai de la chance. Cela revient à placer AG en première position des résultats de recherche pour ces termes. Pour cela, il y a plusieurs manières d'y arriver : soit tu modifies AG pour que les termes "le meilleur site du monde" apparaissent dans les pages, dans les titres et dans les mots-clés cachés (les fameux champ "meta"wink, soit tu demandes à plusieurs sites amis de faire un rétrolienvers AG avec comme libellé du lien "Le meilleur site du monde". Comme tu ne peux pas modifier le site du Refuge de fond en comble, c'est plutôt cette dernière technique que tu vas utiliser.

    Le Google Bombing c'est exactement ça. Depuis ce week-end, quand tu tapes "trou du cul" dans Google et que tu cliques sur "J'ai de la chance", tu tombes directement sur la page Facebook de Nicolas Sarkozy. Il a suffit pour ça de contacter directement ou indirectement plusieurs milliers d'internautes pour qu'ils ajoutent à leur site personnel des liens vers cette page s'intitulant "trou du cul". Etant donné que c'est Google qui est visé et qu'il prend en compte le "nofollow", il est du coup facile pour ces anonymes de le rester, car Google ne prendra pas en compte les rétroliens, même s'il prend en compte l'association des termes avec la page liée. Impossible de remonter simplement à ces internautes qui suppriment de toute façon rapidement ces liens quand la farce a duré.

  • Exemple : Tape Trou du Cul sur Google, et clique sur j'ai de la chance.

  • Oui, je savais déjà pour Trou du cul avant de poser la question. C'est pour ça que j'ai demandé sur ce sujet.

Laissez un commentaire

Vous devez être connecté pour commenter sur le Refuge. Identifiez-vous maintenant ou inscrivez-vous !


Marre des pubs ? Inscrivez-vous !

Tags