Référencement naturel Search Marketing — 28 octobre 2014 — 4 commentaires
Référencement : Les gagnants et les perdants de Google Penguin 3

Ce nouveau Google penguin était très attendu car cela fait plus d’un an qu’il n’y avait pas eu de mise à jour du filtre qui pénalise la suroptimisation et les mauvais profils de liens externes. Après de multiples annonces et rumeurs sur sa sortie imminente, il est finalement sorti le 18 octobre et ses effets vont continuer dans les jours qui viennent. Finalement il ne s’agissait que d’un rafraîchissement de l’ancien filtre plutôt que d’une réelle mise à jour comme attendue. Ceci dit, certains sites ont gagnés en positions et d’autres en ont perdus. C’est donc une bonne raison de faire un bilan sur l’évolution de cet algorithme et sur les efforts à faire de la part de google pour l’améliorer…

Dans un premier temps, on va regarder un top 10 des sites ayant le plus perdu ou le plus gagné de positions entre le 16 octobre et le 23 octobre, soit pile avant et après google penguin. Ne travaillant pas chez Google, c’est le seul moyen à disposition pour connaitre les sites touchés, il est donc possible que d’autres événements coïncident avec ces chutes brutales ou gains de positions. j’ai donc volontairement restreint la liste à un top 10 afin que les différences soient nettes et sans contestations, sauf grosse coîncidence.

Ensuite, j’ai comparé le profil de liens entre le premier gagnant et le premier perdant, afin d’en savoir un peu plus sur le seuil de tolérance de google et ce qu’il laisse encore passer.

C’est quoi Penguin déja ?

Comme Google Panda, Google Penguin vise à récompenser les sites de bonne qualité et à déclasser les sites de moins bonne qualité. Préserver la pertinence de ses résultats reste une top priorité pour Google. Tandis que Panda s’intéresse surtout à la qualité du contenu, Google penguin pénalise essentiellement les liens externes et ses mauvaises pratiques.

De nombreux sites ont abusé de l’importance de ce critère pour spammer les résultats de google en inscrivant leur site en masse sur des sites externes, annuaires, réseaux de sites, communiqués de presse, échange de liens, …  Le linking externe fait encore parti des critères les plus importants dans l’algorithme de google, mais son poids est bien plus qualititatif que quantitatif aujourd’hui et depuis quelques années déjà.

Pour le filtre Penguin, google analyse le profil de liens externes associé à un site en relation avec les profils de liens des autres sites du même secteur d’activité, les concurrents. L’objectif de cette analyse est de voir si le profil de liens est naturel en relation avec son environnement concurrentiel :

  • Ratio liens follow / nofollow ;
  • Ratio liens vers la page d’accueil / liens vers des pages profondes ;
  • Diversité et qualité des domaines entrants ;
  • Géolocalisation des domaines entrants ;
  • Thématique des liens ;
  • Ancres de liens ;
  • etc…

Après les Top 10, on va justement comparer certains de ces critères entre le grand gagnant et le grand perdant de ce google penguin.

Top 10 des perdants

perdants-google-penguin

Des sites X et des sites de streaming, ça reflète un peu les habitudes de navigation des ados 😉 .

Top 10 des gagnants

gagnants-google-penguin

Des sites comme ladepeche.fr, automobile.fr ou capital.fr se sont fait pénaliser en octobre 2013 lors de penguin 2.1 et ils ont récupéré leurs positions en étant dépénalisés sur ce dernier penguin en date. C’est un soulagement pour ces sites du top 10 car il aura fallu attendre plus d’un an avant de retrouver un trafic correct. Regardez cet exemple sur automobile.fr :

depenalisation-automobile

Pour les autres sites, on retrouve encore des sites de streaming. Google ne va pas non plus supprimer tous les sites de streaming, il en faut pour tous les gôuts et la baisse des uns profite aux autres. Pourtant ces sites utilisent pour la plupart des techniques SEO très agressives. C’est d’ailleurs pour ça que Google compare le profil de liens d’un site par rapport à son univers concurrentiel. L’univers du streaming étant très « spammy », les exigences de penguin sur ce type de sites sont bien sûr moindres.

Comparaison entre sites touchés par penguin

Ça tombe bien, les premiers des tops 10 gagnants et perdants sont deux sites de streaming. Je vais donc pouvoir comparer certains critères de google penguin sur cet univers.

Liens profonds et liens vers la page d’accueil

liens-profonds-et-accueil

On constate que le site pénalisé, full-streaming.org, a plus de liens vers des pages profondes que vers la page d’accueil et ce ratio est supérieur à celui de streamcomplet. Effectivement, en général, un site reçoit naturellement plus de liens vers sa page d’accueil que vers des pages plus profondes. Un site avec un profil de liens trop déséquilibré sera vu comme suspect.

Liens follow et nofollow

liens-follow-nofollow

On regarde ici la répartition des liens nofollow et follow. Le site pénalisé reçoit 60% de liens follow, plus que le site dépénalisé. Autant de liens follow peux signifier  une tentative d’augmenter artificiellement le nombre de liens vers son site. Dans ce cas, google considèrerait qu’au dessus de 60 % de liens follow, le site rentre dans le radar de google penguin.

Diversité des domaines

domaines-entrants-full-streaming

domaines-entrants-streamcomplet

Le site pénalisé reçoit beaucoup de liens depuis des annuaires contrairement au premier site gagnant, Stream-complet . De plus, ce dernier a une plus grande diversité de domaines entrants. Je ne vais pas non plus dire que tous ses liens sont très propres, bien au contraire, mais sa stratégie de liens externes est plus subtile. On voit par exemple que le site a envahi un site sur les colibris, site qui a laissé ses commentaires ouverts à n’importe qui et n’importe quoi. D’ailleurs, il est pas exclu qu’à la prochaine mise à jour de penguin prévue dans quelques mois, le site en question se fasse pénaliser. Le prochain penguin devrait logiquement revoir ses critères à la hausse et cette fois ça risque de pas passer.

Conclusion

Ce n’était qu’un aperçu de quelques critères pris en compte par google penguin, mais force est de constater que Google penguin n’est pour l’instant pas encore assez fin pour nettoyer son index de tous les sites qui utilisent des techniques douteuses ou black hat. Le poids des liens externes étant important et l’aspect relatif des critères de penguin font que ce n’est pas chose facile pour google. Et que ce soit pour panda ou penguin, vaux mieux réaliser un audit de référencement afin de prévenir d’une pénalité ou en sortir. Rendez-vous au prochain penguin …

Articles similaires

Articles Recommandés



L'auteur

Serge Esteves

Dans le webmarketing depuis 2004, je me suis spécialisé dans le SEO chez l'annonceur puis en agence où j'ai travaillé pour quelques uns des plus gros sites français et internationaux. Spécialisé sur des méthodes avancées en référencement naturel et sur des sites à forte volumétrie, j'ai ouvert mon expertise sur d'autres leviers comme le SMO, l'expérience utilisateur et le content marketing. Je suis fondateur de Creapulse, agence SEO spécialisée dans les audits SEO avancés, les formations SEO, le consulting.

 


4 Commentaires

  1. Les comparaisons de sites sont vraiment intéressantes. Merci.

    • Merci Ricardo,
      La difficulté c’est de comparer ce qui est comparable, l’univers du streaming est assez particulier, les ratios sur du ecommerce par exemple auraient été différents, mais la démarche identique.

  2. Bonjour Serge, et merci pour cet article extrêmement intéressant.

    J’aurais une question toutefois juste d’ordre technique : les chiffres des tableaux comparatifs indiquant la « visibilité SEO » correspondent à quoi ?

    Merci 😉

    • Bonjour Valérie,

      La visibilité SEO correspond aux positions des mots clés sur les pages de résultats de google, positions qui sont pondérées en fonction du potentiel de recherche du mot clé. Par exemple, Un mot clé très générateur de trafic a position équivalente, aura un score de visibilité plus important.

      Ces données sont calculées par la société searchmetrics et ils se basent sur plusieurs millions de mots clés.

      De rien 🙂

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *