Quatre & Trois

Web, logiciels, langue française et divers.

samedi, 9 mars, 2013, 10:11

Comment Google détermine l'ordre des résultats

Nous allons voir dans cet article les enjeux relatifs au référencement des sites internet sur les moteurs de recherche. Comment Google détermine le classement des sites et des pages référencés lors d'une recherche ? Google peut-il dé-référencer un site web ? Ces deux questions seront traitées dans cet article et l’on verra ensuite comment il est possible d’agir sur ce référencement.

1. Classement de Google

Le moteur de recherche Yahoo! a été créé en 1994, quatre ans après c’est au tour de Google. Pourquoi Yahoo! se retrouve maintenant avec moins de 2 % des parts de marché et Google plus de 90 % ? L’explication principale pour moi c’est Pagerank dont le brevet a été déposé en 1998[1].

Amendé plusieurs fois, ce brevet tombera dans le domaine public en 2017 mais la licence d’utilisation est déjà accessible depuis 2001. Pagerank c’est justement l’algorithme qui détermine comment classer les sites-web dans les résultats, en attribuant pour chaque page une note rank. Là où les autres moteurs de recherche comme Yahoo! classaient les résultats principalement par le nombre d’occurrences d'un mot-clé dans les pages web, Google avec pagerank tente d'estimer la pertinence réelle de ces sites pour l'utilisateur. Car après tout le but d’un moteur de recherche c’est de trouver ce que l'on cherche et cela le plus rapidement possible, c’est-à-dire si possible dès le premier résultat. Voila comment le moteur de recherche Google a réussi à séduire un nombre croissant d’utilisateurs.

Que fait pagerank pour estimer cette pertinence ? Et bien cela est mathématiquement assez complexe puisque c’est la probabilité stationnaire d'une chaine de Markov, c'est-à-dire un vecteur de Perron-Frobenius de la matrice d'adjacence du graphe du Web. Pas très compréhensible mais tout à fait logique : pagerank classe les pages web des sites internet selon le nombre de liens qui redirigent vers ces pages. Ce classement est amélioré lorsque les pages qui possèdent un lien vers une autre sont elles-mêmes bien classées. C'est ce qui explique entre autres pourquoi les pages Wikipedia sont souvent très bien référencées sur Google. En effet de nombreux sites redirigent vers des pages Wikipedia, ce qui permet d’augmenter la pertinence estimée et donc le classement sur Google de ces pages Wikipedia.

2. L’intérêt pour les internautes devient intérêt pour les entreprises

Avant les années 2000 l’Internet n’était absolument pas ce qu’il est actuellement ; les sites d’e-commerce étaient quasi-inexistants, tout comme la possibilité de monétiser un site-web. L'impact du classement de Google était donc plus faible qu’actuellement. Maintenant, avec le développement de l’e-commerce et de la publicité en ligne, chaque visiteur représente une source potentielle de rémunération directe ou indirecte pour les sites. Le classement des sites dans Google est ainsi devenu de plus en plus important. La perte d'une place sur Google peut en effet représenter une perte de plusieurs milliers de visiteurs, d'autant plus si cela repousse le classement du site dans une autre page du moteur de recherche.

60 % des internautes ne consultent que la première page de résultats de Google, et un tiers d’entre eux ne cliquent que sur les 3 premiers liens[2].

importance classement google

3. La possibilité d'agir sur le classement

Puisque le classement des pages des sites sur les moteurs de recherche est devenu du plus en plus important et a fortiori lorsque l'on parle d'un site d'e-commerce, il a été rapidement question de savoir comment améliorer ce classement. Et il s'avère que cela est assez facile. Il y a la solution gratuite : le search engine optimisation et la solution payante : le search engine marketing. Le SEM sera évoqué dans un autre article, ici on se concentre sur la solution gratuite.

Puisque l'algorithme de classement des pages web de Google est connu – du moins partiellement – il a été aisé dans le passé d’améliorer considérablement le référencement d'un site. Cela passe principalement par la technique du nom de link building et consiste à constituer un nombre important de liens entrants backlinks, essentiels à un bon classement pagerank et in fine sur Google. Mais comment obtenir ce nombre conséquent de liens entrants et en un temps relativement court ? C'est dans ce contexte que les fermes de liens link farm ont vu le jour pour proposer une solution. Ces fermes de liens sont des sites internet sans réel contenu et ayant pour but unique de partager des liens entre sites pour augmenter leurs pagerank respectifs. C'était donc la solution gratuite et efficace pour augmenter le classement d'un site en seulement quelques jours.

4. La fin de la simplicité

Google a su réagir à ces pratiques associées au spam et considère dorénavant ce type de liens entrants comme non pertinents car non naturels. Cette pratique abusive de link building devient donc sans intérêt. C'est en 2011 puis 2012 que Google lance respectivement les algorithmes Panda et Penguin ayant pour but de mettre fin à ces pratiques. Pour cela Google applique des pénalités aux sites usant de ces pratiques de référencement abusives black-hat SEO. Ces pénalités consistent à moins bien référencer un site voire même le dé-référencer totalement du moteur de recherche, ce qui est une des pire situation qui peut arriver à un site de commerce sur internet.

Mais cela ne veut pas dire qu'il est actuellement impossible d'optimiser le référencement sur les moteurs de recherche. Il faut juste le faire avec plus de tact. Adieu donc les fermes de liens et bonjour aux méthodes plus douces white-hat SEO. Plusieurs de ces méthodes seront entrevues sur ce blog dans un prochain article : l'utilisation de communiqués de presse et les annuaires de qualité mais aussi les méthodes sur le fond d'un site et notamment son contenu.

Si vous souhaitez en savoir plus sur le pagerank de Google, webmaster-hub propose une explication plus complète mais plus technique.

Il ne faut pas oublier que le pagerank n'est qu'un outil parmi d'autres utilisé par Google pour classer les pages des sites internet dans les résultats des recherches.

Références

1. Brevet 6285999 déposé le 9 janvier 1998 par Lawrence Page
2. Google : arriver 1er par les mots clés, Pascal Maupas, Dunod 2012

2 commentaires

1. Le lundi, 29 juillet, 2013, 17:53 par mika

Une question que je me pose régulièrement. Quand est-ce que Google remet à jour ce fameux concept de Page Rank?

L'on dit que le P.R dépend du nombre de lien pointant vers une page de son site, soit. Un vérification est facile à effectuer via le Google Analytics, outil gratuit, et qui semble suivre le cours du temps, mais le PR ne semble pas du tout impacté !?

Bref, c'est vrai que pour les débutants dans le référencement, c'est quand même la mer à boire.

2. Le dimanche, 25 août, 2013, 17:09 par Sined

Le classement du Pagerank (de 0 à 10) est une échelle logarithmique, ainsi pour un site ayant un Pagerank faible, quelques backlinks vont rapidement faire progresser le PR de 0 à 2. Par contre pour passer d'un PR 8 à 9 il faudra au moins 1 million de liens en plus ! Cela peut expliquer le fait que, malgré de nouveaux liens retour, le PR n’évolue presque pas.