En matière de SEO, Google instaure un certain niveau de qualité que chaque contenu doit atteindre pour rejoindre l’index principal. Les contenus qui dépassent ce niveau de manière plus ou moins significative ont de meilleures chances d’accéder à l’index primaire et gagner ainsi un positionnement beaucoup plus élevé.
Cet article nous explique le principe du seuil de qualité et nous présente les méthodes les plus efficaces pour l’exploiter.
Un concept à l’utilisation incertaine par l’algorithme de recherche de Google
Bill Slawski, expert du SEO, aujourd’hui disparu, a été le premier à évoquer les index primaires et secondaires de Google et à développer le concept de « seuil de qualité ».
Grâce à un système de « score », le moteur peut crawler et classer les pages web plus efficacement et dans un délai réduit.
- En dessous d’un certain score, la page n’est pas indexée.
- Si en revanche, elle dépasse le minimum fixé, elle obtient son positionnement sur la requête.
L’existence et le fonctionnement de ce seuil de qualité sont d’autant moins bien connus qu’aucune preuve tangible à ce sujet n’est disponible. Bien que la firme de Mountain View ait déposé le brevet Site Quality Score en 2012, rien n’indique formellement que ce paramètre soit intégré à son algorithme de recherche ni qu’elle soit quantifiable.
De nombreux professionnels du SEO jugent d’ailleurs « peu probable » l’apparition d’une métrique de qualité dans la Search Console. Pour eux, le risque d’abus représente un frein majeur à une telle possibilité.
Un fonctionnement complexe reposant sur un système de cluster
Selon Koray Tuğberk Gübür, un autre expert SEO, Google s’appuie sur la thématique pour catégoriser et regrouper les requêtes et les documents dans un « cluster ». Par la suite, à chaque utilisation d’une requête appartenant à un cluster, les documents y sont automatiquement stockés. Il précise que l’ordre de positionnement des documents de l’index principal dans un cluster donné est défini selon trois paramètres relatifs à la requête :
- son sujet,
- son élément central,
- son objet.
Le moteur définit différents seuils de qualité pour les formats de noms, de verbes, d’adjectifs et autres familles de mots. Ainsi, en fonction de la formulation des requêtes, les résultats du référencement naturel de Google sont adaptés pour apporter la meilleure réponse à l’internaute. Le niveau du seuil de qualité est proportionnel au nombre de contenus similaires compris dans un même cluster.
Koray Tuğberk Gübür ajoute que « dans le cas d’un petit cluster, synonyme de faiblesse du seuil de qualité, Google privilégie les sources associées à un haut PageRank, même si les pages ne répondent pas précisément à une requête donnée, mais sont seulement pertinentes par rapport au sujet général ».
Concrètement, cela signifie qu’en l’absence de contenu expert pour une requête spécifique, le premier résultat affiché par le moteur bénéficiera d’un Trust (confiance) important. D’après Fabien Raquidel, consultant SEO, « ce principe explique la position en tête de nombreux sites de médias sur un large éventail de requêtes ». Les imperfections des contenus sont compensées par la confiance que Google accorde au site, et qui rassure les internautes, car ils satisfont au seuil de qualité, limitant le risque.
Des améliorations possibles sur la base de critères variés
Améliorer le classement d’un site pour atteindre le seuil de qualité est possible, en tenant compte, d’une part de l’intentionnalité et d’autre part, du type de sujet. En effet, les thématiques ayant un impact fort sur le quotidien des utilisateurs (santé, finances, épargne, etc.) sont généralement associées à des critères EAT (expertise, autorité et fiabilité), tandis que les sujets moins sérieux, la popularité peut être privilégiée à d’autres critères.
Différentes méthodes peuvent être mises en œuvre :
- L’étude des similarités entre les sites des concurrents positionnés en tête pour une requête ou un groupe de requêtes.
- L’analyse des SERP sur une thématique afin d’obtenir, grâce à un algorithme de machine learning (XGBoost, Random Forest…), des prédictions sur les critères les plus pertinents à utiliser pour gagner un bon positionnement sur ledit sujet. La plateforme de datascience Dataiku permet d’automatiser ce process.
Toutefois, ces méthodes restent complexes pour les personnes qui ne disposent que de peu de ressources. En outre, les résultats fluctuent, le seuil de qualité de Google étant lui-même très variable.
Enfin, pour compléter cette liste des préconisations, on peut rajouter :
- Intégrer le maximum de détails dans les contenus, y compris les détails absents des requêtes et des contenus des concurrents.
- Se conformer aux règles EAT.
- Proposer un texte bien structuré, cohérent, informatif, bien écrit, avec des phrases courtes.
- Communiquer des sources faisant autorité dans le domaine.