Simulateur de diffusion du PageRank gratuit en ligne
Simulation simplifiée, gratuite et illimitée de la diffusion du PageRank interne d’après le surfeur raisonnable
Pagerank interne perdu via le NoFollow :
Nombre de liens :
Meilleure page :
Pages orphelines :
Exercice : pour vous initier à ces concepts, générez une structure de base et essayez de maximiser le PageRank interne vers la landing page
Grâce à cette simulation, découvrez comment s’organise la diffusion du PageRank interne sur votre site web.
Pour commencer à l’utiliser, rien de plus simple :
- Rentrez le nom des pages sur lesquelles vous voulez simuler la diffusion du PR
- Précisez de quelle type de page il s’agit : contenu éditorial, page d’accueil, landing page… *
- Choisissez le mode de calcul (plus d’informations un peu plus loin)
- Etablissez des liens entre les pages pour voir l’impact de chaque lien selon sa position et ses attributs
* Attention, le type de page sert uniquement à y voir plus clair lors de vos tests. Google a peut-être un système qui pondère un lien suivant le type de page (ex un lien depuis page contact ou mentions légales a moins de poids) mais aujourd’hui aucune documentation et aucun test ne permet d’en être certain.
Pourquoi utiliser un simulateur de PageRank ?
Notez déjà que ce calculateur de PageRank gratuit n’est PAS une représentation exacte de la méthode de calcul du PageRank tel qu’utiliser aujourd’hui par Google.
Cependant il vous permettra de :
- Comprendre la diffusion du PageRank dans votre site, et in fine, maximiser l’efficacité de cette diffusion pour renforcer la visibilité des pages stratégiques.
- Optimiser les liens internes en vous donnant les clés pour réduire la perte d’autorité, tester différentes configurations dans le placement de vos liens, et prioriser vos pages stratégiques.
- Identifier les pertes de PageRank, renforcer le SEO thématique…
Comment sont calculées les scores ?
L’outil dispose de deux options :
- un calcul du PageRank pur c’est à dire dans sa formule originale (et un petit ajout sur les liens nofollow)
- une version plus proche du surfeur raisonnable qui considère la position des liens (version recommandée)
Comment sont calculées les scores ?
Ce calculateur de PageRank gratuit n’est PAS une représentation exacte de la méthode de calcul du PageRank.
Il dispose de deux options : un calcul du PageRank pur c’est à dire dans sa formule originale (et un petit ajout sur les liens nofollow) et une version plus proche du surfeur raisonnable qui considère la position des liens.
Le calcul du score via surfeur raisonnable
C’est la version la plus utile et actionnable du simulateur.
L’outil vous aide à :
- Construire meilleure vision de la diffusion du PageRank selon le type de lien et leur emplacement
- Comprendre la logique sous-jacente aux modèles utilisés à ce jour par Google
- Trouver les meilleures combinaisons pour pousser vos pages stratégiques
Cette section est là pour vous faire comprendre la logique derrière les choix techniques de ce simulateur.
Nous y verrons :
- le traitement des liens NoFollow,
- les liens obfusqués en JS
- le rôle de la position des liens.
Avant de rentrer dans les détails il faut absolument revenir au fonctionnement de ce simulateur et à ses spécificités.
Pour commencer on n’utilise pas ici la formule du PageRank telle que décrite dans les brevets initiaux.
A la place l’outil partir de la page n°1 comme s’il provenait d’un site web tier puis il va simuler 100 000 clics sur les liens présents en fonction de leur typologie (position et attribut).
A la fin des 100 000 clics chaque page aura été visitée un certain nombre de fois : c’est son score, son PageRank interne ou PRi.
Il n’y a pas de convergence vers un score fixe. Comme tout est une histoire de probabilités sur un nombre réduit de page il est possible que les scores affichés soient légèrement différent d’une simulation à l’autre.
C’est la répartition globale qui nous intéresse ici :
Simple non ?
Ok maintenant rentrons dans le choix des liens cliqués.
Les liens peuvent avoir 3 typologies :
- DoFollow ;
- NoFollow ;
- Obfusqué.
Ensuite, pour être plus proche du modèle du surfeur raisonnable un lien peut aussi avoir 4 positions différentes :
- Dans le menu du header ;
- Dans le footer ;
- Dans le contenu ;
- Dans une sidebar.
Rappel sur les liens DoFollow
- Lien par défaut quand aucun attribut n’est spécifié dans le HTML
- Passe le « jus de lien » SEO naturellement de page en page
- Code HTML standard :
<a href="https://thot-seo.fr">Ancre</a>
- Bref, c’est le lien classique.
Le cas des liens en NoFollow est un peu plus tricky que pour leur grand frère.
Dans notre simulateur, si notre surfeur pioche un lien NF on considère que le clic est perdu pour la page de destination et la perte de PageRank interne est quantifiée en haut.
Ce choix technique rend notre version est moins sévère que la réalité : lorsque le surfeur sélectionne un lien NF il va reprendre son crawl depuis la première page et d’une page au hasard dans l’immensité d’internet.
Les liens NoFollow : la grande méprise
Une blague courante consiste à dire que l’on repère les mauvais SEO en observant ceux qui mettent des liens internes en NoFollow.Pour comprendre le simulateur et ses partis pris, il faut revenir aux bases de ce que l’on sait / observe.
Cet attribut a été créé par Google en 2005 pour lutter contre le spam. L’attribut HTML est le suivant : <a href="https://exemple.com" rel="nofollow">Ancre</a>
Historiquement ce lien ne transmet pas directement le PageRank mais les choses se sont vite corsées.
Depuis 2019 : un lien NF est considéré comme un « hint » (indice) par Google. Autrement dit le moteur pourrait considérer ces liens (comment ?) dans des cas particuliers (lesquels ?).
Initialement, le rel= »nofollow » était utilisé comme outil pour diriger les crawlers et gérer la distribution du PageRank.
C’est le fameux pagerank sculpting.
Les SEO l’utilisaient pour concentrer le PRi sur les pages importantes en « bloquant » les liens vers les pages moins stratégiques.
MAIS Google a modifié son algorithme concernant le traitement des NoFollow.
Au lieu d’ignorer simplement ces liens dans le calcul du PageRank, le système compte désormais tous les liens dans la division du jus de lien, même ceux en nofollow.
Concrètement, avec 100 liens dont 20 en nofollow, chaque lien reçoit 1/100 de la valeur (contre 1/80 auparavant pour les liens dofollow), le « jus » des liens nofollow étant effectivement perdu.
Enfin il n’est pas exactement perdu, il téléporte le surfeur sur une page internet prise au hasard d’où il recommencera sa navigation.
Pour ceux qui ont suivi, en termes de conservation du PageRank faire un lien NoFollow bien pire que de faire un lien externe.
Un lien externe vers une page proche de notre thématique va vraisemblablement garder le surfeur dans une zone d’internet proche de nos pages augmentant la probabilité qu’il se retrouve de nouveau sous peu sur notre site.
A l’inverse un lien NoFollow l’envoi dans l’immensité de l’index Google et les chances qu’il retourne rapidement sur nos pages sont minimes.
Suite à l’annonce de Google concernant la prise en compte de tous les liens dans la division du link juice, certains webmasters se sont tournés vers l’obfuscation des liens comme alternative.
Cette technique vise principalement à :
- Masquer les liens « techniques » ou « administratifs / légaux » (mentions légales, CGV, contact, etc.)
- Contrôler plus finement le crawl des sites
- Augmenter le contrôle sur la distribution du PageRank interne
C’est aujourd’hui une technique qui fonctionne toujours mais avec une efficacité proportionnelle au nombre de pages du site.
Un site de 30 pages ne constatera probablement aucun effet en offusquant quelques pages.
Concrètement, dans notre simulateur de PageRank ces liens sont totalement ignorés. Ainsi comme vous le voyez sur l’image l’addition de tout le PRi affiché est bien de 1.
A l’inverse en NoFollow on perd une partie du PageRank :
Obfuscation
Il existe plusieurs méthodes d’obfuscation selon les objectifs.
- Encodage JavaScript (générer ou masquer l’URL via
onClick
ou un script). C’est moins recommandé car très faible en ressources pour Google pour comprendre l’effet d’un clic sur l’élément. - Encodage Base64 (ou autre) pour dissimuler l’URL en la décodant dynamiquement. C’est la méthode la plus efficace et la plus recommandable à mon sens. Pour une sécurité supplémentaire vous pouvez mettre le script de décodage dans un fichier externe et interdire l’exploration du fichier dans le robots.txt
- Redirections côté serveur (ex. via des scripts PHP ou .htaccess) pour cacher la cible initiale. C’est une sorte de cloaking “léger” pour afficher une URL propre/public sans exposer la cible réelle mais le PageRank sera envoyé.
- URL shorteners (services de raccourcissement) ils masquent l’URL finale mais le pagerank est quand même transmis avec probablement une perte au passage. Très peu d’intérêt en PR sculpting du coup mais pertinent dans des cas de tracking.
Cette méthode permet de canaliser le PageRank vers les pages souhaitées. Prenons un exemple un peu plus concret pour en illustrer l’impact.
Imaginons un site avec une page d’accueil, une page contact, une page blog et une landing page toutes accessibles dans le menu.
L’objectif est de pousser la landing dans la SERP via 4 articles éditoriaux. Ces pages de contenu sont accessibles depuis la page blog, toutes reliées entre elles et ont aussi un menu.
On a donc la structure suivante :
Maintenant si l’on obfusque les liens vers la page contact dans le menu du header, cette dernière ne reçoit plus aucun PageRank interne. Pour un bot c’est comme si on l’avait complètement retiré de l’architecture.
On peut ensuite essayer d’améliorer les choses en masquant par exemple les liens depuis les articles vers la page d’accueil et vers le blog.
Par simplicité on retire la page contact qui ne recevait plus aucun PR de toute façon.
L’évolution du modèle du surfeur
Le concept initial du PageRank reposait sur un modèle de « surfeur aléatoire » qui naviguait de page en page en cliquant sur des liens au hasard.
Depuis une page chaque lien envoyait automatiquement autant de link juice puisque chacun avait une probabilité égale d’être cliquée.
Quelle est la formule du PageRank ?
Partie un peu technique, vous pouvez la passer sans souci si vous n’êtes pas un mordu des maths.
La version initiale du PageRank est calculé de manière itérative selon la formule suivante :
PR(A) = (1-d) + d * (PR(T1)/C(T1) + PR(T2)/C(T2) + … + PR(Tn)/C(Tn))
Où :
- PR(A) est le PageRank de la page A
- d est le facteur d’amortissement (damping factor), généralement fixé à 0.85
- PR(Ti) est le PageRank des pages Ti qui pointent vers A
- C(Ti) est le nombre total de liens sortants de la page Ti
- (1-d) est la probabilité de téléportation aléatoire (random surfer)
En termes plus simples :
- Une page reçoit une part du PageRank de chaque page qui pointe vers elle
- Cette part est proportionnelle au PageRank de la page source divisé par son nombre total de liens sortants
- Le damping factor (0.85) représente la probabilité qu’un utilisateur continue à cliquer sur des liens
- Le (1-d) représente la probabilité qu’un utilisateur saute vers une page aléatoire
La formule est appliquée de manière itérative jusqu’à convergence, c’est-à-dire jusqu’à ce que les valeurs se stabilisent.
Forcément, la durée de calcul augmente avec le nombre de pages. Le temps nécessaire à Google pour opérer un calcul de PageRank à l’échelle de ses pages indexées serait d’environ 3 mois.
Cette approche simpliste a évolué vers un modèle de « surfeur raisonnable », plus proche du comportement réel des utilisateurs.
L’idée globale : les pages les plus importantes sont celles qui sont la plus grande probabilité d’être réellement visitées par un internautes.
Ce nouveau modèle introduit une pondération des liens en fonction de multiples facteurs et notamment leur position dans la page.
Mais ce n’est pas tout. Tout ce qui va augmenter ou diminuer la probabilité d’un clic sur un lien sera considéré
- leur contraste par rapport au reste du texte
- leur taille de police
- comment le lien est amené au sein du paragraphe
- …
Autrement dit un lien en rouge sur fond blanc au milieu d’un texte noir aura plus puissance potentielle à transmettre qu’un lien exactement similaire au reste du texte car il aura plus de de chance d’être cliqué.
De la même manière un lien contextuel, inséré naturellement dans le corps du texte, reçoit une pondération plus importante car il est considéré comme plus pertinent et plus susceptible d’être cliqué par un utilisateur réel.
À l’inverse, les liens situés dans les éléments de navigation (header, footer, sidebar) sont considérés comme moins significatifs car ils sont présents sur l’ensemble du site (sitewide) et moins contextuels.
Le PageRank thématique
En 2002, Taher Haveliwala de Google a révolutionné le concept du PageRank en introduisant le « Topic-sensitive PageRank ».
On retrouve son travail cité dans plusieurs brevets déposés par Google comme « User-sensitive ranking » et « Context-sensitive ranking«
Plutôt que de calculer une seule valeur de PageRank, l’algorithme calcule plusieurs scores en fonction des différentes thématiques auxquelles une page peut être associée.
Cette approche permet une évaluation beaucoup plus fine de la pertinence d’une page, car son importance n’est plus mesurée dans l’absolu mais relativement à des domaines thématiques spécifiques.
Par exemple, une page sur la cuisine aura différents scores de PageRank thématique pour les domaines de la gastronomie, de la nutrition, ou des arts ménagers.
Cette approche vectorielle permet une meilleure compréhension de la pertinence contextuelle d’une page et améliore significativement la précision des résultats de recherche.
Impact sur le référencement du PageRank thématique
L’introduction du PageRank thématique a profondément modifié les stratégies de référencement.
La valeur d’un lien (lien interne ou backlink) n’est plus uniquement déterminée par l’autorité globale de la page source, mais surtout par sa proximité thématique.
Un lien provenant d’un site de niche avec une autorité modérée mais thématiquement très proche peut avoir plus d’impact qu’un lien provenant d’un site très autoritaire mais sans rapport thématique.
Là ou des blast de liens sur tout type d’annuaire ou autre ferme à liens généraliste pouvait fonctionner, les référenceurs doivent désormais privilégier la pertinence thématique dans leurs stratégies d’acquisition de liens, plutôt que de se concentrer uniquement sur des métriques d’autorité génériques (CF, DA…).
Comment améliorer son maillage interne avec ThotSEO ?
Thot s’appuie sur un algorithme unique pour déterminer et calculer le glissement sémantique entre vos contenus.
En le connectant à Google Search Console vous avez également les meilleures suggestions d’ancres.
Lorsque vous lancez une analyse sémantique l’interface vous permet d’obtenir en 1 clic les meilleurs liens classés par glissement sémantique ainsi que les ancres de liens à utiliser.
Avec ces suggestions, vous maximisez le PageRank thématique transmis d’une page à l’autre.
Comment améliorer son maillage interne pour plusieurs pages ?
Si vous avez plusieurs contenus, il suffit de mener une analyse chacun et de les mettre dans un même groupe. Par exemple pour un site de nutrition je peux avoir les analyses :
- La maltodextrine convient-elle aux diabètiques ?
- whey pour boxeur
- Quels sont les bienfaits de la maltodextrine ?
- Maltodextrine ou dextrose pour le sport ?
- …
Ensuite dans la page maillage interne j’obtiens pour ce groupe d’analyse un tableau récapitulant le niveau de glissement sémantique entre les sujets :
« Après avoir testé plusieurs outils, Thot est le plus clair et le plus simple d’utilisation.
L’interface est très intuitive et l’utilisation assez ludique grâces aux couleurs.
Petit coup de coeur pour les suggestions de maillage interne ultra pertinentes ! »
Clara Mongellaz
Copywriter, + de 100 articles à son actif sur Thot