SEO: Google PageRank

Publié le 11 October 2007, par Babozor

A voilà un sujet qui risque d’en intéresser plus d’un… (d’autres risquent de décrocher, mais bon!)
Pour faire simple, le PageRank est un indice de 0 à 10 que Google donne à une page pour pouvoir la classer.
A 10, vous êtes google.com
A 0, vous n’êtes personne (enfin pour Google en tout cas!)
Une grande majorité de sites se classent entre 3 et 5.

Comment marche le Google Page Rank?
En gros Google fait un calcul de tous les liens qui vont vers votre page… plus vous avez de liens, plus votre PR (pour PageRank) augmente. Vous héritez aussi en partie du PageRank de vos liens entrants. Par exemple 10 liens d’un site de PR de 7 aura beaucoup de poids que 70 liens d’un PR de 1. (je schématise beaucoup, je vulgarise, en vérité c’est beaucoup plus compliqué que ça!)

Comment connaître mon PageRank?
Il y énormément de services disponibles sur le web pour connaître votre PageRank…
Par exemple ici ou ici (une simple requête sur google vous en donne des centaines)
Vous pouvez aussi utiliser la toolbar Google pour connaître le pageRank du site visité ou utiliser des extensions firefox bien pratique (que nos amis référeneceurs et fan de SEO complètent la liste des outils dans les commentaires)

Vous pouvez aussi vous calculer vous même votre pageRank.
Cela n’a rien de compliqué et il y a beaucoup de code dispo un peu à droite à gauche…
C’est basiquement une requête envoyée à google et ensuite on extrait une partie du résultat (seul petit effort: trouver le checksum de l’url demandée).
Voici celui que j’utilise (pour le voir… clic droit/sauvegarder le lien sous…)

Pourquoi tous ces efforts?
Pour pouvoir améliorer son classement sur Google, arriver devant les concurrents sur tel ou tel mot clef.
Vous avez déjà travaillé votre indexation, rendu vos pages lympides pour les différents bots des moteurs de recherche… maintenant vous allez partir à la chasse aux liens pour faire monter votre PageRank

Quelques liens utiles
- La section spécifique de WebRankInfo (une mine d’information)
- Explication de l’algorithme du PageRank
(d’autres liens intéressants?… commentaires…)

Et vous c’est quoi vos techniques pour faire monter votre PageRank (ou celui de vos clients)?

Référencement / Indexation

Publié le 26 September 2007, par Babozor

Ce sujet est loin d’être ma spécialité, des personnes passent leur journées à cela, mais il est important de connaître ces deux notions qui sont connexes mais différentes.
Commençons par une petite définition:

Indexation
L’indexation, c’est le fait pour un moteur de recherche de passer sur une page et de l’indexer, c’est à dire parser son contenu (analyser si vous préférez), repérer les différents éléments (par exemple titre de la page, les liens, les différents blocs de texte, les titres, sous titres, images, etc…) et les stocker dans une (grosse) base de données. Ces données sont ensuite analysées et ce sont elles qui vous permettent de faire des recherches sur les différents moteurs (peu importe le moteur).

Référencement
Le référencement c’est une série d’actions pour signaler votre aux moteurs de recherche pour que celui ci soit indexé et d’optimiser son positionnement pour certains mots-clefs. C’est par exemple travailler les titres et description meta des pages pour essayer de faire remonter certains mots clefs (mon expertise sur ce domaine s’arrête à peu près là, je vous laisse compléter plus largement en commentaires…)

Pour aider le référencement de votre page, vous pouvez choisir (et vous devez) d’optimiser votre indexation.
Cette notion d’indexation est extrêmement importante car elle touche beaucoup de métiers de travailleurs du web. Il faut donner le plus d’information aux robots d’indexation de moteurs de recherche.
1. respect des standards du web
Je ne le dirais jamais assez, mais le meilleur moyen d’avoir un site fonctionnel est de respecter les standards du web, surtout bien comprendre le principe de la sémantique HTML, utiliser des CSS pour la mise en forme. Cela renforce beaucoup votre indexation. Par exemple utilisez ul/li pour des listes, h1 pour le titre principal de votre page, h2 pour les sous-titres, etc… cela permet de donner aux moteurs d’indexation des moteurs de recherche de bonnes bases pour classer votre contenu.
2. les contenus mal indexés (à bannir autant que possible)
Spécial dédicace aux graphistes: le flash est très mal indexé (voir pas du tout pour certains moteurs)… donc les titres avec des polices de caractères étrange (mais funky c’est vrai je l’admets) on oublie. Les images sont mal indexés… seul leur nom l’est, vous pouvez toujours travailler dessus, mais en aucun cas vous ne bénéficiez du poids attribué par une bonne utilisation de la sémantique HTML
3. robots.txt
Dites aux moteurs de recherche les fichiers, répertoires que vous ne voulez pas voir indexés (cela vous évitera certains embarras), en particulier les images, vos sources, les flash, etc…
4. sitemap.xml
Pour être sur que le moteur est passé sur toutes vos pages, indiquez lui le sitemap (plan du site) pour qu’il indexe toutes les pages.
5. liens JavaScript et Ajax
Toutes les actions client (ou presque) ne sont pas simulées et donc non indexés (puisque le moteur se contente d’accéder au fichier de votre page et d’en extraire les données les plus intéressantes), il ne suivra donc pas (toujours) les liens javascript et certainement pas le contenu loadé grâce à une fonction Ajax (ce qui peut être un avantage si vous ne voulez pas que le moteur d’indexation suive certains liens)
6. frameset / iframe
Là aussi on évite, ne serais-ce que parceque c’est une méthode du moyen âge et parceque cela ne facilite pas l’indexation (loin de là).

Quelques actions de référencement (se sont des actions basiques, je laisse les pros du référencement s’exprimer dans les commentaire ou mettre des liens utiles):
1. travailler le titre de la page
Très important, que le titre de la page reflète le contenu (ou en tout cas quelques mots clefs significatifs du contenu) aide beaucoup à remonter dans le classement.
2. travailler les meta tags (description, keyword)
Ce sont aussi des tags (historiques) qui sont massivement utilisés par les moteurs pour référencer vos différentes pages.
3. essayer d’avoir des liens rentrants
Plus vous aurez de liens entrants (de backlinks) plus votre page est populaire et plus elle montera dans le classement (mais là à part demander poliment ou avoir un contenu de qualité hors norme, je vois pas)
4. ré-écriture d’URL (url rewriting)
Les données sont relativement floues, mais apparemment cela aiderait à faire remonter votre page suivant les mots clefs (et honnêtement ça coute pas grand chose et en plus c’est moins moche, donc…)

Ce sont pleins de petites actions, mais à prendre en compte tôt dans vos projets web (souvent dès la conception graphique) qui vous permettront d’avoir une indexation optimale et un bon référencement. Une autre solution est de prendre un terme peu utilisé et de l’insérer massivement dans vos tags, TDW en est un bon exemple.

Des conseils à nous donner (je le répète je n’ai qu’une connaissance partielle, mon boulot en tant que développeur est de pas bloquer l’indexation ou tenter de l’optimiser, je n’ai volontairement pas parlé de PageRank, puisque spécifique à un moteur de recherche, même si c’est le plus utilisé en France) ?