Ce sujet est loin d’être ma spécialité, des personnes passent leur journées à cela, mais il est important de connaître ces deux notions qui sont connexes mais différentes.
Commençons par une petite définition:
Indexation
L’indexation, c’est le fait pour un moteur de recherche de passer sur une page et de l’indexer, c’est à dire parser son contenu (analyser si vous préférez), repérer les différents éléments (par exemple titre de la page, les liens, les différents blocs de texte, les titres, sous titres, images, etc…) et les stocker dans une (grosse) base de données. Ces données sont ensuite analysées et ce sont elles qui vous permettent de faire des recherches sur les différents moteurs (peu importe le moteur).
Référencement
Le référencement c’est une série d’actions pour signaler votre aux moteurs de recherche pour que celui ci soit indexé et d’optimiser son positionnement pour certains mots-clefs. C’est par exemple travailler les titres et description meta des pages pour essayer de faire remonter certains mots clefs (mon expertise sur ce domaine s’arrête à peu près là, je vous laisse compléter plus largement en commentaires…)
Pour aider le référencement de votre page, vous pouvez choisir (et vous devez) d’optimiser votre indexation.
Cette notion d’indexation est extrêmement importante car elle touche beaucoup de métiers de travailleurs du web. Il faut donner le plus d’information aux robots d’indexation de moteurs de recherche.
1. respect des standards du web
Je ne le dirais jamais assez, mais le meilleur moyen d’avoir un site fonctionnel est de respecter les standards du web, surtout bien comprendre le principe de la sémantique HTML, utiliser des CSS pour la mise en forme. Cela renforce beaucoup votre indexation. Par exemple utilisez ul/li pour des listes, h1 pour le titre principal de votre page, h2 pour les sous-titres, etc… cela permet de donner aux moteurs d’indexation des moteurs de recherche de bonnes bases pour classer votre contenu.
2. les contenus mal indexés (à bannir autant que possible)
Spécial dédicace aux graphistes: le flash est très mal indexé (voir pas du tout pour certains moteurs)… donc les titres avec des polices de caractères étrange (mais funky c’est vrai je l’admets) on oublie. Les images sont mal indexés… seul leur nom l’est, vous pouvez toujours travailler dessus, mais en aucun cas vous ne bénéficiez du poids attribué par une bonne utilisation de la sémantique HTML
3. robots.txt
Dites aux moteurs de recherche les fichiers, répertoires que vous ne voulez pas voir indexés (cela vous évitera certains embarras), en particulier les images, vos sources, les flash, etc…
4. sitemap.xml
Pour être sur que le moteur est passé sur toutes vos pages, indiquez lui le sitemap (plan du site) pour qu’il indexe toutes les pages.
5. liens JavaScript et Ajax
Toutes les actions client (ou presque) ne sont pas simulées et donc non indexés (puisque le moteur se contente d’accéder au fichier de votre page et d’en extraire les données les plus intéressantes), il ne suivra donc pas (toujours) les liens javascript et certainement pas le contenu loadé grâce à une fonction Ajax (ce qui peut être un avantage si vous ne voulez pas que le moteur d’indexation suive certains liens)
6. frameset / iframe
Là aussi on évite, ne serais-ce que parceque c’est une méthode du moyen âge et parceque cela ne facilite pas l’indexation (loin de là).
Quelques actions de référencement (se sont des actions basiques, je laisse les pros du référencement s’exprimer dans les commentaire ou mettre des liens utiles):
1. travailler le titre de la page
Très important, que le titre de la page reflète le contenu (ou en tout cas quelques mots clefs significatifs du contenu) aide beaucoup à remonter dans le classement.
2. travailler les meta tags (description, keyword)
Ce sont aussi des tags (historiques) qui sont massivement utilisés par les moteurs pour référencer vos différentes pages.
3. essayer d’avoir des liens rentrants
Plus vous aurez de liens entrants (de backlinks) plus votre page est populaire et plus elle montera dans le classement (mais là à part demander poliment ou avoir un contenu de qualité hors norme, je vois pas)
4. ré-écriture d’URL (url rewriting)
Les données sont relativement floues, mais apparemment cela aiderait à faire remonter votre page suivant les mots clefs (et honnêtement ça coute pas grand chose et en plus c’est moins moche, donc…)
Ce sont pleins de petites actions, mais à prendre en compte tôt dans vos projets web (souvent dès la conception graphique) qui vous permettront d’avoir une indexation optimale et un bon référencement. Une autre solution est de prendre un terme peu utilisé et de l’insérer massivement dans vos tags, TDW en est un bon exemple.
Des conseils à nous donner (je le répète je n’ai qu’une connaissance partielle, mon boulot en tant que développeur est de pas bloquer l’indexation ou tenter de l’optimiser, je n’ai volontairement pas parlé de PageRank, puisque spécifique à un moteur de recherche, même si c’est le plus utilisé en France) ?