Forums d'entraide informatique - Astuces - Conseils
Des experts à votre écoute pour tous vos dysfonctionnements
Vous n'êtes pas identifié.
#1 23-08-2008 20:15:11
- Admin
- Administrateur
- Date d'inscription: 30-07-2008
- Messages: 683
Le livre blanc du référencement de pages Internet (2)
Page 17/46
Page 404 d'erreur Apple http://www.apple.comLivre blanc « Guide du Référencement Internet »
a/ URLs simplifiées
Les noms de pages comportant des caractères spéciaux ou des paramètres à rallonge
passés via la méthode GET (identifiant de sessions, valeurs des champs d'un
formulaire, etc) sont mal supportés par les robots d'indexation.
Soit une URL dans laquelle on transmet un identifiant de session :
http://www.monsite.com/catalogue.html?s … 458ze11000
Ce numéro de session changeant à chaque nouvelle visite, à chaque fois
qu'un robot d'indexation viendra visiter un site, toutes les pages auront
une nouvelle URL. Plus précisément, une même page aura à chaque visite
une nouvelle URL.
Le robot verra donc 2 pages aux URL différentes mais aux contenus
identiques, ce qu'il pénalisera fortement (baisse du classement de la page,
voire blacklistage).
Contournez le problème en exploitant les mécanismes de réécriture complète de l’URL
(URL Rewriting). La plupart des CMS et plateformes de blogs fournissent désormais ce
mécanisme en standard (par exemple, le CMS Drupal gère la réécriture avec le module
PathAuto).
Il vous faudra aussi activer le module permettant au serveur Web de traduire ces URL
(par exemple, sous Apache le module mod_rewrite).
Le résultat peut être le suivant :
http://www.clever-age.com/actualites/pe … paris/les-
framework-oss-java-2-.html
Ici, les répertoires « actualites / petits-dejeuners / paris » et la page « les-framework-
oss-java-2-.html » ne sont pas des fichiers existants physiquement sur le serveur mais
l’URL Rewriting simule leurs existences, et permet aux robots d’indexer le contenu de
la page générée dynamiquement.
Utilisez donc des tiny / friendly URL, soit des URL claires, simples à retenir pour
l'utilisateur et permettant aux robots d'indexation de travailler correctement :
• dans vos URL, remplacez les séparateurs de mots « virgule, point et
underscore » par des tirets (pour des raisons d'indexation mais aussi de
bookmarking)
• évitez les dates dans l'URL : au final, elles n'apportent pas de valeur ajoutée au
robot d'indexation1
• remplacez les extensions de page non standard (.php, .cfm, etc) par des
extensions communes (.htm ou .html)
• les robots limitent leur indexation aux rubriques de niveaux 2 ou 3 de
profondeur. Raccourcissez vos URL en usant de l'URL Rewriting ou limitez le
nombre de sous de répertoires sur le serveur.
1
http://performancing.com/node/397
Page 18/46Livre blanc « Guide du Référencement Internet »
b/ Utilisation exclusive de Flash ou Java
Il n'est pas recommandé d'utiliser des objets Flash ou des applets Java à outrance.
Il faut considérer que ces éléments ne sont adaptés qu'à des contextes spécifiques :
• bannières publicitaires
• vidéos
• interfaces nécessitant la communication avec des composants systèmes ou
avancés telles qu'une carte géographique interactive
Dans des contextes habituels (pages d'accueil d'un site, navigation), ces éléments ne
sont pas recommandés, particulièrement s'ils remplacent les éléments texte de la
page.
Plusieurs raisons peuvent être évoquées :
• si la page et l'objet contiennent des contenus texte communs, les robots
peuvent considérer qu'il s'agit d'une stratégie malicieuse de duplication du
contenu :
Veillez à inclure un fichier robots.txt qui interdit l'exploration des pages
Flash afin que ces pages ne soient pas considérées comme des
doublons.
1
Le centre d'aide de Google
• les robots indexent mal les contenus texte inclus dans ces objets.
Si ces éléments sont justifiés et indispensables à votre site, optimisez-les2
.
1
http://solutions.journaldunet.com/0601/ … lash.shtml
Page 19/46
Une page d'accueil Flash - LeNotre.fr http://www.lenotre.fr/fr/index.html (non recommandé1
)Livre blanc « Guide du Référencement Internet »
• simulez ce qu'un robot serait capable d'en extraire comme contenu texte.
• Pour vos fichiers .swf par exemple, utilisez le Flash Search Engine SDK1
qui
propose une application nommée « swf2html »
• Analysez directement comment Google interprète ce format de fichier :
• étudiez les outils d'optimisation existants. Pour Flash, par exemple :
• le script SWF Object
• le script UFO Unobstrusive Flash Object
• proposez des contenus texte alternatifs. Par exemple, pour une animation
Flash, renseignez la balise noembed (bien qu'en voie de disparition)
2
http://www.informit.com/articles/articl … 1&rl=1
1
http://www.adobe.com/licensing/developer/
Page 20/46Livre blanc « Guide du Référencement Internet »
3.3 Liens internes
Comme nous avons pu le voir en décrivant le fonctionnement des robots, la première
étape d'indexation est la collecte d'URL, la deuxième l'indexation des contenus texte
de ces pages. Si un robot ne peut pas collecter les URL d'un site ou voir de texte, son
parcours sera limité et il finira par partir (pour ne plus revenir !).
Les liens internes permettent d'optimiser la navigabilité interne : ils rendent la
navigation conviviale mais surtout simplifient l'exploration des liens par les robots
d'indexation.
Un lien interne est important tant pour la page qu'il le contient que pour la page cible
du lien.
Recommandé A éviter
● Liez les pages de niveaux de
profondeur 3/4 et plus avec une
page de niveau 1 ou directement la
page d'accueil
● Regroupez les liens internes au sein
du/des menu(s) de navigation
● Choisissez un/de(s) mot(s) clé(s)
décrivant au mieux la page cible
● Ajoutez régulièrement des liens
pointant vers de nouvelles pages
internes
● Les liens cassés pouvant stopper
le robot pendant l'exploration du
site
● Les liens images
● La création de liens avec
JavaScript
● Limiter les liens qui ont des titres
peu significatifs par exemple,
« lire la suite.. » ou « plus d’infos
», pour ne pas diluer la force des
liens contextuels
● Les liens relatifs (adressant les
pages avec des « .. /»)
Page 21/46Livre blanc « Guide du Référencement Internet »
3.4 Refonte / migration d'un site
Recommandé A éviter
● Transférez tout le contenu textuel
dans votre nouveau site
● Densité de mots-clés et thèmes les
plus proches possibles de votre
ancien site
● Conservez la structure existante de
votre site et le nom des pages
● Si besoin de restructurer la
hiérarchie de vos pages, utilisez la
redirection 3011
permanente pour
que le moteur considère la page
comme définitivement déplacée et
lui réaffecte l'importance dont elle
bénéficiait
● Mettez à jour le plan du site
● URL Canoniques : redirigez les URL
de type « http://monsite.com »
vers « http://www.monsite.com »
● Si vous souhaitez avoir des pages
dupliquées, placez sur l'une des
pages (celles qui a le moins
d'importance à vos yeux),
l'instruction meta name = "robots"
content="noindex, follow" dans
votre header HTML
● Nouveau site au contenu
entièrement neuf
● Pages satellites
● Déplacer ou renommer des pages
bien positionnées dans les moteurs
et souvent mises en favoris par les
utilisateurs
● Pages dupliquées2
ou quasi
identique sur 2 ou plusieurs
domaines
La duplication de code HTML (par exemple, un menu de navigation ou un pied de
page) n'est pas considérée comme du contenu dupliqué : les robots sont programmés
pour reconnaître ces portions de code. Ils y attachent peu d'importance et parcourent
d'ailleurs les zones de la page susceptibles d'être uniques.
3.5 Archives Internet
Pour connaître les URL à rediriger (301), utilisez par exemple la Way Back Machine,
une archive Internet qui stocke chaque mois les pages de votre site. Cet outil vous
permet de connaître l'URL de chacune de vos pages depuis que votre site est né : de
cette façon, vous êtes en mesure de rediriger les URL obsolètes vers vos nouvelles URL
1
http://www.seobook.com/archives/001714.shtml
2
http://www.seomoz.org/blog/the-illustra … ch-engines
Page 22/46Livre blanc « Guide du Référencement Internet »
ou vers votre page d'accueil.
Page 23/46
Internet Archives - The Way Back Machine http://web.archive.org/web/*/http://clever-age.comLivre blanc « Guide du Référencement Internet »
4 CONTENU
Le contenu est le seul facteur à considérer pour référencer naturellement votre site
sur le long terme.
Mettez « en œuvre une approche éditoriale globale, visant à exploiter un univers
sémantique riche et régulièrement actualisé. »1
4.1 Qualité
Recommandé A éviter
● Produisez du contenu unique en
son genre2
● Un thème unique : le contenu du
site doit être attaché à un thème
déterminé et permettre au site de
vivre tout en étant reconnu de sa
cible mais aussi d'autres sites
(réseaux de sites). Ce thème peut
être large mais ce qui importe est
son unicité, de façon à ce que les
internautes identifient clairement
l'objectif du site
● Densité : à un paragraphe donné,
faites correspondre une idée pour
bénéficier d'un effet de proximité
entre mots-clés
● Placement des mots importants en
haut de page, de paragraphe :
pour un article de blog, déplacez
ses mots clés associés au dessus
plutôt qu'en dessous
● Utilisez le genre et le nombre des
mots, les synonymes, etc
● Produisez un contenu aussi
complet que possible (contenu
« stop » ou « all in one », couvrant
tout ce qui est susceptible
d'intéresser votre lecteur)
● Référencer l'information disponible
sur d'autres sites
● Optimiser la page d'accueil
seulement (qui n'est d'ailleurs pas
forcément la plus visitée du site)
● Les mots buzz, jargons, langage
marketing
● Les mots trop abstraits
(« solutions »,
« développements », etc)
● Termes trop techniques à moins
que votre audience y soit habituée
● Les coquilles et fautes
d'orthographe et de conjugaison
(même si elles sont parfois bien
référencées)
● Techniques pour simuler la mise à
jour d'une page (modification de
date, etc)
1
http://www.dixxit.fr/livre-blanc-referencement/
2
http://www.sugarrae.com/blog/when-uniqu … ot-unique/
Page 24/46Livre blanc « Guide du Référencement Internet »
4.2 Mots-clés
Les mots-clés sont des mots choisis en relation avec le contenu du site. Ce sont ces
mots qui devront permettre au mieux à un internaute de trouver un site et à un robot
d'en indexer le contenu.
4.2.1 Placer les mots-clés
La balise HTML TITLE
• y faire apparaître les mots clés
• utiliser des titres concis (en nombre de mots et de caractères)
L'attribut ALT de la balise HTML IMG
Au-delà d'être imposé par le standard W3C (accessibilité aux déficients visuels),
l'attribut ALT est pris en compte par une majorité de moteurs de recherche (par
exemple, Google), en particulier lorsque l'image est un lien vers une autre page.
Les balises HTML META
Nous ne décrivons pas ici les méta-balises “keywords” et “description”, qui ne sont
quasiment plus prises en compte par les services de recherche.
Sémantique HTML
Les moteurs de recherche donnent une grande importance à certaines balises HTML,
en particulier celles permettant de mettre en valeur du texte. C'est le cas des balises :
– <h1></h1>, <hx></hx>, .. (titrage)
– <strong></strong> (caractère gras)
– <p></p> (paragraphe)
– <ul><li></li></ul> (listes)
Page 25/46Livre blanc « Guide du Référencement Internet »
A éviter
● Mots-clés dans les métas sans rapport avec la page
● Répétition abusive de mots-clés (ou keyword stuffing)
● Abus de mises en forme autour des mots-clefs : Gras, italique, souligné,
couleurs, <Hx>
● Pages sans titre
● Titres qui n'ont pas de sens (ne contenant que des mots-clés) et préférer une
phrase concise et explicite
● Caractères spéciaux
● Titres génériques (par exemple, « Bienvenue sur monsite.com »), chaque
page doit avoir un titre qui lui est propre
● Méta-balise description : description de page identique sur toutes les pages du
site
4.2.2 Choisir les mots-clés
Pour sélectionner les bonnes expressions, il est nécessaire d'examiner
les tendances à partir des statistiques issues du site afin de connaître
les mots clés réellement tapés.
David Bianovici, directeur général de l'agence Relevant Traffic
En réalité, il n'existe pas de méthode miracle pour définir de bons mots. Lancez vous
dans un audit sémantique1
, utilisez quelques outils de suggestion de mots clés les plus
recherchés, soyez imaginatifs.
• Keyword Selector Tool
(http://inventory.overture.com/d/searchi … uggestion/)
• Term Extraction Documentation for Yahoo ! Search Web Service
(http://developer.yahoo.com/search/conte … ction.html)
• SEO Elite (http://www.seoelite.com/) ou WordTracker
(http://www.wordtracker.com/)
1
http://s.billard.free.fr/referencement/ … -les-bons-
mots-cles
Page 26/46Livre blanc « Guide du Référencement Internet »
Site Mots clés proposés
Buzz Index – Top Yahoo ! Web
Searches (http://buzz.yahoo.com/)
Mots clés les plus recherchés sur Yahoo!
classés par catégories (top des recherches
cinéma, télévision, ...)
Zeitgeist Google
(http://www.google.com/press/intl-
zeitgeist.html#fr)
Mots clés les plus recherchés sur Google par
mois et par pays depuis 2001.
Jeeves IQ (Interesting
Queries)(http://sp.ask.com/docs/about
/jeevesiq.html)
Mots clés les plus recherchés sur Teoma
classés par catégories (top des recherches
dans l'actualité, ...)
Google Trends
(http://www.google.fr/trends)
Historique de la fréquence de recherche de
mots clés
Page 27/46
Keyword Selector Tool WordTrackerLivre blanc « Guide du Référencement Internet »
• Utilisez des outils de suggestion de mots clef
Site Fonction
KeywordSandbox
(https://adwords.google.com/select/Ke
ywordSandbox)
https://adwords.google.com/select/Key
wordToolExternal
Outil Google en ligne. Fournit des mots clés
s'approchant de celui recherché (outil
proposé comme aide pour le programme
Google AdWords).
MIVA
(http://www.miva.com/fr/content/adve
rtiser/landing1.asp)
Fournit des mots clés s'approchant de celui
recherché ainsi que le nombre de fois où ils
ont été recherchés sur les moteurs
Keyword Selector Tool
(http://inventory.overture.com/d/searc
hinventory/suggestion/)
Demande un mot clé et fournit le nombre de
fois où il a été recherché
7Search
(http://conversion.7search.com/scripts
/advertisertools/keywordsuggestion.as
px)
Fournit des mots clés s'approchant de celui
recherché, le nombre de fois où ils ont été
recherchés sur les moteurs, ainsi qu'une
estimation de leurs coûts pour être
positionnés en 1er dans les résultats
Page 28/46Livre blanc « Guide du Référencement Internet »
4.3 Effet de longue traîne (ou Long Tail)
L'utilisation de nombreux mots clés moins importants peut avoir un impact parfois plus
fort que le choix de quelques mots clés jugés primordiaux. C'est l'effet Long Tail.
Il faut garder à l'esprit qu'il est difficile de se positionner sur des mots clés et
associations de mots clés les plus courants. Jouez donc des mots clés ou associations
rares mais susceptibles d'être recherchés. Conjointement, ces « mots clés rares et
ciblés » attireront plus de trafic que les mots clés les plus répandus, ceux sur lesquels
on cherche en général à se positionner.
Page 29/46
L'effet de longue traîne : beaucoup de mots moins pertinents ont parfois un impact plus que
des mots clés adaptés (http://www.longtail.com).Livre blanc « Guide du Référencement Internet »
Il ne faut donc pas se limiter à une liste précise de mots mais plutôt imaginer des
mots clés et associations inattendues.
L'un des derniers articles de notre société Clever Age, nous a montré ce phénomène.
Sur « eclipse + update », nous apparaissons premier sur Google, pourtant Eclipse (un
environnement de programmation) n'est pas au cœur de notre activité.
La meilleure réserve de trafic se trouve dans la diversité des requêtes et
de cette manière dans la mise en valeur du contenu du site. Un trafic se
construit sur des milliers de mots clés , les positions sur 20, 50 ou 100
mots mêmes importants ne génèrent qu'une infime partie de
l'audience.
Page 30/46
http://www.google.fr/search?sourceid=na … pdate+site Livre blanc « Guide du Référencement Internet »
Cordialement
L'équipe Parisdepannage.fr
Hors ligne
2008 Parisdepannage |Plan du site|Forums |Blog|Lexique ![]()