Forums d'entraide informatique - Astuces - Conseils

Des experts à votre écoute pour tous vos dysfonctionnements

Vous n'êtes pas identifié.


#1 23-08-2008 20:15:11

Admin
Administrateur
Date d'inscription: 30-07-2008
Messages: 683

Le livre blanc du référencement de pages Internet (2)

Page 17/46
Page 404 d'erreur Apple http://www.apple.comLivre blanc « Guide du Référencement Internet »
a/ URLs simplifiées
Les noms de pages comportant des caractères spéciaux ou des paramètres à rallonge
passés   via   la  méthode   GET   (identifiant   de   sessions,   valeurs   des   champs   d'un
formulaire, etc) sont mal supportés par les robots d'indexation.
Soit une URL dans laquelle on transmet un identifiant de session :
http://www.monsite.com/catalogue.html?s … 458ze11000
Ce numéro de session changeant à chaque nouvelle visite, à chaque fois
qu'un  robot  d'indexation viendra visiter  un site,   toutes  les pages auront
une nouvelle URL. Plus précisément, une même page aura à chaque visite
une nouvelle URL.
Le   robot   verra   donc   2   pages   aux   URL   différentes  mais   aux   contenus
identiques, ce qu'il pénalisera fortement (baisse du classement de la page,
voire blacklistage).
Contournez le problème en exploitant les mécanismes de réécriture complète de l’URL
(URL Rewriting). La plupart des CMS et plateformes de blogs fournissent  désormais ce
mécanisme en standard (par exemple, le CMS Drupal gère la réécriture avec le module
PathAuto).
Il vous faudra aussi activer le module permettant au serveur Web de traduire ces URL
(par exemple, sous Apache le module mod_rewrite).
Le résultat peut être le suivant :
http://www.clever-age.com/actualites/pe … paris/les-
framework-oss-java-2-.html
Ici, les répertoires « actualites / petits-dejeuners / paris » et la page « les-framework-
oss-java-2-.html » ne sont pas des fichiers existants physiquement sur le serveur mais
l’URL Rewriting simule leurs existences, et permet aux robots d’indexer le contenu de
la page générée dynamiquement.
Utilisez donc des tiny / friendly URL, soit des URL claires, simples à retenir pour
l'utilisateur et permettant aux robots d'indexation de travailler correctement :
• dans   vos   URL,   remplacez   les   séparateurs   de   mots   « virgule,   point   et
underscore »   par   des   tirets   (pour   des   raisons   d'indexation  mais   aussi   de
bookmarking)
• évitez les dates dans l'URL : au final, elles n'apportent pas de valeur ajoutée au
robot d'indexation1
• remplacez   les   extensions   de   page   non   standard   (.php,   .cfm,   etc)   par   des
extensions communes (.htm ou .html)
• les   robots   limitent   leur   indexation   aux   rubriques   de   niveaux   2   ou   3   de
profondeur.  Raccourcissez vos URL en usant  de  l'URL Rewriting  ou  limitez  le
nombre de sous de répertoires sur le serveur.
1
http://performancing.com/node/397     
Page 18/46Livre blanc « Guide du Référencement Internet »
b/ Utilisation exclusive de Flash ou Java
Il n'est pas recommandé d'utiliser des objets Flash ou des applets Java à outrance.
Il faut considérer que ces éléments ne sont adaptés qu'à des contextes spécifiques :
• bannières publicitaires
• vidéos
• interfaces   nécessitant   la   communication   avec   des   composants   systèmes  ou
avancés telles qu'une carte géographique interactive
Dans des contextes habituels (pages d'accueil d'un site, navigation), ces éléments ne
sont  pas   recommandés,  particulièrement   s'ils   remplacent   les  éléments   texte de  la
page.
Plusieurs raisons peuvent être évoquées :
• si   la   page   et   l'objet   contiennent   des   contenus   texte   communs,   les   robots
peuvent   considérer  qu'il   s'agit  d'une   stratégie  malicieuse  de duplication  du
contenu :
Veillez à inclure un fichier robots.txt qui interdit l'exploration des pages
Flash   afin   que   ces   pages   ne   soient   pas   considérées   comme   des
doublons.
1
Le centre d'aide de Google
• les robots indexent mal les contenus texte inclus dans ces objets.
Si ces éléments sont justifiés et indispensables à votre site, optimisez-les2
.
1
http://solutions.journaldunet.com/0601/ … lash.shtml     
Page 19/46
Une page d'accueil Flash - LeNotre.fr http://www.lenotre.fr/fr/index.html (non recommandé1
)Livre blanc « Guide du Référencement Internet »
• simulez ce qu'un robot serait capable d'en extraire comme contenu texte.
• Pour vos  fichiers  .swf  par exemple,  utilisez  le Flash Search Engine SDK1
  qui
propose une application nommée « swf2html »
• Analysez directement comment Google interprète ce format de fichier :
• étudiez les outils d'optimisation existants. Pour Flash, par exemple :
• le script SWF Object
• le script UFO Unobstrusive Flash Object
• proposez   des   contenus   texte   alternatifs.   Par   exemple,   pour   une   animation
Flash, renseignez la balise noembed (bien qu'en voie de disparition)
2
http://www.informit.com/articles/articl … 1&rl=1     
1
http://www.adobe.com/licensing/developer/     
Page 20/46Livre blanc « Guide du Référencement Internet »
3.3 Liens internes
Comme nous avons pu le voir en décrivant le fonctionnement des robots, la première
étape d'indexation est la collecte d'URL, la deuxième l'indexation des contenus texte
de ces pages. Si un robot ne peut pas collecter les URL d'un site ou voir de texte, son
parcours sera limité et il finira par partir (pour ne plus revenir !).
Les   liens   internes   permettent   d'optimiser   la   navigabilité   interne   :   ils   rendent   la
navigation conviviale mais  surtout  simplifient   l'exploration des  liens  par   les  robots
d'indexation.
Un lien interne est important tant pour la page qu'il le contient que pour la page cible
du lien.
Recommandé A éviter
● Liez les pages de niveaux de
profondeur 3/4 et plus avec une
page de niveau 1 ou directement la
page d'accueil
● Regroupez les liens internes au sein
du/des menu(s) de navigation
● Choisissez un/de(s) mot(s) clé(s)
décrivant au mieux la page cible
● Ajoutez régulièrement des liens
pointant vers de nouvelles pages
internes
● Les liens cassés pouvant stopper
le robot pendant l'exploration du
site
● Les liens images
● La création de liens avec
JavaScript
● Limiter les liens qui ont des titres
peu significatifs par exemple,
« lire la suite.. » ou « plus d’infos
», pour ne pas diluer la force des
liens contextuels
● Les liens relatifs (adressant les
pages avec des « .. /»)
Page 21/46Livre blanc « Guide du Référencement Internet »
3.4 Refonte / migration d'un site
Recommandé A éviter
● Transférez tout le contenu textuel
dans votre nouveau site
● Densité de mots-clés et thèmes les
plus proches possibles de votre
ancien site
● Conservez la structure existante de
votre site et le nom des pages
● Si besoin de restructurer la
hiérarchie de vos pages, utilisez la
redirection 3011
permanente pour
que le moteur considère la page
comme définitivement déplacée et
lui réaffecte l'importance dont elle
bénéficiait
● Mettez à jour le plan du site
● URL Canoniques : redirigez les URL
de type « http://monsite.com »
vers « http://www.monsite.com »
● Si vous souhaitez avoir des pages
dupliquées, placez sur l'une des
pages (celles qui a le moins
d'importance à vos yeux),
l'instruction meta name = "robots"
content="noindex, follow" dans
votre header HTML
● Nouveau site au contenu
entièrement neuf
● Pages satellites
● Déplacer ou renommer des pages
bien positionnées dans les moteurs
et souvent mises en favoris par les
utilisateurs
● Pages dupliquées2
ou quasi
identique sur 2 ou plusieurs
domaines
La duplication de code HTML (par exemple,  un menu de navigation ou un pied de
page) n'est pas considérée comme du contenu dupliqué : les robots sont programmés
pour reconnaître ces portions de code. Ils y attachent peu d'importance et parcourent
d'ailleurs les zones de la page susceptibles d'être uniques.
3.5 Archives Internet
Pour connaître les URL à rediriger (301), utilisez par exemple la Way Back Machine,
une archive Internet qui  stocke chaque mois les pages de votre site. Cet outil  vous
permet de connaître l'URL de chacune de vos pages depuis que votre site est né : de
cette façon, vous êtes en mesure de rediriger les URL obsolètes vers vos nouvelles URL
1
http://www.seobook.com/archives/001714.shtml     
2
http://www.seomoz.org/blog/the-illustra … ch-engines     
Page 22/46Livre blanc « Guide du Référencement Internet »
ou vers votre page d'accueil.
Page 23/46
Internet Archives - The Way Back Machine http://web.archive.org/web/*/http://clever-age.comLivre blanc « Guide du Référencement Internet »
4 CONTENU
Le contenu est le seul facteur à considérer pour référencer naturellement votre site
sur le long terme.
Mettez  « en œuvre une approche  éditoriale  globale,  visant  à exploiter  un univers
sémantique riche et régulièrement actualisé. »1
4.1 Qualité
Recommandé A éviter
● Produisez du contenu unique en
son genre2
● Un thème unique : le contenu du
site doit être attaché à un thème
déterminé et permettre au site de
vivre tout en étant reconnu de sa
cible mais aussi d'autres sites
(réseaux de sites). Ce thème peut
être large mais ce qui importe est
son unicité, de façon à ce que les
internautes identifient clairement
l'objectif du site
● Densité : à un paragraphe donné,
faites correspondre une idée pour
bénéficier d'un effet de proximité
entre mots-clés
● Placement des mots importants en
haut de page, de paragraphe :
pour un article de blog, déplacez
ses mots clés associés au dessus
plutôt qu'en dessous
● Utilisez le genre et le nombre des
mots, les synonymes, etc
● Produisez un contenu aussi
complet que possible (contenu
« stop » ou « all in one », couvrant
tout ce qui est susceptible
d'intéresser votre lecteur)
● Référencer l'information disponible
sur d'autres sites
● Optimiser la page d'accueil
seulement (qui n'est d'ailleurs pas
forcément la plus visitée du site)
● Les mots buzz, jargons, langage
marketing
● Les mots trop abstraits
(« solutions »,
« développements », etc)
● Termes trop techniques à moins
que votre audience y soit habituée
● Les coquilles et fautes
d'orthographe et de conjugaison
(même si elles sont parfois bien
référencées)
● Techniques pour simuler la mise à
jour d'une page (modification de
date, etc)
1
http://www.dixxit.fr/livre-blanc-referencement/     
2
http://www.sugarrae.com/blog/when-uniqu … ot-unique/     
Page 24/46Livre blanc « Guide du Référencement Internet »
4.2 Mots-clés
Les mots-clés sont des mots choisis en relation avec le contenu du site. Ce sont ces
mots qui devront permettre au mieux à un internaute de trouver un site et à un robot
d'en indexer le contenu.
4.2.1 Placer les mots-clés
La balise HTML TITLE
• y faire apparaître les mots clés
• utiliser des titres concis (en nombre de mots et de caractères)
L'attribut ALT de la balise HTML IMG
Au-delà   d'être   imposé   par   le   standard  W3C  (accessibilité   aux   déficients   visuels),
l'attribut  ALT est  pris  en  compte par  une majorité  de moteurs  de  recherche  (par
exemple, Google), en particulier lorsque l'image est un lien vers une autre page.
Les balises HTML META
Nous ne décrivons pas  ici   les méta-balises “keywords” et “description”,  qui  ne sont
quasiment plus prises en compte par les services de recherche.
Sémantique HTML
Les moteurs de recherche donnent une grande importance à certaines balises HTML,
en particulier celles permettant de mettre en valeur du texte. C'est le cas des balises :
– <h1></h1>, <hx></hx>, .. (titrage)
– <strong></strong> (caractère gras)
– <p></p> (paragraphe)
– <ul><li></li></ul> (listes)
Page 25/46Livre blanc « Guide du Référencement Internet »
A éviter
● Mots-clés dans les métas sans rapport avec la page
● Répétition abusive de mots-clés (ou keyword stuffing)
● Abus de mises en forme autour des mots-clefs : Gras, italique, souligné,
couleurs, <Hx>
● Pages sans titre
● Titres qui n'ont pas de sens (ne contenant que des mots-clés) et préférer une
phrase concise et explicite
● Caractères spéciaux
● Titres génériques (par exemple, « Bienvenue sur monsite.com »), chaque
page doit avoir un titre qui lui est propre
● Méta-balise description : description de page identique sur toutes les pages du
site
4.2.2 Choisir les mots-clés
Pour sélectionner les bonnes expressions, il est nécessaire d'examiner
les tendances à partir des statistiques issues du site afin de connaître
les mots clés réellement tapés.
David Bianovici, directeur général de l'agence Relevant Traffic
En réalité, il n'existe pas de méthode miracle pour définir de bons mots. Lancez vous
dans un audit sémantique1
, utilisez quelques outils de suggestion de mots clés les plus
recherchés, soyez imaginatifs.
• Keyword Selector Tool
(http://inventory.overture.com/d/searchi … uggestion/)
• Term   Extraction   Documentation   for   Yahoo   !   Search   Web   Service
(http://developer.yahoo.com/search/conte … ction.html)
• SEO   Elite   (http://www.seoelite.com/)   ou   WordTracker
(http://www.wordtracker.com/)
1
http://s.billard.free.fr/referencement/ … -les-bons-   
mots-cles
Page 26/46Livre blanc « Guide du Référencement Internet »
Site Mots clés proposés
Buzz Index – Top Yahoo ! Web
Searches (http://buzz.yahoo.com/)
Mots clés les plus recherchés sur Yahoo!
classés par catégories (top des recherches
cinéma, télévision, ...)
Zeitgeist Google
(http://www.google.com/press/intl-
zeitgeist.html#fr)
Mots clés les plus recherchés sur Google par
mois et par pays depuis 2001.
Jeeves IQ (Interesting
Queries)(http://sp.ask.com/docs/about
/jeevesiq.html)
Mots clés les plus recherchés sur Teoma
classés par catégories (top des recherches
dans l'actualité, ...)
Google Trends
(http://www.google.fr/trends)
Historique de la fréquence de recherche de
mots clés
Page 27/46
Keyword Selector Tool WordTrackerLivre blanc « Guide du Référencement Internet »
• Utilisez des outils de suggestion de mots clef
Site Fonction
KeywordSandbox
(https://adwords.google.com/select/Ke
ywordSandbox)
https://adwords.google.com/select/Key
wordToolExternal
Outil Google en ligne. Fournit des mots clés
s'approchant de celui recherché (outil
proposé comme aide pour le programme
Google AdWords).
MIVA
(http://www.miva.com/fr/content/adve
rtiser/landing1.asp)
Fournit des mots clés s'approchant de celui
recherché ainsi que le nombre de fois où ils
ont été recherchés sur les moteurs
Keyword Selector Tool
(http://inventory.overture.com/d/searc
hinventory/suggestion/)
Demande un mot clé et fournit le nombre de
fois où il a été recherché
7Search
(http://conversion.7search.com/scripts
/advertisertools/keywordsuggestion.as
px)
Fournit des mots clés s'approchant de celui
recherché, le nombre de fois où ils ont été
recherchés sur les moteurs, ainsi qu'une
estimation de leurs coûts pour être
positionnés en 1er dans les résultats
Page 28/46Livre blanc « Guide du Référencement Internet »
4.3 Effet de longue traîne (ou Long Tail)
L'utilisation de nombreux mots clés moins importants peut avoir un impact parfois plus
fort que le choix de quelques mots clés jugés primordiaux. C'est l'effet Long Tail.
Il   faut   garder   à   l'esprit   qu'il   est   difficile   de   se   positionner   sur   des  mots   clés   et
associations de mots clés les plus courants. Jouez donc des mots clés ou associations
rares mais susceptibles d'être  recherchés.  Conjointement,  ces « mots clés  rares et
ciblés » attireront plus de trafic que les mots clés les plus répandus, ceux sur lesquels
on cherche en général à se positionner.
Page 29/46
L'effet de longue traîne : beaucoup de mots moins pertinents ont parfois un impact plus que
des mots clés adaptés (http://www.longtail.com).Livre blanc « Guide du Référencement Internet »
Il ne faut donc pas se limiter à une liste précise de mots mais plutôt imaginer des
mots clés et associations inattendues. 
L'un des derniers articles de notre société Clever Age, nous a montré ce phénomène.
Sur « eclipse + update », nous apparaissons premier sur Google, pourtant Eclipse (un
environnement de programmation) n'est pas au cœur de notre activité.
La meilleure réserve de trafic se trouve dans la diversité des requêtes et
de cette manière dans la mise en valeur du contenu du site. Un trafic se
construit sur des milliers de mots clés , les positions sur 20, 50 ou 100
mots   mêmes   importants   ne   génèrent   qu'une   infime   partie   de
l'audience.
Page 30/46
http://www.google.fr/search?sourceid=na … pdate+site Livre blanc « Guide du Référencement Internet »


Cordialement

L'équipe Parisdepannage.fr

Hors ligne

 

Pied de page des forums


Copyright Parisdepannage.fr


Fermer la fenètre