- Statut : non résolu
- Ce sujet contient 30 réponses, 4 participants et a été mis à jour pour la dernière fois par
Darloup, le il y a 16 années et 7 mois.
-
AuteurMessages
-
1 octobre 2008 à 15 h 17 min #463465
Bonjour,
Ma configuration WP actuelle
– Version de WordPress : 2.6.2
– Thème utilisé : Freshy
– Plugins en place : Akismet, All In One SEO, Cforms II, Google Sitemaps, Statpress, TinyMCE advanced
– Nom de l’hebergeur : free.fr
– Adresse du site : http://Sixmilli0nways.free.fr/Problème(s) rencontré(s) :
Salut à tous
Je voudrais vous demander une petite confirmation. Lorsque je vais dans mon compte google pour webmaster, google me dit qu’il voit bien mon sitemaps et ses liens, mais qu’il en a indexé aucun.
Voilà mon fichiers sitemaps
URL Priority Change Frequency LastChange
http://sixmilli0nways.free.fr/blog/ 100% Daily 2008-09-26 10:26
http://sixmilli0nways.free.fr/blog/index.php/2008/09/24/joyeux-anniversaire-fedora 60% Monthly 2008-09-26 10:26
http://sixmilli0nways.free.fr/blog/index.php/2008/09/23/bienvenue 60% Monthly 2008-09-25 09:33
http://sixmilli0nways.free.fr/blog/index.php/a-propos 60% Weekly 2008-08-17 16:00
http://sixmilli0nways.free.fr/blog/index.php/category/blog 30% Weekly
http://sixmilli0nways.free.fr/blog/index.php/category/fedora 30% Weekly
http://sixmilli0nways.free.fr/blog/index.php/2008/09 30% Daily 2008-09-24 07:40Quant à mon fichier robots.txt proposé testé avec les outils webmaster google, il devrait permettre l’indexation des deux sujets et de la racine du blog, mais pas le reste. Hors absolument rien n’est référencé.
Voilà le fichier robots.txt
Sitemap: http://sixmilli0nways.free.fr/blog/sitemap.xml
User-agent: Googlebot
User-agent: Yahoo
User-agent: Msnbot
Disallow: /robots.txt
Disallow: /index.html
Disallow: /blog/wp-*
Disallow: /blog/index.php/category
Disallow: /blog/index.php/tag
Disallow: /blog/index.php/a-propos
Disallow: /blog/index.php/contact
Disallow: /blog/index.php/2008$
Disallow: /blog/index.php/2008/*$
Disallow: /blog/index.php/2008/*/*$
Allow: /blog/index.php/2008/*/*/*$
Disallow: /blog/index.php/2009$
Disallow: /blog/index.php/2009/*$
Disallow: /blog/index.php/2009/*/*$
Allow: /blog/index.php/2009/*/*/*$
Disallow: /blog/index.php/2010$
Disallow: /blog/index.php/2010/*$
Disallow: /blog/index.php/2010/*/*$
Allow: /blog/index.php/2010/*/*/*$
Disallow: /blog/index.php/feed
Disallow: /blog/index.php/comments/feed
Disallow: /blog/index.php/*/*/*/*/trackback
Disallow: /blog/index.php/*/*/*/*/feed
User-agent: *
Disallow: /robots.txt
Disallow: /index.html
Disallow: /blog/wp-admin
Disallow: /blog/wp-content
Disallow: /blog/wp-includes
Disallow: /blog/wp-login
Disallow: /blog/index.php/category
Disallow: /blog/index.php/tag
Disallow: /blog/index.php/a-propos
Disallow: /blog/index.php/contact
Disallow: /blog/index.php/feed
Disallow: /blog/index.php/comments/feedCe qui me perturbe c’est que lorsque je l’ai testé avec les outils webmaster, il était censé permettre l’indexation des sujets.
Est ce que vous pourriez me donner un petit coup de main siouplé ?
1 octobre 2008 à 15 h 41 min #647098Bonjour, il faut du temps avant que ton site soit indexé et mettre des articles, dela dépend environ 3 semaines, pour ta page robots.txt enlève « dissalow » désindexation d’une URL
Fait juste
User-Agent: *
Allow: /Ceci dans un premier temps, car je n’ai pas regardé en détail
1 octobre 2008 à 16 h 11 min #647099Bonjour Didier-63 et merci pour ta réponse
Pourquoi faut il que le fichier robots.txt soit indexé (enlever le disallow a l’url du robots.txt ?)
Sinon oui effectivement je vais mettre des Allow sur / et /blog/1 octobre 2008 à 19 h 06 min #647101Je reprends tu fais ta page robots.txt:
User-Agent: *
Allow: /C’est tout, et ensuite pourquoi il y deux sites identiques? sauf o 0
Et attend pour l’indexation1 octobre 2008 à 20 h 32 min #647102D’accord, effectivement j’avais compris un peu de travers
Je vais modifier le robots.txt . ESt ce que tu penses qu’il faut autoriser / et /blog/1 octobre 2008 à 20 h 44 min #647103effectivement, le Disallow: /robots.txt, je sais pas où tu l’as pêché mais j’ai jamais vu cela…
pour le reste, autorise tout…
si tu veux faire du bidouillage de robots.txt, jette un oeil ici :
http://www.lautre-monde.fr/webtech/robotstxt-optimise-pour-wordpress/1 octobre 2008 à 22 h 44 min #647104Bah le disallow: robots.txt c’était juste pour ne pas référencer mon robots.txt. Sur mon blog de test, j’avais eu la surprise de retrouver sur google l’adresse de mon robots.txt en cherchant mon site. Sinon selon toi il faut autoriser l’indexation des catégories et des tags ? J’ai pas vu beaucoup de blog qui laissaient indexer ce genre de choses 😳
Edit : sur le lien que tu m’as donné, il dit que l’indexation est bloquée par All In One SEO oO . Je ne comprends pas bien ? C’est à cause de l’option noindex ? (le code source m’indique
)
Excusez moi de vous demander tout ça, mais je crois qu’une fois que c’est référencé c’est assez dur de le déréférencer
2 octobre 2008 à 9 h 35 min #647100Il y a bcp d’avis divergents sur le fait d’index ou non les catégories. Au départ, je ne les indexais pas puis j’ai changé d’avis, à présent, j’ai passé en allow les catégories.
Pour les archives, cela ne présente pas grand intérêt de les indexer car leur contenu n’est pas ordonné (dans les catégories, au moins, les articles sont sur le même sujet).
En outre, je te conseille d’utiliser les extraits de notes pour les archives et catégories afin d’éviter le duplicate content.
Le noindex permet d’éviter que la page soit indexée. Si elle est déjà indexée, pour la retirer de l’index, il faut mettre le noindex, bloquer l’accès avec le robots.txt en passant en Disallow puis enfin aller dans le google webmaster tools et demander le retrait de la page et ensuite il faut attendre…
Pour faire court, je te conseille de bloquer les répertoires contenant les fichiers php de l’admin, cela ne présente aucun intérêt de les indexer…
Pour le reste, à toi de voir ce que tu préfères…
2 octobre 2008 à 17 h 59 min #647105Le délai d’indexation par Google est complètement aléatoire…
Mon blog a été indexé (je parle d’indexation, pas de rérérencement) en 24 heures…
Le site Web que j’ai créé pour ma petite amie n’est toujours pas indexé – après plus de 2 semaines…
Puis je te conseiller un excellent (mais méconnu) plugin (extension) pour créer une sitemap ? Il est anglais, et fonctionne parfaitement et n’est pas une usine à gaz (contrairement à certains autres).
Essaie : http://wordpress.org/extend/plugins/karailievs-sitemap/
Ce plugin est malheureusement trop méconnu, mais il est PARFAIT pour un blog sous WP.
Henry
3 octobre 2008 à 9 h 44 min #647106Bonjour Darloup et Olivier et merci pour vos réponses
Ça va être compliqué mais je vais finir par y arriver. Ce matin j’ai eu la surprise de voir que l’url de mon sitemaps était référencé sur google, alors que j’aurais préféré qu’il n’y soit pas : au moins ça permettra de tester la méthode de désindexation (mais comment désindexer une url qui n’est pas une page web à proprement parler, puisqu’il s’agit ici d’un fichier xml ?). D’ailleurs petite question bête, c’est quoi la différence entre indexation et référencement ? oOPour le fait d’indexer les catégories je pensais que ça pouvait poser des problèmes, mais peut être est ce que ça aide aussi à référencer plus vite les articles aussi non ?
Olivier tu me parles des extraits de notes ? De quoi s’agit ?
3 octobre 2008 à 10 h 21 min #647107Le référencement veut dire que ton site est « trouvable » en effectuant une recherche sur Google avec des mots clés. L’indexation veut dire que Google a effectivement mis plusieurs pages de ton site dans son index principal (et, eventuellement, en cache).
La première chose que tu dois faire est de créer un compte Google – c’est gratuit, et tu fais cela ici : https://www.google.com/accounts/ManageAccount
Une fois ton compte ouvert, il te faut valider ton site. C’est à dire prouver à Google que tu en es bien le propriétaire. Tu devras soit placer un code sur la page index.php, soit télécharger un fichier sur ton serveur. Laisse-toi guider par les instructions.
Ton compte ayant été créé, login et clique sur « Outils pour Webmasters ». C’est là que le fun commence !
Je te conseille ensuite de créer un sitemap avec l’extension mentionnée dans mon message ci-dessus.
Ensuite, toujours à partir de la section « Outils pour Webmasters », tu pourras :
– Envoyer une requête à Google pour prendre en compte ton sitemap
– Générer un fichier robot.txt
– Enlever les URL qui ne sont plus valides
– et BEAUCOUP plus encoreAu fait, voici quelques commandes qui sont utiles. Tape-les dans la barre de recherche de Google (comme si tu effectuais une recherche) :
site:www.nomdetonsite (ceci te dit quelles pages de ton site sont indexées par Google)
cache:www.nomdetonsite (ceci te montre quelles pages de ton site sont mises en cache par Google)
info:www.nomdetonsite (ceci t’offre un aperçu général de ce que Google connait – et a fait – de ton site)Henry
3 octobre 2008 à 10 h 30 min #647108Merci Darloup
Effectivement j’ai déjà créé un compte google comme tu me l’as recommandé dans ton post 🙂
Par contre le robots.txt je l’ai créé à la mano est ce que c’est grave ?Mais est ce possible de désindexer/déreférencer l’url de mon sitemaps, qui puisqu’elle restera en place n’est pas « inactive »
3 octobre 2008 à 10 h 30 min #647109Si tu veux créer un sitemap manuellement, je te conseille le logiciel Cool Sitemapper http://sitemapper.free.fr/. Il est gratuit, en français, sans aucun bogue, et fonctionne parfaitement – c’est celui que j’utilise pour mes autres sites Web.
Mais l’avantage de l’extension http://wordpress.org/extend/plugins/karailievs-sitemap/ est que ton sitemap est automatiquement mis à jour à chaque fois que tu publies (ou modifies) un article ou un page.
De plus, à chaque fois que tu publies (ou modifies) un article ou une page, l’extension Karailliev envoie automatiquement un « ping » à Google pour l’informer du changement. Google revisite alors automatiquement ton blog pour prendre en compte le sitemap mis à jour.
Henry
3 octobre 2008 à 10 h 39 min #647110Nevs wrote:Merci Darloup
Par contre le robots.txt je l’ai créé à la mano est ce que c’est grave ?Pas du tout. Tu pourras tester le fichier robots.txt à partir des Outils pour les Webmasters.
Nevs wrote:Mais est ce possible de désindexer/déreférencer l’url de mon sitemaps, qui puisqu’elle restera en place n’est pas « inactive »Que je sache, mais je peux me tromper, l’URL des sitemaps n’est pas référencée par Google. Mais, au cas où elle le serait, tu ne dois pas la bloquer ! De toutes façons, il n’y a pas grand chose de confidentiel dedans !
Henry
3 octobre 2008 à 12 h 09 min #647111Salut Darloup 😉
En fait j’utilise l’extension Google sitemaps et il me semble qu’elle à les mêmes fonctionalités que l’extension que tu m’as donnée (et que j’ai testée sur mon blog de test). Par contre je t’assure que l’url de mon sitemaps a été référencée, fait une recherche sur google de sixmilli0nways et tu verras que le sitemaps y apparait oOEdit : il semble qu’à l’heure actuelle le sitemaps n’apparait plus lors de recherches google
-
AuteurMessages
- Vous devez être connecté pour répondre à ce sujet.