Problème d’indexation google (Créer un compte)

  • Statut : non résolu
15 sujets de 1 à 15 (sur un total de 31)
  • Auteur
    Messages
  • #463465
    Nevs
    Membre
    Initié WordPress
    39 contributions

    Bonjour,

    Ma configuration WP actuelle
    – Version de WordPress : 2.6.2
    – Thème utilisé : Freshy
    – Plugins en place : Akismet, All In One SEO, Cforms II, Google Sitemaps, Statpress, TinyMCE advanced
    – Nom de l’hebergeur : free.fr
    – Adresse du site : http://Sixmilli0nways.free.fr/

    Problème(s) rencontré(s) :

    Salut à tous

    Je voudrais vous demander une petite confirmation. Lorsque je vais dans mon compte google pour webmaster, google me dit qu’il voit bien mon sitemaps et ses liens, mais qu’il en a indexé aucun.

    Voilà mon fichiers sitemaps

    URL	Priority	Change Frequency	LastChange
    http://sixmilli0nways.free.fr/blog/ 100% Daily 2008-09-26 10:26
    http://sixmilli0nways.free.fr/blog/index.php/2008/09/24/joyeux-anniversaire-fedora 60% Monthly 2008-09-26 10:26
    http://sixmilli0nways.free.fr/blog/index.php/2008/09/23/bienvenue 60% Monthly 2008-09-25 09:33
    http://sixmilli0nways.free.fr/blog/index.php/a-propos 60% Weekly 2008-08-17 16:00
    http://sixmilli0nways.free.fr/blog/index.php/category/blog 30% Weekly
    http://sixmilli0nways.free.fr/blog/index.php/category/fedora 30% Weekly
    http://sixmilli0nways.free.fr/blog/index.php/2008/09 30% Daily 2008-09-24 07:40

    Quant à mon fichier robots.txt proposé testé avec les outils webmaster google, il devrait permettre l’indexation des deux sujets et de la racine du blog, mais pas le reste. Hors absolument rien n’est référencé.

    Voilà le fichier robots.txt

    Sitemap: http://sixmilli0nways.free.fr/blog/sitemap.xml
    User-agent: Googlebot
    User-agent: Yahoo
    User-agent: Msnbot
    Disallow: /robots.txt
    Disallow: /index.html
    Disallow: /blog/wp-*
    Disallow: /blog/index.php/category
    Disallow: /blog/index.php/tag
    Disallow: /blog/index.php/a-propos
    Disallow: /blog/index.php/contact
    Disallow: /blog/index.php/2008$
    Disallow: /blog/index.php/2008/*$
    Disallow: /blog/index.php/2008/*/*$
    Allow: /blog/index.php/2008/*/*/*$
    Disallow: /blog/index.php/2009$
    Disallow: /blog/index.php/2009/*$
    Disallow: /blog/index.php/2009/*/*$
    Allow: /blog/index.php/2009/*/*/*$
    Disallow: /blog/index.php/2010$
    Disallow: /blog/index.php/2010/*$
    Disallow: /blog/index.php/2010/*/*$
    Allow: /blog/index.php/2010/*/*/*$
    Disallow: /blog/index.php/feed
    Disallow: /blog/index.php/comments/feed
    Disallow: /blog/index.php/*/*/*/*/trackback
    Disallow: /blog/index.php/*/*/*/*/feed
    User-agent: *
    Disallow: /robots.txt
    Disallow: /index.html
    Disallow: /blog/wp-admin
    Disallow: /blog/wp-content
    Disallow: /blog/wp-includes
    Disallow: /blog/wp-login
    Disallow: /blog/index.php/category
    Disallow: /blog/index.php/tag
    Disallow: /blog/index.php/a-propos
    Disallow: /blog/index.php/contact
    Disallow: /blog/index.php/feed
    Disallow: /blog/index.php/comments/feed

    Ce qui me perturbe c’est que lorsque je l’ai testé avec les outils webmaster, il était censé permettre l’indexation des sujets.

    Est ce que vous pourriez me donner un petit coup de main siouplé ?

    #647098
    Didier-63
    Participant
    Chevalier WordPress
    150 contributions

    Bonjour, il faut du temps avant que ton site soit indexé et mettre des articles, dela dépend environ 3 semaines, pour ta page robots.txt enlève « dissalow » désindexation d’une URL

    Fait juste

    User-Agent: *
    Allow: /

    Ceci dans un premier temps, car je n’ai pas regardé en détail

    #647099
    Nevs
    Membre
    Initié WordPress
    39 contributions

    Bonjour Didier-63 et merci pour ta réponse
    Pourquoi faut il que le fichier robots.txt soit indexé (enlever le disallow a l’url du robots.txt ?)
    Sinon oui effectivement je vais mettre des Allow sur / et /blog/ :D

    #647101
    Didier-63
    Participant
    Chevalier WordPress
    150 contributions

    Je reprends tu fais ta page robots.txt:

    User-Agent: *
    Allow: /

    C’est tout, et ensuite pourquoi il y deux sites identiques? sauf o 0
    Et attend pour l’indexation

    #647102
    Nevs
    Membre
    Initié WordPress
    39 contributions

    D’accord, effectivement j’avais compris un peu de travers :D
    Je vais modifier le robots.txt . ESt ce que tu penses qu’il faut autoriser / et /blog/

    #647103
    Olivier
    Participant
    Maître WordPress
    1415 contributions

    effectivement, le Disallow: /robots.txt, je sais pas où tu l’as pêché mais j’ai jamais vu cela…
    pour le reste, autorise tout…
    si tu veux faire du bidouillage de robots.txt, jette un oeil ici :
    http://www.lautre-monde.fr/webtech/robotstxt-optimise-pour-wordpress/

    #647104
    Nevs
    Membre
    Initié WordPress
    39 contributions

    Bah le disallow: robots.txt c’était juste pour ne pas référencer mon robots.txt. Sur mon blog de test, j’avais eu la surprise de retrouver sur google l’adresse de mon robots.txt en cherchant mon site. Sinon selon toi il faut autoriser l’indexation des catégories et des tags ? J’ai pas vu beaucoup de blog qui laissaient indexer ce genre de choses 😳

    Edit : sur le lien que tu m’as donné, il dit que l’indexation est bloquée par All In One SEO oO . Je ne comprends pas bien ? C’est à cause de l’option noindex ? (le code source m’indique

    )

    Excusez moi de vous demander tout ça, mais je crois qu’une fois que c’est référencé c’est assez dur de le déréférencer

    #647100
    Olivier
    Participant
    Maître WordPress
    1415 contributions

    Il y a bcp d’avis divergents sur le fait d’index ou non les catégories. Au départ, je ne les indexais pas puis j’ai changé d’avis, à présent, j’ai passé en allow les catégories.

    Pour les archives, cela ne présente pas grand intérêt de les indexer car leur contenu n’est pas ordonné (dans les catégories, au moins, les articles sont sur le même sujet).

    En outre, je te conseille d’utiliser les extraits de notes pour les archives et catégories afin d’éviter le duplicate content.

    Le noindex permet d’éviter que la page soit indexée. Si elle est déjà indexée, pour la retirer de l’index, il faut mettre le noindex, bloquer l’accès avec le robots.txt en passant en Disallow puis enfin aller dans le google webmaster tools et demander le retrait de la page et ensuite il faut attendre…

    Pour faire court, je te conseille de bloquer les répertoires contenant les fichiers php de l’admin, cela ne présente aucun intérêt de les indexer…

    Pour le reste, à toi de voir ce que tu préfères…

    #647105
    Darloup
    Participant
    Chevalier WordPress
    220 contributions

    Le délai d’indexation par Google est complètement aléatoire…

    Mon blog a été indexé (je parle d’indexation, pas de rérérencement) en 24 heures…

    Le site Web que j’ai créé pour ma petite amie n’est toujours pas indexé – après plus de 2 semaines…

    Puis je te conseiller un excellent (mais méconnu) plugin (extension) pour créer une sitemap ? Il est anglais, et fonctionne parfaitement et n’est pas une usine à gaz (contrairement à certains autres).

    Essaie : http://wordpress.org/extend/plugins/karailievs-sitemap/

    Ce plugin est malheureusement trop méconnu, mais il est PARFAIT pour un blog sous WP.

    Henry

    #647106
    Nevs
    Membre
    Initié WordPress
    39 contributions

    Bonjour Darloup et Olivier et merci pour vos réponses
    Ça va être compliqué mais je vais finir par y arriver. Ce matin j’ai eu la surprise de voir que l’url de mon sitemaps était référencé sur google, alors que j’aurais préféré qu’il n’y soit pas : au moins ça permettra de tester la méthode de désindexation (mais comment désindexer une url qui n’est pas une page web à proprement parler, puisqu’il s’agit ici d’un fichier xml ?). D’ailleurs petite question bête, c’est quoi la différence entre indexation et référencement ? oO

    Pour le fait d’indexer les catégories je pensais que ça pouvait poser des problèmes, mais peut être est ce que ça aide aussi à référencer plus vite les articles aussi non ?

    Olivier tu me parles des extraits de notes ? De quoi s’agit ?

    #647107
    Darloup
    Participant
    Chevalier WordPress
    220 contributions

    Le référencement veut dire que ton site est « trouvable » en effectuant une recherche sur Google avec des mots clés. L’indexation veut dire que Google a effectivement mis plusieurs pages de ton site dans son index principal (et, eventuellement, en cache).

    La première chose que tu dois faire est de créer un compte Google – c’est gratuit, et tu fais cela ici : https://www.google.com/accounts/ManageAccount

    Une fois ton compte ouvert, il te faut valider ton site. C’est à dire prouver à Google que tu en es bien le propriétaire. Tu devras soit placer un code sur la page index.php, soit télécharger un fichier sur ton serveur. Laisse-toi guider par les instructions.

    Ton compte ayant été créé, login et clique sur « Outils pour Webmasters ». C’est là que le fun commence !

    Je te conseille ensuite de créer un sitemap avec l’extension mentionnée dans mon message ci-dessus.

    Ensuite, toujours à partir de la section « Outils pour Webmasters », tu pourras :

    – Envoyer une requête à Google pour prendre en compte ton sitemap
    – Générer un fichier robot.txt
    – Enlever les URL qui ne sont plus valides
    – et BEAUCOUP plus encore

    Au fait, voici quelques commandes qui sont utiles. Tape-les dans la barre de recherche de Google (comme si tu effectuais une recherche) :

    site:www.nomdetonsite (ceci te dit quelles pages de ton site sont indexées par Google)
    cache:www.nomdetonsite (ceci te montre quelles pages de ton site sont mises en cache par Google)
    info:www.nomdetonsite (ceci t’offre un aperçu général de ce que Google connait – et a fait – de ton site)

    Henry

    #647108
    Nevs
    Membre
    Initié WordPress
    39 contributions

    Merci Darloup
    Effectivement j’ai déjà créé un compte google comme tu me l’as recommandé dans ton post 🙂
    Par contre le robots.txt je l’ai créé à la mano est ce que c’est grave ?

    Mais est ce possible de désindexer/déreférencer l’url de mon sitemaps, qui puisqu’elle restera en place n’est pas « inactive »

    #647109
    Darloup
    Participant
    Chevalier WordPress
    220 contributions

    Si tu veux créer un sitemap manuellement, je te conseille le logiciel Cool Sitemapper http://sitemapper.free.fr/. Il est gratuit, en français, sans aucun bogue, et fonctionne parfaitement – c’est celui que j’utilise pour mes autres sites Web.

    Mais l’avantage de l’extension http://wordpress.org/extend/plugins/karailievs-sitemap/ est que ton sitemap est automatiquement mis à jour à chaque fois que tu publies (ou modifies) un article ou un page.

    De plus, à chaque fois que tu publies (ou modifies) un article ou une page, l’extension Karailliev envoie automatiquement un « ping » à Google pour l’informer du changement. Google revisite alors automatiquement ton blog pour prendre en compte le sitemap mis à jour.

    Henry

    #647110
    Darloup
    Participant
    Chevalier WordPress
    220 contributions
    Nevs wrote:
    Merci Darloup
    Par contre le robots.txt je l’ai créé à la mano est ce que c’est grave ?

    Pas du tout. Tu pourras tester le fichier robots.txt à partir des Outils pour les Webmasters.

    Nevs wrote:
    Mais est ce possible de désindexer/déreférencer l’url de mon sitemaps, qui puisqu’elle restera en place n’est pas « inactive »

    Que je sache, mais je peux me tromper, l’URL des sitemaps n’est pas référencée par Google. Mais, au cas où elle le serait, tu ne dois pas la bloquer ! De toutes façons, il n’y a pas grand chose de confidentiel dedans !

    Henry

    #647111
    Nevs
    Membre
    Initié WordPress
    39 contributions

    Salut Darloup 😉
    En fait j’utilise l’extension Google sitemaps et il me semble qu’elle à les mêmes fonctionalités que l’extension que tu m’as donnée (et que j’ai testée sur mon blog de test). Par contre je t’assure que l’url de mon sitemaps a été référencée, fait une recherche sur google de sixmilli0nways et tu verras que le sitemaps y apparait oO

    Edit : il semble qu’à l’heure actuelle le sitemaps n’apparait plus lors de recherches google

15 sujets de 1 à 15 (sur un total de 31)
  • Vous devez être connecté pour répondre à ce sujet.