Notification texts go here Contact Us Buy Now!

Indexé même s'il est bloqué par robots.txt sur Blogger, cause de l'avertissement

Comment réindexé son Blog sur les moteurs de recherche et Indexé même s'il est bloqué par robots.txt pour les blogs sur Blogger de BlogSpot ?

 J'ai écrit ce message pour répondre à une question qui est assez souvent posée par les internautes de mon blog Le Buster , à savoir comment le problème des modifications indexés même si elles sont bloquées par robots.txt dans Google Search Console.

Ici j'ai non seulement exprimer clairement comment résoudre ce problème, mais aussi expliquer pourquoi ce problème peut survenir. L'espoir est bon sur, que mon ami comprenne mieux le fonctionnement des moteurs de recherche, en particulier Google.Directement au souci de la discussion 

    Dans cet article vous allez apprendre les techniques pour comprendre comment Indexé même s'il est bloqué par robots.txt après avoir été notifié par Search Console Google

    Vous recevez aussi souvent des notifications comme " Exception ",  " Indexé mais bloqué par les fichiers Robots.txt " etc, je reçois aussi souvent des notifications comme celle-ci, mon frère. Que je sois confus ou non, car si je supprime l'interdiction / la recherche, j'ai peur que la page de recherche soit indexée. Il y a donc beaucoup de pages d.erreur qui doivent être supprimées.

    Espérons que maintenant ce n'est plus déroulant

    Même si c'est un peu déroutant comment l'appliquer, ça donne le vertige. Enfin, le problème du robots.txt a été résolu, merci monsieur.

    Cause de l'avertissement « Indexé même si bloqué par robots.txt »

    Peut que beaucoup ne le savent pas, la principale cause de cet avertissement est que le moteur de recherche Google à ignorer la commande noindexe à l'aide du fichier robots.txt

    pendant ce temps, les blogueurs utilisent toujours le fichier robots.txt pour empêcher de l'indexation de certaines pages dans les moteurs de recherche. 

    Ces pages sont le page de recherche et la page d'étiquette. Fichier robots.txt par défaut de Blogger. Dans le fichier robots.txt est écrite la commande

    Disallow: /search

    Cette commande sert à dire aux moteurs de recherche de ne pas indexer les URL commençant par /search après l'adresse du blog.

    Désormais, les URL commençant par /search dans Blogger sont utilisées pour les pages d'étiquettes elle est pas de recherche.

    Exemple d'URL des page d'étiquette = https://www.lebuster.com/search/label/Produit

    Exemple d'URL de page de recherche = https://www.lebuster.com/search?q=marketing

    En plus de pages d'étiquettes et de recherches, les URL commençant par /search sont également utilisées pour afficher une liste de publications = https://www.lebuster.com/search?updated-max=2022-01-01T22:20:00:10:00&max-results=6

    Voici encore un autre exemple d'URL à voir ci-dessous :

    https://www.lebuster.com/search?updated-max=2020-06-26T12:23:00Z&max-results=8&reverse-paginate=true&start=8&by-date=false

    Alors ceci est une URL compliquée pour certains blogueurs amateurs.

    Alors, comment le résoudre ce problème ?

    Indexé même s'il est bloqué par robots.txt sur Blogger, cause de l'avertissement


    Il existe plusieurs méthodes qui peuvent être utilisées pour résoudre ce problème

    1. Première voie

    Le moyen le plus simple consiste à supprimer la commande Disallow: /search dans le fichier robots.txt à l'aide de la fonction personnalisée robots.txt dans Blogger

    De cette façons, il peut se débarrasser de l'avertissement est bloqué par robots.txt dans la console de recherche Google

    Mets le mauvais impact des pages d'étiquettes et de recherche peuvent toujours être indexé sur la page de recherche Google

    En règle générale, nous ne souhaitons pas que les étiquettes et les page de recherche soient indexées sur les pages de recherche, car ces pages sont des pages de mauvaise qualité

    2. Deuxième voie

    la deuxième façon consiste à utiliser la balise d'en-tête robots pour dire à Google de ne pas indexer les pas d'étiquette et de recherche dans le moteur de recherche.

    les moins le plus simple consiste à supprimer la commande Disallow: /search dans le fichier robots.txt à l'aide de la fonction personnalisée robots.txt dans Blogger

    De cette façon, il peut se débarrasser de l'avertissement indexer même s'il est bloqué un robots.txt dans la console de recherche Google.

    Mais les mauvais impact des pages d'étiquettes et de recherche peut toujours être indexé sur la page de recherche

    règle générale, nous ne souhaitons pas que les étiquettes de la page de recherche soit indexées sur la page de de recherche, car ces pages sont des pages de mauvaise qualité

    Actuellement, Google prend toujours en charge la balise d'en-tête robots, en d'autres termes, la balise d'en-tête robots n'est pas ignorée le fichier robots.txt

    l'installation de cette balise d'en-tête de robot doit être effectué automatiquement en utilisant fonction "balise d'en-tête de robot spéciale" dans Blogger

    Lorsque les lecteurs de mon blog le blogueur pose des questions sur ce problème, Zeller dit généralement de définir le paramètre #balise d'en-tête de robot personnalisée#

    Mais pour une raison quelconque, la dernière fois que j'ai vérifié #la fonction balise est spécial d'en-tête des robots sur le blogueur#, c'est la mer fonctionnait plus comme il se doit. Désormais, les balises d'en-tête du robot noindex apparaissent automatiquement sur les pages d'archives, d'étiquettes et le recherche

    comme cette méthode ne fonctionne plus, l'alternative peut être désinstaller la balise meta robot directement dans le modèle des blogs Blogger BlogSpot.

    « Comment faites-vous, monsieur ? »
    Copiez simplement le code ci-dessous 
    <!-- Meta Robot -->
    <b:if cond='data:view.isSearch or data:view.isArchive'>
        <meta content='noindex, noarchive' name='robots'/>
    </b:if>
    Placez le code juste en dessous du code   <head> dans le modèle de votre blog.
    Dans cette image vous allez voir les activations des cases ci-dessous :

    Activez "Balises robots personnalisées pour la page d'accueil"
    Voir l'image ci-dessous :

    Indexé même s'il est bloqué par robots.txt pour les blogs Blogger


    L'étape suivante, vous devez également supprimer la commande Disallow: /search dans le fichier robots.txt

    Activez les "Tags robots personnalisées pour les articles et les pages" :
    Voir l'image ci-dessous :

    Indexé même s'il est bloqué par robots.txt pour les blogs Blogger


    Parce que si la commande Disallow: /search n'est pas supprimée, les robots Google pas lire les commandes de la balise meta robots pré-installée

    Pour savoir comment supprimer, accéder au tableau de bord de votre blog Blogger
    Allez aux  aux » Paramètres » Crawler et Indexation » "Activer la fonction Robots.txt personnalisée  
     Et enfin activez ces cases ci-dessous

    Activez  "Balise robots personnalisées pour la page d'accueil
    Voici image de la capture d'écran ci-dessous

    Activez "Balises robots personnalisées pour la page d'accueil"
    Voir l'image ci-dessous :
    Indexé même s'il est bloqué par robots.txt pour les blogs Blogger

    Fichier robots.txt personnalisé
    User-agent: Mediapartners-Google Disallow: User-agent: * Allow: / Sitemap: https://www.lebuster.com/sitemap.xml
    Activez les balises d'en-tête robots personnalisée
    Activez "Balises robots personnalisées pour les pages d'archives et de recherche
    Voir l'image ci-dessous :

    Indexé même s'il est bloqué par robots.txt pour les blogs Blogger

    Cliquez sur Custom robots.txt ,  puis entrez ce code ci-dessous
     User-agent: Mediapartners-Google Disallow: User-agent: * Allow: / Sitemap: https://www.lebuster.com/sitemap.xml
    Remarque : remplacez www.lebuster.com par l'adresse de votre blog
    N'oubliez pas de cliquer sur le bouton Enregistrer pour apporter une modification à votre blog.

    Si vous avez apporté des modifications, n'oubliez pas de cliquer sur le bouton " Réparer la validation " sur le tableau de bord de la Search Console. Après cela, attendez que la notification " Indexé même si bloqué par robots.txt "  disparaisse

    Quelques autres messages de notification

    En plus de la notification, "indexé et même si bloqué par robots.txt"; il est presque certain que dans google Search Console d'autres notifications apparaissent également

    Les notifications autres que"Indexé même s'il est bloqué par robots.txt" ne sont généralement pas des avertissements. Cela signifie que même si laisse seul, ce n'est pas un problème.
    En fait, il vaut mieux te laisser tranquille

    Anomalie d'exploration

    Cette notification apparaît généralement car il existe une URL de publication il a été initialement indexée dans les moteurs de recherche mais a été supprimé sur le blog.
    Comment le résoudre, monsieur ?
    Il peut être laissé seul aussi vous n'êtes pas à l'aise, vous pouvez il est divisé l'URL de la publication d'erreur vers une autre publication en utilisant la fonction de Redirection spéciale dans les blogs Blogger
    Comment utiliser la fonction de redirection spéciale peut être lu ici dans ce blog

    Exploré – pas actuellement indexé

    Cette notification apparaît généralement il existe une URL des flux RSS qui ne s'affiche pas dans les résultats de recherche
    Comment le résoudre, monsieur ?
    Vérifiez la liste des URL qui reçoivent cette notification. Si la plupart sont de URL de flux RSS, laissez-le tranquillement
    Voici un exemple d'URL de flux RSS ci-dessous :
    https://www.lebuster.com/feeds/postes/default
    Voici un exemple d'URL de flux RSS pour les commentaires :
    https://www.lebuster.com/feeds/123456789987654321/comments/default

    Pages alternatives avec des balises canoniques appropriée

    Cette notification apparaît car il existe une version mobile de l'URL avec les paramètres ?m=1 dernière l'URL

    Lorsque vous accédez à votre blog via un appareil mobile, derrière l'URL, il y aura un paramètre supplémentaire ?m=1 automatiquement dans le navigateur mobile de votre appareil pour mobile.
    Dans Blogger, ajouter automatiquement une balise canonique (canonique) sur la page / la publication avec le paramètre ?m=1

    Cette balise canonique indique essentiellement aux moteurs de recherche que l'URL avec l'ajout de ?m=1 et celle sans l'ajout est la même page / poste, donc cela ne provoque pas de contenu en double.
    Comment le résoudre, monsieur ?
    C'est normal, laisse faire

    Et autres notifications

    Des nombreuses autres notifications apparaissent sur Google Search console.
    Cependant, la plupart de ses notifications n'est-ce pas des avertissements

    Tant que la notification n'est pas un avertissement ou un avertissement des notifications, vous n'avez pas besoin des trop vous inquiétez.
    Laissez-le comme il est
    Que être seulement jusqu'ici mon message de publication cette fois-ci

    Explication en résumé

    Exception = la page ne s'affiche pas dans les résultats de recherche Google
    Indexé même si bloqué par robots.txt =  La page s'affiche dans les résultats de recherche mais avec une erreur, aucune meta description en raison de la raison du blocage de robots.txt.

    Cet article ne traite spécifiquement que du problème "Indexé même s'il est bloqué par robots.txt " dans GSC, et non d'une discussion complete sur les notifications de GSC 
    Si vous avez des questions, s'il vous plaît merci dans un commentaire.

    Nous espérons que vous apprécierez les changements que nous avons apportés !
    Merci.

    Getting Info...

    About the Author

    Je suis webmaster blogueur passionné par le web et aime partager le marketing de contenus et sa passion avec ses lecteurs en retour.

    Enregistrer un commentaire

    Cookie Consent
    We serve cookies on this site to analyze traffic, remember your preferences, and optimize your experience.
    Oops!
    It seems there is something wrong with your internet connection. Please connect to the internet and start browsing again.
    AdBlock Detected!
    We have detected that you are using adblocking plugin in your browser.
    The revenue we earn by the advertisements is used to manage this website, we request you to whitelist our website in your adblocking plugin.