Comment indexé Blogger même bloqué par robots.txt ? [cause de l'avertissement]

 J'ai écrit ce message pour répondre à une question qui est assez souvent posée par les internautes de mon blog Le Buster , à savoir comment le problème des modifications indexés même si elles sont bloquées par robots.txt dans Google Search Console.

Ici j'ai non seulement exprimer clairement comment résoudre ce problème, mais aussi expliquer pourquoi ce problème peut survenir. L'espoir est bon sur, que mon ami comprenne mieux le fonctionnement des moteurs de recherche, en particulier Google.Directement au souci de la discussion 

Dans cet article vous allez apprendre les techniques pour comprendre comment Indexé même s'il est bloqué par robots.txt après avoir été notifié par Search Console Google

Vous recevez aussi souvent des notifications comme " Exception ",  " Indexé mais bloqué par les fichiers Robots.txt " etc, je reçois aussi souvent des notifications comme celle-ci, mon frère. Que je sois confus ou non, car si je supprime l'interdiction / la recherche, j'ai peur que la page de recherche soit indexée. Il y a donc beaucoup de pages d.erreur qui doivent être supprimées.

Espérons que maintenant ce n'est plus déroulant

Même si c'est un peu déroutant comment l'appliquer, ça donne le vertige. Enfin, le problème du robots.txt a été résolu, merci monsieur.

Cause de l'avertissement « Indexé même si bloqué par robots.txt »

Peut que beaucoup ne le savent pas, la principale cause de cet avertissement est que le moteur de recherche Google à ignorer la commande noindexe à l'aide du fichier robots.txt

pendant ce temps, les blogueurs utilisent toujours le fichier robots.txt pour empêcher de l'indexation de certaines pages dans les moteurs de recherche. 

Ces pages sont le page de recherche et la page d'étiquette. Fichier robots.txt par défaut de Blogger. Dans le fichier robots.txt est écrite la commande

Disallow: /search

Cette commande sert à dire aux moteurs de recherche de ne pas indexer les URL commençant par /search après l'adresse du blog.

Désormais, les URL commençant par /search dans Blogger sont utilisées pour les pages d'étiquettes elle est pas de recherche.

Exemple d'URL des page d'étiquette = https://www.lebuster.com/search/label/Produit

Exemple d'URL de page de recherche = https://www.lebuster.com/search?q=marketing

En plus de pages d'étiquettes et de recherches, les URL commençant par /search sont également utilisées pour afficher une liste de publications = https://www.lebuster.com/search?updated-max=2022-01-01T22:20:00:10:00&max-results=6

Voici encore un autre exemple d'URL à voir ci-dessous :

https://www.lebuster.com/search?updated-max=2020-06-26T12:23:00Z&max-results=8&reverse-paginate=true&start=8&by-date=false

Alors ceci est une URL compliquée pour certains blogueurs amateurs.

Alors, comment le résoudre ce problème ?

Indexé même s'il est bloqué par robots.txt sur Blogger, cause de l'avertissement


<script>mbtTOC();</script>
Il existe plusieurs méthodes qui peuvent être utilisées pour résoudre ce problème

1. Première voie

Le moyen le plus simple consiste à supprimer la commande Disallow: /search dans le fichier robots.txt à l'aide de la fonction personnalisée robots.txt dans Blogger

De cette façons, il peut se débarrasser de l'avertissement est bloqué par robots.txt dans la console de recherche Google

Mets le mauvais impact des pages d'étiquettes et de recherche peuvent toujours être indexé sur la page de recherche Google

En règle générale, nous ne souhaitons pas que les étiquettes et les page de recherche soient indexées sur les pages de recherche, car ces pages sont des pages de mauvaise qualité

2. Deuxième voie

la deuxième façon consiste à utiliser la balise d'en-tête robots pour dire à Google de ne pas indexer les pas d'étiquette et de recherche dans le moteur de recherche.

les moins le plus simple consiste à supprimer la commande Disallow: /search dans le fichier robots.txt à l'aide de la fonction personnalisée robots.txt dans Blogger

De cette façon, il peut se débarrasser de l'avertissement indexer même s'il est bloqué un robots.txt dans la console de recherche Google.

Mais les mauvais impact des pages d'étiquettes et de recherche peut toujours être indexé sur la page de recherche

règle générale, nous ne souhaitons pas que les étiquettes de la page de recherche soit indexées sur la page de de recherche, car ces pages sont des pages de mauvaise qualité

Actuellement, Google prend toujours en charge la balise d'en-tête robots, en d'autres termes, la balise d'en-tête robots n'est pas ignorée le fichier robots.txt

l'installation de cette balise d'en-tête de robot doit être effectué automatiquement en utilisant fonction "balise d'en-tête de robot spéciale" dans Blogger

Lorsque les lecteurs de mon blog le blogueur pose des questions sur ce problème, Zeller dit généralement de définir le paramètre #balise d'en-tête de robot personnalisée#

Mais pour une raison quelconque, la dernière fois que j'ai vérifié #la fonction balise est spécial d'en-tête des robots sur le blogueur#, c'est la mer fonctionnait plus comme il se doit. Désormais, les balises d'en-tête du robot noindex apparaissent automatiquement sur les pages d'archives, d'étiquettes et le recherche

comme cette méthode ne fonctionne plus, l'alternative peut être désinstaller la balise meta robot directement dans le modèle des blogs Blogger BlogSpot.

« Comment faites-vous, monsieur ? »
Copiez simplement le code ci-dessous 
<!-- Meta Robot -->
<b:if cond='data:view.isSearch or data:view.isArchive'>
    <meta content='noindex, noarchive' name='robots'/>
</b:if>
Placez le code juste en dessous du code   <head> dans le modèle de votre blog.
Dans cette image vous allez voir les activations des cases ci-dessous :

Activez "Balises robots personnalisées pour la page d'accueil"
Voir l'image ci-dessous :

Indexé même s'il est bloqué par robots.txt pour les blogs Blogger


L'étape suivante, vous devez également supprimer la commande Disallow: /search dans le fichier robots.txt

Activez les "Tags robots personnalisées pour les articles et les pages" :
Voir l'image ci-dessous :

Indexé même s'il est bloqué par robots.txt pour les blogs Blogger


Parce que si la commande Disallow: /search n'est pas supprimée, les robots Google pas lire les commandes de la balise meta robots pré-installée

Pour savoir comment supprimer, accéder au tableau de bord de votre blog Blogger
Allez aux  aux » Paramètres » Crawler et Indexation » "Activer la fonction Robots.txt personnalisée  
 Et enfin activez ces cases ci-dessous

Activez  "Balise robots personnalisées pour la page d'accueil
Voici image de la capture d'écran ci-dessous

Activez "Balises robots personnalisées pour la page d'accueil"
Voir l'image ci-dessous :
Indexé même s'il est bloqué par robots.txt pour les blogs Blogger

Fichier robots.txt personnalisé
User-agent: Mediapartners-Google Disallow: User-agent: * Allow: / Sitemap: https://www.lebuster.com/sitemap.xml
Activez les balises d'en-tête robots personnalisée
Activez "Balises robots personnalisées pour les pages d'archives et de recherche
Voir l'image ci-dessous :

Indexé même s'il est bloqué par robots.txt pour les blogs Blogger

Cliquez sur Custom robots.txt ,  puis entrez ce code ci-dessous
 User-agent: Mediapartners-Google Disallow: User-agent: * Allow: / Sitemap: https://www.lebuster.com/sitemap.xml
Remarque : remplacez www.lebuster.com par l'adresse de votre blog
N'oubliez pas de cliquer sur le bouton Enregistrer pour apporter une modification à votre blog.

Si vous avez apporté des modifications, n'oubliez pas de cliquer sur le bouton " Réparer la validation " sur le tableau de bord de la Search Console. Après cela, attendez que la notification " Indexé même si bloqué par robots.txt "  disparaisse

Quelques autres messages de notification

En plus de la notification, "indexé et même si bloqué par robots.txt"; il est presque certain que dans google Search Console d'autres notifications apparaissent également

Les notifications autres que"Indexé même s'il est bloqué par robots.txt" ne sont généralement pas des avertissements. Cela signifie que même si laisse seul, ce n'est pas un problème.
En fait, il vaut mieux te laisser tranquille

Anomalie d'exploration

Cette notification apparaît généralement car il existe une URL de publication il a été initialement indexée dans les moteurs de recherche mais a été supprimé sur le blog.
Comment le résoudre, monsieur ?
Il peut être laissé seul aussi vous n'êtes pas à l'aise, vous pouvez il est divisé l'URL de la publication d'erreur vers une autre publication en utilisant la fonction de Redirection spéciale dans les blogs Blogger
Comment utiliser la fonction de redirection spéciale peut être lu ici dans ce blog

Exploré – pas actuellement indexé

Cette notification apparaît généralement il existe une URL des flux RSS qui ne s'affiche pas dans les résultats de recherche
Comment le résoudre, monsieur ?
Vérifiez la liste des URL qui reçoivent cette notification. Si la plupart sont de URL de flux RSS, laissez-le tranquillement
Voici un exemple d'URL de flux RSS ci-dessous :
https://www.lebuster.com/feeds/postes/default
Voici un exemple d'URL de flux RSS pour les commentaires :
https://www.lebuster.com/feeds/123456789987654321/comments/default

Pages alternatives avec des balises canoniques appropriée

Cette notification apparaît car il existe une version mobile de l'URL avec les paramètres ?m=1 dernière l'URL

Lorsque vous accédez à votre blog via un appareil mobile, derrière l'URL, il y aura un paramètre supplémentaire ?m=1 automatiquement dans le navigateur mobile de votre appareil pour mobile.
Dans Blogger, ajouter automatiquement une balise canonique (canonique) sur la page / la publication avec le paramètre ?m=1

Cette balise canonique indique essentiellement aux moteurs de recherche que l'URL avec l'ajout de ?m=1 et celle sans l'ajout est la même page / poste, donc cela ne provoque pas de contenu en double.
Comment le résoudre, monsieur ?
C'est normal, laisse faire

Et autres notifications

Des nombreuses autres notifications apparaissent sur Google Search console.
Cependant, la plupart de ses notifications n'est-ce pas des avertissements

Tant que la notification n'est pas un avertissement ou un avertissement des notifications, vous n'avez pas besoin des trop vous inquiétez.
Laissez-le comme il est
Que être seulement jusqu'ici mon message de publication cette fois-ci

Explication en résumé

Exception = la page ne s'affiche pas dans les résultats de recherche Google
Indexé même si bloqué par robots.txt =  La page s'affiche dans les résultats de recherche mais avec une erreur, aucune meta description en raison de la raison du blocage de robots.txt.

Cet article ne traite spécifiquement que du problème "Indexé même s'il est bloqué par robots.txt " dans GSC, et non d'une discussion complete sur les notifications de GSC 
Si vous avez des questions, s'il vous plaît merci dans un commentaire.

Nous espérons que vous apprécierez les changements que nous avons apportés !
Merci.

Commentaires

Steven a dit…
https://www.lebuster.com/2022/12/indexer-blogger-meme-bloque-robts.xt.html?lr=1&m=1
Steven a dit…
7 meilleures idées de revenus passifs pour gagner de l'argent en 2023

Lien : https://flux00tech.blogspot.com/2022/12/7-meilleures-idees-de-revenus-passifs.html
Abdoulaye Tolo a dit…
Merci de votre commentaire