Comment réparer bloqué en raison d'une demande non autorisée (401) Question

Comment réparer bloqué en raison d'une demande non autorisée (401) Question

Avez-vous déjà rencontré une erreur "Blocked" en raison d'une requête non autorisée (401)" dans Google Search Console ? Cette erreur frustrante peut empêcher votre site Web d'être indexé par Google, qui peut avoir un impact significatif sur votre trafic de recherche. Mais ne t'inquiète pas, il y a des moyens de le réparer !

Bloqué en raison de la demande non autorisée 401

Que signifie l'erreur?

Une erreur (401) d'erreur (Blocked) indique que Googlebot, le moteur de recherche pour Google, est bloqué d'accéder à certaines pages de votre site Web.

Cela peut se produire pour quelques raisons, telles que:

Protection par mot de passe: Si votre site nécessite un mot de passe pour accéder à certaines pages, Googlebot n'est pas en mesure de les ramper.

Restrictions à la propriété intellectuelle: Si vous avez des restrictions en place qui bloquent certaines adresses IP, vous pouvez bloquer Googlebot par inadvertance.

Erreurs d'authentification & #160;: Il peut y avoir un problème avec le processus d'authentification de votre site Web qui empêche Googlebot de se connecter.

Comment réparer

La solution à cette erreur dépend de si vous voulez que Google indexe les pages affectées. Voici quelques options :

Permettre à Googlebot d'indexer les pages

Si vous voulez que Google indexe les pages, vous devrez modifier les paramètres de votre site web pour permettre l'accès à Googlebot. Voici comment:

Étape 1: Vérifier l'erreur dans GSC

  1. Aller à Google Search Console → Pages
  2. Cliquez sur Bloqué en raison d'une demande non autorisée (401)
  3. Notez les URLs affectées
  4. Cliquez sur Inspecter l'URLsur un exemple d'URL pour voir quand Google a essayé de ramper

Étape 2: Testez l'URL vous-même

Dans votre navigateur :

  1. Ouvrir une fenêtre incognito/privée
  2. Visitez l'URL affectée
  3. Vous voyez une adresse de connexion ou une page d'erreur 401 ?

Utilisation de cURL (pour les utilisateurs techniques):

curl -I https://yoursite.com/affected-page

Cherchez :

HTTP/1.1 401 Unauthorized
WWW-Authenticate: Basic realm="Restricted Area"

Utilisation des outils en ligne :

 Vérificateur de code d'état HTTP Saisissez votre URL et vérifiez si elle retourne 401

Étape 3: Vérification de la protection par mot de passe

Si vos pages sont protégées par mot de passe, vous devrez supprimer la protection par mot de passe. Cette approche est idéale si le contenu restreint offre de la valeur aux chercheurs. Cependant, l'affichage de contenu différent pour Googlebot que pour les utilisateurs humains est considéré couvertureet peut violer les directives du webmaster de Google.

WordPress :

  1. Aller à Paramètres → Lecture
  2. Vérifiez si Visibilité du moteur de rechercheest activé (devrait être vérifié par l ' ONU)
  3. Vérifiez si vous utilisez un plugin à venir bientôt / entretien
  4. Vérifier les pages individuelles : Modifier la page → Attributs de page → Protection des mots de passe

Magasiner :

  1. Aller à la boutique en ligne → Préférences
  2. Vérification Protection par mot de passerubrique
  3. S'assurer qu'il est désactivé pour les pages publiques

cNiveau/Serveur:

  1. Vérifiez .htpasswd fichiers dans les répertoires touchés
  2. Révision .haccèspour les règles d'authentification:
AuthType Basic
AuthName "Restricted Area"
AuthUserFile /path/to/.htpasswd
Require valid-user

Étape 4: Inspecter les paramètres du plugin de sécurité

De nombreux plugins de sécurité bloquent Googlebot accidentellement. Vérifiez ceci:

Wordfence (WordPress) :
  1. Aller à Wordfence → Pare-feu → Toutes les options pare-feu
  2. Faites défiler vers Règles de limitation des taux
  3. Assurez-vous que Googlebot n'est pas bloqué
  4. Vérifiez Wordfence → Outils → Whois → Entrez Googlebot IP
  5. Vérifier qu'il n'y a pas de liste noire
iThemes Security (WordPress) :
  1. Aller à Sécurité → Paramètres → 404 Détection
  2. Assurer Ignorer les erreurs 404 des utilisateurs connectésest activé
  3. Vérifier la sécurité → Paramètres → Réseau Brute Force
  4. La liste blanche des gammes IP de Google
Nuageflare:
  1. Connectez-vous au tableau de bord Cloudflare
  2. Aller à Sécurité → WAF
  3. Vérifier les règles qui bloquent les agents utilisateurs
  4. Examen des événements pare-feu pour les blocs Googlebot

Étape 5: Vérifier les journaux des serveurs

Apache :
tail -f /var/log/apache2/error.log | grep 401
Nginx:
tail -f /var/log/nginx/error.log | grep 401

Recherchez les entrées montrant les demandes Googlebot refusées.

Étape 6: Tester comme Googlebot

Utilisez l'outil d'inspection URL :

  1. Aller à Google Search Console
  2. Saisissez l'URL touchée
  3. Cliquez sur Tester l'URL en direct
  4. Cliquez sur Affichage Page testée→ Capture d'écran
  5. Comparer ce que Googlebot voit vs ce que vous voyez

Si Googlebot voit une page de connexion mais que vous n'avez pas, vous avez trouvé votre problème.

URL de test en direct

Utiliser le balisage schéma pour le contenu payant : Si supprimer les restrictions d'accès n'est pas une option, vous pouvez signaler à Google la nature de votre contenu restreint. Utilisation balisage schéma pour le contenu payant pour fournir à Google des détails sur le contenu derrière le paywall. Cela aide Google à comprendre la valeur de contenu sans réellement y accéder.

Revoir vos restrictions de PI : Si vous avez des restrictions IP en place, assurez-vous que les adresses IP de Googlebots ne sont pas bloquées. Vous pouvez trouver une liste d'adresses IP de Googlebots sur le site d'aide de Google.

Correction des erreurs d'authentification & #160;: Si vous soupçonnez qu'il y a un problème avec le processus d'authentification de votre site web, vous devrez résoudre le problème et le corriger.

Bloquer Googlebot à partir de l'indexation des pages

Si vous ne voulez pas que Google indexe les pages touchées, vous pouvez utiliser la directive Disallow dans votre fichier robots.txt pour bloquer l'accès à Googlebot. Voici comment:

Créer un fichier robots.txt : Si vous n'avez pas déjà un robot. fichier txt, vous aurez besoin de créer un. Vous pouvez ajouter une directive Disallow à ce fichier pour bloquer Googlebot à partir de pages ou répertoires spécifiques.

Ajouter la directive sur l'interdiction: La directive sur l'interdiction devrait ressembler à ceci:
Refuser: /path/to/bloqué/page/
Vous pouvez ajouter plusieurs directives d'exclusion à votre fichier robots.txt pour bloquer plusieurs pages ou répertoires.

En suivant ces étapes, vous devriez être en mesure de corriger l'erreur Blocked en raison d'une requête non autorisée (401) et de s'assurer que votre site Web est correctement indexé par Google.

Une fois que vous avez apporté des modifications à vos paramètres ou robots. fichier txt, il peut prendre un certain temps pour Google de retraverser votre site Web et de mettre à jour son index.

Vous pouvez utiliser l'URL Test Live dans Google Search Console pour tester comment Googlebot voit votre site Web. Cela peut vous aider à identifier les problèmes qui pourraient empêcher Googlebot d'accéder à vos pages.

Causes communes par plate-forme

WordPress 401 Causes

1. Plugins de sécurité bloquer Googlebot

Plugins comme Wordfence, Sucuri, ou iThemes peuvent à tort identifier Googlebot comme une menace.

Correction :

// Add to functions.php or custom plugin
add_filter('wordfence_is_googlebot', '__return_true');

2. Plugins d'adhésion/LMS

Les plugins comme MemberPress, Restrict Content Pro ou LearnDash peuvent protéger trop de pages.

Correction :
Examiner quel contenu est membre seulement
Veiller à ce que les pages d'aperçu publiques ne soient pas restreintes
Ajouter des règles d'exception pour les moteurs de recherche

3. Authentification HTTP dans .htaccess

Vérifiez votre `.htaccess` fichier pour :

<Files wp-login.php> AuthType Basic
AuthName "Protected"
AuthUserFile /path/to/.htpasswd
Require valid-user
</Files>

Correction :
Assurez-vous que ceci protège uniquement wp-login.php, pas les pages publiques.

4. Blocage IP au niveau du serveur

Votre hôte peut bloquer les plages IP de Google.

Liste blanche des IP Googlebot :

# In .htaccess
SetEnvIf User-Agent "Googlebot" AllowBot
Order Deny, Allow
Deny from all
Allow from env=AllowBot

Shopify 401 causes

1. Magasin protégé par mot de passe

Cause la plus courante – le stockage est en mode mot de passe pendant le développement.

Correction :

  1. Shopify Admin → Boutique en ligne → Préférences
  2. Faites défiler vers la protection des mots de passe
  3. Désactivez le mot de passe (sauf intentionnel)

2. Collections cachées

Collections définies à "Hidden" dans les moteurs de recherche.

Correction :

  1. Aller aux produits → Collections
  2. Cliquez sur la collection
  3. Faites défiler vers l'aperçu de la liste des moteurs de recherche
  4. S'assurer qu'il n'est pas caché

3. Shopify Scripts bloquer l'accès

Custom Shopify Scripts peut par inadvertance bloquer les rampeurs.

Correction :

Examiner le thème.liquide et les scripts pour les vérifications d'authentification.

FAQ

Une erreur non autorisée 401 survient lorsqu'un serveur Web nécessite des identifiants d'authentification pour accéder à une ressource, mais la requête soit manque d'identifiants ou fournit des identifiants invalides. Pour les sites Web, cela signifie que Googlebot ne peut pas accéder à vos pages car elles sont protégées par mot de passe ou derrière les barrières d'authentification.

Une erreur 401 empêche Googlebot d'accéder et d'indexer les pages affectées, ce qui peut conduire à:

1) Les pages étant retirées des résultats de recherche,
2) Perte des classements de recherche et visibilité,
3) Diminution du trafic organique
4) gaspillé budget de rampe sur les pages inaccessibles. Si des pages importantes retournent 401 erreurs, la performance de recherche globale de votre site diminuera considérablement.

Oui, les plugins de sécurité comme Wordfence, iThemes Security, Sucuri, et les plugins d'adhésion comme MemberPress peuvent causer 401 erreurs en bloquant les adresses IP de Googlebot, en exigeant l'authentification pour les pages publiques, ou en mettant en œuvre une limitation de taux trop agressive qui traite les rampeurs légitimes comme des menaces. Vérifiez les paramètres de votre plugin de sécurité et liste blanche Googlebot agents utilisateurs.

Après avoir corrigé 401 erreurs, les changements prennent généralement 24-48 heures pour réfléchir dans Google Search Console lors de l'utilisation de la fonction « Request Indexing ». Reprise naturelle sans requêtes manuelles peut prendre n'importe où de quelques jours à 2-3 semaines en fonction de votre site. Surveillez l'outil d'inspection URL pour suivre lorsque Google redessine avec succès les pages fixes.

Pour permettre à Googlebot d'accéder au contenu payant ou protégé, utilisez un balisage de données structuré pour le contenu payant (schéma.org/NewsArticle avec la propriété isAccessibleForFree). Afficher le contenu de prévisualisation à tous les utilisateurs, y compris les moteurs de recherche, indiquer clairement le paywall, et ne jamais afficher un contenu complètement différent pour les robots par rapport aux utilisateurs (qui est le masque). Vous pouvez également whitelist Googlebot="s user agent dans votre intergiciel d'authentification tout en gardant la page protégée pour les utilisateurs réguliers.

Cet article était - il utile?
OuiNuméro