Cómo arreglar bloqueado debido a petición no autorizada (401) Edición

Cómo arreglar bloqueado debido a petición no autorizada (401) Edición

¿Alguna vez has encontrado un error de «Bloqueado por solicitud no autorizada (401)» en Google Search Console? Este error frustrante puede evitar que su sitio web sea indexado por Google, que puede impactar significativamente su tráfico de búsqueda. Pero no te preocupes, ¡hay maneras de arreglarlo!

Bloqueado debido a la solicitud no autorizada 401 Edición

¿Qué significa el error?

Un error «Bloqueado por solicitud no autorizada (401)» indica que Googlebot, el rastreador del motor de búsqueda de Google, está siendo bloqueado de acceder a ciertas páginas en su sitio web.

Esto puede ocurrir por algunas razones, tales como:

Protección contra contraseña: Si su sitio web requiere una contraseña para acceder a ciertas páginas, Googlebot no será capaz de arrastrarlas.

Restricciones IP: Si tiene restricciones en su lugar que bloquean ciertas direcciones IP, puede estar bloqueando inadvertidamente a Googlebot.

Errores de autenticación: Puede haber un problema con el proceso de autenticación de su sitio web que impide que Googlebot inicie sesión.

Cómo arreglar

La solución a este error depende de si desea que Google indexe las páginas afectadas. Aquí están algunas opciones:

Permitir a Googlebot indexar las páginas

Si desea que Google indexe las páginas, necesitará cambiar la configuración de su sitio web para permitir el acceso de Googlebot. Así es:

Paso 1: Verificar el error en GSC

  1. Ir a Google Search Console → Páginas
  2. Haga clic en Bloqueado por solicitud no autorizada (401)
  3. Nota las URL afectadas
  4. Haga clic Inspección URLen una URL de muestra para ver cuando Google último intentó arrastrarlo

Paso 2: Pruebe la URL usted mismo

En su navegador:

  1. Abrir una ventana incógnito/privada
  2. Visita la URL afectada
  3. ¿Ves un aviso de inicio de sesión o página de error 401?

Usando cURL (para usuarios técnicos):

curl -I https://yoursite.com/affected-page

Busca:

HTTP/1.1 401 Unauthorized
WWW-Authenticate: Basic realm="Restricted Area"

Usando Herramientas en línea:

 Código de estado HTTP Introduzca su URL y compruebe si regresa 401

Paso 3: Compruebe la protección de contraseña

Si sus páginas están protegidas por contraseña, necesitará eliminar la protección de contraseña. Este enfoque es ideal si el contenido restringido ofrece valor a los buscadores. Sin embargo, se considera que mostrar diferentes contenidos a Googlebot que a usuarios humanos obstruccióny puede violar las Directrices Webmaster de Google.

WordPress:

  1. Ir a Ajustes → Leer
  2. Compruebe si Visibilidad del motor de búsquedaestá habilitado (debe ser revisado)
  3. Comprueba si estás usando un plugin que viene pronto/mantenance
  4. Verificar páginas individuales: Editar página → Page Attributes → Protección de contraseña

Shopify:

  1. Ir a Tienda Online → Preferencias
  2. Check Protección de contraseñassección
  3. Asegúrese de que está deshabilitado para páginas de publicidad

cPanel/Server Level:

  1. Check for .htpasswd archivos en directorios afectados
  2. Examen .htaccesspara reglas de autenticación:
AuthType Basic
AuthName "Restricted Area"
AuthUserFile /path/to/.htpasswd
Require valid-user

Paso 4: Inspeccione los ajustes de plugin de seguridad

Muchos plugins de seguridad bloquean a Googlebot accidentalmente. Revise estos:

Wordfence (WordPress):
  1. Ir a Wordfence → Firewall → Todas las opciones de firewall
  2. Tranquila Reglas de limitación de la tasa
  3. Asegúrese de que Googlebot no está siendo bloqueado
  4. Ver Wordfence → Herramientas → Whois → Entrar Googlebot IP
  5. Verificar que no está lista negra
iThemes Security (WordPress):
  1. Ir a la seguridad → Ajustes → 404 Detección
  2. Garantía Ignorar 404 errores de usuarios registradosestá habilitado
  3. Check Security → Ajustes → Red Brute Force
  4. Blancolist rangos IP de Google si es necesario
Cloudflare:
  1. Inicie sesión en el panel de control Cloudflare
  2. Ir a Seguridad → WAF
  3. Compruebe las reglas bloqueando agentes de usuario
  4. Reseña Firewall Eventos de Googlebot bloques

Paso 5: Compruebe los registros del servidor

Apache:
tail -f /var/log/apache2/error.log | grep 401
Nginx:
tail -f /var/log/nginx/error.log | grep 401

Busque entradas que muestran que se niegan las solicitudes de Googlebot.

Paso 6: Prueba como Googlebot

Utilice la herramienta de inspección URL:

  1. Ir a Google Search Console
  2. Introduzca la URL afectada
  3. Haga clic Prueba URL en vivo
  4. Haga clic Ver página testada→ Captura
  5. Compare lo que Googlebot ve vs. lo que usted ve

Si Googlebot ve una página de inicio de sesión pero no lo hace, ha encontrado su problema.

URL de prueba en vivo

Utilice el marcado de esquema para el contenido de paywalled: Si eliminar restricciones de acceso no es una opción, puede indicar a Google la naturaleza de su contenido restringido. Uso schema markup for paywalled content para proporcionar a Google detalles sobre el contenido detrás del paywall. Esto ayuda a Google a entender el valor del contenido sin realmente acceder a él.

Revisa tus restricciones IP: Si tiene restricciones IP en su lugar, asegúrese de que las direcciones IP de Googlebot no están siendo bloqueadas. Puede encontrar una lista de direcciones IP de Googlebot en el sitio web de Google Search Console Help.

Corregir errores de autenticación: Si sospecha que hay un problema con el proceso de autenticación de su sitio web, necesitará solucionar el problema y solucionarlo.

Bloquear Googlebot de indexar las páginas

Si no deseas que Google indexe las páginas afectadas, puedes usar la directiva Disallow en tu archivo robots.txt para bloquear a Googlebot de acceder a ellas. Así es:

Crear un archivo robots.txt: Si ya no tienes un robot. archivo txt, necesitará crear uno. Puede agregar una directiva de Disallow a este archivo para bloquear Googlebot de páginas o directorios específicos.

Agregue la directiva Disallow: La directiva Disallow debe parecer así:
Desactivar: /path/to/blocked/page/
Puede agregar múltiples directivas de desactivación a su archivo robots.txt para bloquear múltiples páginas o directorios.

Al seguir estos pasos, usted debe ser capaz de corregir el error «Bloqueado debido a solicitud no autorizada (401)» y asegurarse de que su sitio web está siendo debidamente indexado por Google.

Una vez que haya hecho cambios en la configuración de su sitio web o robots. archivo txt, puede tomar algún tiempo para que Google revuelva su sitio web y actualice su índice.

Puede utilizar la URL de Test Live en Google Search Console para probar cómo Googlebot ve su sitio web. Esto puede ayudarle a identificar cualquier problema que pueda estar impidiendo a Googlebot acceder a sus páginas.

Causas comunes por Plataforma

WordPress 401 Causas

1. Plugins de seguridad bloqueo Googlebot

Plugins como Wordfence, Sucuri o iThemes pueden identificar erróneamente a Googlebot como una amenaza.

Corrección:

// Add to functions.php or custom plugin
add_filter('wordfence_is_googlebot', '__return_true');

2. Plugins de membresía/LMS

Plugins como MemberPress, Restrict Content Pro, o LearnDash pueden proteger demasiadas páginas.

Corrección:
Examinar qué contenido es solo miembro
Asegurar que las páginas de vista pública no estén restringidas
Añadir reglas de excepción para motores de búsqueda

3. HTTP Autenticación en .htaccess

Revisa tu `.htaccess` archivo para:

<Files wp-login.php> AuthType Basic
AuthName "Protected"
AuthUserFile /path/to/.htpasswd
Require valid-user
</Files>

Corrección:
Asegúrese de que ONLY protege wp-login.php, no páginas públicas.

4. Bloqueo IP de nivel de servidor

Su host puede bloquear los rangos IP de Google.

Whitelist Googlebot IPs:

# In .htaccess
SetEnvIf User-Agent "Googlebot" AllowBot
Order Deny, Allow
Deny from all
Allow from env=AllowBot

Shopify 401 Causes

1. Tienda protegida por contraseña

Causa más común – la tienda está en modo de contraseña mientras se desarrolla.

Corrección:

  1. Shopify Admin → Tienda Online → Preferencias
  2. Pergamino a «Protección de contraseña»
  3. Desmarque «Permite contraseña» (independientemente de su intención)

2. Colecciones ocultas

Colecciones establecidas a «Hidden» en motores de búsqueda.

Corrección:

  1. Ir a los productos → Colecciones
  2. Haga clic en la colección
  3. Desplazamiento a «Buscar vista previa del motor»
  4. Asegúrese de que no está oculta

3. Shopify Scripts Blocking Access

Los scripts personalizados Shopify pueden bloquear inadvertidamente los rastreadores.

Corrección:

Reseña tema.liquid y scripts para cheques de autenticación.

Preguntas frecuentes

Un Error No Autorizado 401 ocurre cuando un servidor web requiere credenciales de autenticación para acceder a un recurso, pero la solicitud carece de credenciales o proporciona las inválidas. Para los sitios web, esto significa que Googlebot no puede acceder a sus páginas porque están protegidos por contraseña o detrás de barreras de autenticación.

Un error 401 impide a Googlebot acceder e indexar las páginas afectadas, lo que puede conducir a:

1) Páginas que se eliminan de los resultados de búsqueda,
2) Pérdida de la clasificación de búsqueda y visibilidad,
3) Menor tráfico orgánico, y
4) Presupuesto arrastrado gastado en páginas inaccesibles. Si las páginas importantes devuelven errores 401, el rendimiento general de búsqueda de su sitio disminuirá significativamente.

Sí, plugins de seguridad como Wordfence, iThemes Security, Sucuri y plugins de membresía como MemberPress pueden causar 401 errores ya sea bloqueando las direcciones IP de Googlebot, requiriendo autenticación para páginas públicas, o implementando una tasa excesivamente agresiva limitando que trata a los rastreadores legítimos como amenazas. Comprueba la configuración de tu plugin de seguridad y los agentes de usuario de Googlebot.

Después de corregir errores de 401, los cambios suelen tardar 24-48 horas para reflejar en Google Search Console cuando se utiliza la función "Indización de la Solicitud". El recruzamiento natural sin solicitudes manuales puede tomar cualquier lugar de unos días a 2-3 semanas dependiendo de la frecuencia de los rastreos de su sitio y la importancia de la página. Monitorear la herramienta de inspección URL para rastrear cuando Google recrudece exitosamente las páginas fijas.

Para permitir que Googlebot acceda al contenido recortado o protegido, utilice el marcado de datos estructurados para el contenido recortado (schema.org/NewsArticle with isAccesibleForFree property). Mostrar contenido de vista previa a todos los usuarios, incluyendo motores de búsqueda, indica claramente el paywall, y nunca mostrar contenido completamente diferente a bots contra los usuarios (es decir, obturación). También puede blanquear el agente de usuario de Googlebot en su middleware de autentificación mientras mantiene la página protegida para los usuarios regulares.

¿Fue útil este artículo?
No