Come risolvere il problema del tag “noindex” escluso da Google Search Console

Come risolvere il problema del tag “noindex” escluso da Google Search Console

Trattare con il Escluso da 'noindex' tag problema in Google Search Console può essere un po 'difficile. Se sei un esperto SEO o semplicemente gestire il tuo sito web, la comprensione e la risoluzione di questo problema è fondamentale per garantire che le tue pagine importanti vengano indicizzate da Google. In questo articolo, esploreremo cosa significa 'noindex', perché appare, e come risolverlo passo per passo.

Escluso da Noindex Tag Checker

Utilizzare questo strumento per verificare se una pagina web è contrassegnata come noindex attraverso un meta tag o intestazione X-Robots-Tag. Basta inserire un URL e ottenere risultati in tempo reale sulla sua indicabilità.

Controllo...
Escluso da noindex tag Problema in GSC

Modi per contrassegnare una pagina come Noindex

By Noindex Meta Tag

Un meta tag 'noindex' è un tag HTML che puoi aggiungere al codice sorgente della tua pagina web per dire ai motori di ricerca di non indicizzare la pagina. È spesso usato per le pagine che non hanno bisogno di apparire nei risultati di ricerca, come le pagine di login, le pagine di ringraziamento, o alcune pagine di amministrazione.

<meta name="robots" content="noindex">

Con HTTP Header

A noindiceL'intestazione HTTP funziona allo stesso modo ma viene aggiunta a livello del server. Istruire i motori di ricerca per non indicizzare la pagina, proprio come il meta tag, ma è incluso nella risposta HTTP.

HTTP/1.1 200 OK
X-Robots-Tag: noindex

Come funziona Noindex: Il lato tecnico

Capire come i motori di ricerca elaborano le direttive noindex ti aiuta a implementarle correttamente.

Noindex Discovery Process

  1. Pagina delle richieste di Googlebot → Il server risponde con intestazioni HTTP
  2. Intestazioni controllati prima → X-Robots-Tag intestazione di risposta HTTP
  3. HTML scaricato → Se no X-Robots-Tag, controllare per meta robot tag
  4. Decisione→ Pagina esclusa dall'indice (ma i collegamenti sono ancora seguiti a meno che non specificato)

Meta Robots vs. X-Robots-Tag: Quando usare ogni

Utilizzare Meta Robots Tag:
– Si controlla lo strato HTML/templato
– Vuoi direttive noindex specifiche per pagina
– Stai usando un CMS con plugin SEO

Utilizzare X-Robots-Tag quando:
– È necessario noindex file non-HTML (PDF, immagini, video)
– Si desidera il controllo centralizzato tramite .htaccess o configurazione server
– Stai bloccando intere directory o tipi di file

Esempio X-Robots-Tag per i file PDF:

# In .htaccess
<FilesMatch "\.pdf$">
Header set X-Robots-Tag "noindex, nofollow"
</FilesMatch>

Attuazione del Noindex della piattaforma

WordPress: Aggiungere e rimuovere Noindex

Metodo 1: Utilizzo di Yoast SEO
  1. Modifica della pagina/post
  2. Scorrere a Yoast SEO meta box
  3. Fare clic sull'icona del cambio (Avanzato)
  4. Set Permette ai motori di ricerca di mostrare questa pagina nei risultati di ricerca?a No
  5. Aggiorna la pagina
Metodo 2: Utilizzo della matematica casuale
  1. Modificare la pagina
  2. Trova Rank Math meta box
  3. Fare clic sulla scheda Avanzata
  4. Toggle Robots Metaa No Indice
  5. Salvare le modifiche
Metodo 3: Programmaticamente (functions.php)
// Add noindex to specific page types
function custom_noindex_pages() {
    // Noindex all author archives (single author blog)
    if (is_author()) {
        echo '<meta name="robots" content="noindex, follow" />';
    }
    // Noindex all tag pages with < 3 posts
    if (is_tag()) {
        $tag = get_queried_object();
        if ($tag->count < 3) {
            echo '<meta name="robots" content="noindex, follow" />';
        }
    }
    // Noindex attachment pages
    if (is_attachment()) {
        echo '<meta name="robots" content="noindex, follow" />';
    }
}
add_action('wp_head', 'custom_noindex_pages', 1);

Rimuovere Noindex da WordPress:

Controlla questi luoghi:
  1. Impostazioni → Lettura → Assicurarsi Motori di ricerca discourage dall'indicizzazione di questo sito è UNCHECKED
  2. Pagina/Livello della posta → Rimuovere noindex da singole pagine tramite plugin SEO
  3. Funzioni a tema → Controllare il codice noindex personalizzato nelle funzioni. php
  4. Arrivare presto Plugin→ Disattiva SeedProd, modalità di manutenzione WP, ecc.

Shopify: Gestione del Noindex

Aggiungere Noindex per Shopify Pagine:

Modificare i file liquidi del vostro tema:
{% comment %} In theme.liquid or specific template {% endcomment %}
{% comment %} Noindex filtered collections {% endcomment %}
{% if current_tags.size > 0 %}
<meta name="robots" content="noindex, follow">
{% endif %}
{% comment %} Noindex search results {% endcomment %}
{% if template contains 'search' %}
<meta name="robots" content="noindex, follow">
{% endif %}
{% comment %} Noindex customer account pages {% endcomment %}
{% if template contains 'customers' %}
<meta name="robots" content="noindex, follow">
{% endif %}

Rimuovere Noindex da Shopify:

  1. Controlla la protezione della password:
    – Shopify Admin → Online Store → Preferenze
    – Disattivare Protezione della password
  2. Recensione file tema:
    – Controlla tema.liquido, prodotto.liquido, raccolta.liquido
    – Rimuovere eventuali tag `<meta name=”robots” content=”noindex”>`
  3. Controlla SEO Apps:
    – Impostazioni di revisione in Plug in SEO, SEO Manager, ecc.
    – Disattiva impostazioni noindex globali

WooCommerce: Prodotto e Categoria Noindex

Variazioni di prodotto Noindex:

// In functions.php or custom plugin
add_action('wp_head', 'noindex_product_variations');
function noindex_product_variations() {
  if (is_product()) {
      global $product;
      if ($product && $product->is_type('variation')) {
          echo '<meta name="robots" content="noindex, follow" />';
      }
  }
}

Noindex Out of Stock Products:

add_action('wp_head', 'noindex_out_of_stock');
function noindex_out_of_stock() {
  if (is_product()) {
      global $product;
      if ($product && !$product->is_in_stock()) {
          echo '<meta name="robots" content="noindex, follow" />';
      }
  }
}

Categorie vuoto Noindex:

add_action('wp_head', 'noindex_empty_categories');
function noindex_empty_categories() {
  if (is_product_category()) {
      $term = get_queried_object();
      if ($term && $term->count === 0) {
          echo '<meta name="robots" content="noindex, follow" />';
      }
  }
}

Risoluzione dei problemi

Numero 1: Noindex Non essere rispettato

Sintomo:Pagina appare ancora in Google nonostante noindex tag
Cause possibili:
  1. Bloccato da robots.txt: Se robots.txt blocca la pagina, Google non può vedere il tag noindex
  2. Traduzione: Google può mostrare la versione cache per un po '
  3. Direttive di conflitto:Entrambi i tag noindex e index presenti
Soluzioni:
<!-- Check for conflicts -->
<!-- BAD: Multiple conflicting tags -->
<meta name="robots" content="index, follow">
<meta name="robots" content="noindex, follow">
<!-- GOOD: Single clear directive -->
<meta name="robots" content="noindex, follow">
Processo del debito:
  1. Visualizza fonte di pagina → robot
  2. Controllare le intestazioni HTTP:
  3. curl -I https://yoursite.com/page
  4. Utilizzare GSC URL Ispezione → Visualizza la pagina Crawled→ Controllare la risposta HTTP
Test URL live

Fascicolo 2: Importante Pagina Accidentalmente Noindexed

Sintomo:Pagina mancante da Google che dovrebbe essere indicizzato
Punti diagnostici:
  1. Check Page Fonte:
  2. # View HTML
    curl https://yoursite.com/page | grep -i robots
    
    # Check HTTP headers
    curl -I https://yoursite.com/page | grep -i x-robots
  3. WordPress controlli rapidi:
    – Impostazioni → Lettura → Search Engine Visibilità
    – Plugin SEO → Impostazioni pagina / post
    – funzioni.php → Cercare noindice
  4. Controlla .htaccess:
  5. # Look for rules like:
    Header set X-Robots-Tag "noindex, nofollow"
    Correzione rapida:
    // WordPress: Force remove noindex from specific page
    add_filter('wp_robots', 'force_index_specific_page', 99);
    function force_index_specific_page($robots) {
        if (is_page(123)) { // Replace 123 with your page ID
            unset($robots['noindex']);
            $robots['index'] = true;
        }
        return $robots;
    }

Numero 3: Noindex Non rimuovere Pagine da Index

Sintomo:Aggiunto noindex ma le pagine ancora in Google dopo settimane
Perché questo accade:
– Google ha bisogno di ricrawl per vedere il tag noindex
– Se robots.txt blocca l'URL, Google non può vedere la direttiva noindex
– Rilevamento dei ritardi di priorità a bassa striscia
Soluzione:
  1. Assicurare che la pagina è discrete:
    # robots.txt - ALLOW the page first
    User-agent: *
    Allow: /page-to-deindex/
    # Then add noindex tag to the page itself
  2. Richiesta di rimozione (Temporary):
    – GSC → Rimozioni → Nuova richiesta
    – Inserisci URL
    – Rimozione temporanea per 6 mesi mentre i processi noindex
  3. Forza Recrawl:
    – GSC → ispezione URL
    – Inserisci URL
    – Fare clic Richiesta indicizzazione

✅ Pagine che dovrebbero essere indicizzate

Sempre Noindex:
– Login / pagine di registrazione
– Carrello e pagine di controllo
– dashboard account cliente
– Pagina dei risultati di ricerca
– pannelli di amministrazione
– Pagine di ripristino della password
– Pagine di preferenza e-mail
– Contenuto privato/draft
Di solito Noindex:
– Pagine di categoria filtrate (?color=red&size=large)
– Paginazione oltre la pagina 1 (debabile)
– Archivio per il tag con < 3 post
– Archivio dell'autore su blog autore
– Attaccamento/pagine media
– Versione stampabile
– Archivi basati sulla data
⚠️ Noindex condizionale:
– Prodotti esauriti (se in modo permanente)
– Contenuto stagionale/temporaneo (dopo la fine della stagione)
– Duplicare il contenuto in più lingue (usare hreflang invece)
– Contenuto sotto 200 parole (miglioralo prima)

Pagine che non dovresti mai

– Homepage
– Pagine primarie di prodotto/servizio
– Principali pagine di categoria
– Blog post
– Pagine di atterraggio con contenuti unici
– Informazioni / pagine di contatto
– Contenuto che vuoi classificare

Errori di Noindex comuni

Errore #1: Noindexing versione mobile

Sbagliato:
<!-- On mobile subdomain m.example.com -->
<meta name="robots" content="noindex, follow">
Bene Utilizzare design reattivo o servizio dinamico, mai versioni mobili noindex.

Errore #2: Noindex + Bloccato da Robots.txt

Ispezionare l&apos;URL
Sbagliato:
# robots.txt
Disallow: /private/
# AND noindex tag on /private/ pages
Perché è sbagliato: Google non può strisciare per vedere noindex tag
Bene
# robots.txt - Allow crawling
Allow: /private/
# BUT add noindex meta tag to pages
<meta name="robots" content="noindex, follow">

Errore #3: Utilizzo di Noindex Invece di Canonical

Sbagliato:
<!-- Noindexing product color variations -->
<!-- On /shirt-red -->
<meta name="robots" content="noindex, follow">
Bene
<!-- Use canonical instead -->
<link rel="canonical" href="https://example.com/shirt">

Errore #4: Noindexing Development Site, Dimenticare di rimuovere dal vivo

Lista di controllo della prevenzione:
// WordPress: Conditional noindex based on environment
if (defined('WP_ENV') && WP_ENV === 'development') {
  add_action('wp_head', function() {
      echo '<meta name="robots" content="noindex, nofollow" />';
  }, 1);
}
Risultato del test dal vivo
Richiesta indicizzazione

Conclusioni

Fissare il URL contrassegnato "noindex"problema in Google Search Console comporta la comprensione di quali direttive ‘noindex’ sono, perché sono utilizzati e come affrontarli. Seguendo i passaggi sopra indicati, è possibile garantire che le pagine importanti sono indicizzate e migliorare la visibilità del sito nei risultati di ricerca.

Domande frequenti

Si'. Noindex impedisce solo l'indicizzazione, non strisciando. Google scopre ancora link su pagine noindexed (a meno che non si utilizza anche nofollow).
Tipicamente 1-4 settimane dopo Google ricrawls la pagina. È possibile velocizzare l'indice tramite GSC.
- Noindex:Previene l'indicizzazione ma permette di strisciare
- Disallow:Previene strisciare completamente (Google può ancora indicizzare gli URL trovati altrove)
- Eliminare:Se la pagina non serve scopo
- Noindex:Se la pagina è utile per gli utenti ma non per la ricerca
No. Le pagine non indicizzate non passano PageRank a pagine collegate.
Noindexing pagine di bassa qualità può effettivamente migliorare i segnali di qualità su tutto il sito. Noindexing pagine importanti farà male classifiche.
# .htaccess in root directory
<IfModule mod_headers.c>
  <FilesMatch "\.(php|html)$">
        Header set X-Robots-Tag "noindex, follow"
  </FilesMatch>
</IfModule>
Questo articolo è stato utile?
No