404 vs Soft 404: qual è la differenza e come risolverli entrambi

La console di ricerca di Google avvisa gli editori degli errori 404: 404 e soft 404. Anche se si chiamano entrambi 404, sono molto diversi. Di conseguenza, è essenziale comprendere la differenza tra gli errori per risolverli.

Il significato di un codice di risposta 404

Tutti i codici all’interno della serie di risposte 4xx indicano che la richiesta non può essere soddisfatta perché la pagina non è stata trovata.

La definizione ufficiale è:

4xx (Errore client): la richiesta contiene una sintassi errata o non può essere soddisfatta

La risposta 404 è ambigua riguardo alla possibilità che la pagina web ritorni.

Esempi del perché si verifica la pagina 404 non trovata

  • Se qualcuno cancella erroneamente una pagina web, il server risponde con la risposta 404 Pagina non trovata.
  • Se qualcuno si collega a una pagina web inesistente, il server risponde che la pagina non è stata trovata (404).

La documentazione ufficiale è chiara sull’ambiguità relativa al fatto che una pagina sia temporaneamente o permanentemente scomparsa:

“Il codice di stato 404 (Non trovato) indica che il server di origine non ha trovato una rappresentazione corrente per la risorsa di destinazione o non è disposto a rivelarne una esistente.

Un codice di stato 404 non indica se questa mancanza di rappresentanza è temporanea o permanente…”

Riassumendo, il codice 404 pagina non trovata significa che si è verificato un errore nella richiesta del browser perché non è stato possibile trovare la pagina richiesta.

Che cos’è un errore Soft 404?

Un errore soft 404 non è un codice di stato ufficiale. Il server non invia una risposta soft 404 a un browser perché non esiste un codice di stato soft 404.

Morbido 404 descrive una situazione in cui il server presenta una pagina web e risponde con un codice di stato 200 OK, indicando il successo quando la pagina web o il contenuto sono effettivamente mancanti.

Quattro ragioni comuni per un Soft 404

Manca una pagina Web e un server invia 200 stato OK.

Questo tipo di soft 404 si verifica quando manca una pagina, ma la configurazione del server reindirizza la pagina mancante alla home page o a un URL personalizzato.

La pagina non c’è più, ma l’editore ha fatto qualcosa per soddisfare la richiesta della pagina mancante.

Il contenuto è mancante o “scarso”.

Quando il contenuto è completamente mancante, o ce n’è pochissimo (ovvero contenuto scarno), il server risponderà con un codice di stato 200, il che significa che la richiesta per la pagina ha avuto successo.

Ma per l’indicizzazione delle pagine web che non sono richieste di pagine web riuscite, i motori di ricerca chiamano questo soft 404.

La pagina mancante reindirizza alla home page.

Alcuni credono erroneamente che ci sia qualcosa di sbagliato in una risposta all’errore 404.

Pertanto, per bloccare le risposte all’errore 404, un editore può reindirizzare la pagina mancante alla home page, anche se la home page non è quella richiesta.

Google chiama queste richieste di pagina non riuscite soft 404.

Pagina mancante reindirizzata a una pagina Web personalizzata.

A volte, le pagine mancanti reindirizzano a una pagina Web personalizzata che fornisce un codice di stato 200, il che fa sì che Google etichetti queste pagine come soft 404.

Chi ha inventato la frase Soft 404?

Il concetto di soft 404 potrebbe aver avuto origine in un documento di ricerca del 2004 intitolato Towards an Understanding of the Web’s Decay (PDF).

Le pagine mancanti sostituite in modo improprio rappresentano un problema per i motori di ricerca che tentano di indicizzare pagine reali.

Ecco come il documento di ricerca inquadra i soft 404:

“Secondo il protocollo HTTP, quando viene effettuata una richiesta a un server per una pagina che non è più disponibile, il server dovrebbe restituire un codice di errore…

…in effetti molti server, compresi quelli più affidabili, non restituiscono un codice 404, ma restituiscono invece una pagina sostitutiva e un codice OK (200).

…Il nostro studio mostra che questo tipo di sostituzioni, chiamate “soft-404”, rappresentano oltre il 15% dei collegamenti morti”.

Soft 404 a causa di errori di codifica

Ci sono casi in cui la pagina non manca, ma problemi specifici (come errori di codifica) hanno spinto Google a classificarla come pagina mancante.

I Soft 404 sono essenziali da indagare perché potrebbero segnalare un codice non funzionante.

Problemi tipici di codifica:

  • File o inclusione mancante che dovrebbe popolare una pagina Web con contenuti.
  • Errore di Database.
  • JavaScript mancante.
  • Pagine dei risultati di ricerca vuote.

Gli errori 404 hanno due cause principali

  • Un errore nel collegamento indirizza gli utenti a una pagina che non esiste.
  • Un collegamento a una pagina che esisteva ma è improvvisamente scomparsa.

Errore di collegamento

Se la causa del 404 è un errore di collegamento, è necessario correggere i collegamenti.

La parte difficile di questo compito è trovare tutti i collegamenti interrotti su un sito. Può essere più difficile eseguire la scansione di siti grandi e complessi con migliaia o milioni di pagine.

In casi come questo, gli strumenti di scansione tornano utili.

Hai così tante opzioni software di scansione del sito tra cui scegliere: Xenu e Greenflare gratuiti; o software a pagamento come Screaming Frog, DeepCrawl, Botify, Sitebulb e OnCrawl, dove molti di questi hanno versioni di prova gratuite o versioni gratuite ma con funzionalità limitate.

Una pagina che non esiste più

Quando una pagina non esiste più, hai due opzioni:

  • Ripristina la pagina se la rimozione è stata accidentale.
  • 301 reindirizzalo alla pagina correlata più vicina se la rimozione era intenzionale.

Innanzitutto, devi individuare tutti gli errori di collegamento sul sito. In modo simile alla ricerca di tutti gli errori nel collegamento di un sito Web su larga scala, puoi utilizzare gli strumenti di scansione.

Tuttavia, gli strumenti di scansione potrebbero non trovare le pagine orfane: pagine non collegate da nessun punto dei collegamenti di navigazione o da nessuna delle pagine.

Possono esistere pagine orfane se prima facevano parte del sito Web, quindi, dopo una riprogettazione del sito Web, il collegamento che porta a questa vecchia pagina scompare, ma i collegamenti esterni da altri siti Web potrebbero ancora essere collegati ad esse.

Per verificare se questo tipo di pagine esistono sul tuo sito, puoi utilizzare vari strumenti.

Come identificare le pagine di risposta 404

Rapporti di Google Search Console

Il rapporto Copertura elenca gli URL di errore 404 su un sito Web.

Screenshot da Google Search Console, agosto 2022

La Search Console segnalerà 404 pagine mentre Google esegue la scansione di tutte le pagine che riesce a trovare. Ciò può includere collegamenti da altri siti a una pagina che esisteva sul tuo sito web.

statistiche di Google

Per impostazione predefinita, non troverai un rapporto sulle pagine mancanti in Google Analytics. Tuttavia, puoi monitorarli in diversi modi.

Per prima cosa, puoi creare un rapporto personalizzato e segmentare le pagine menzionandole nel titolo Errore 404 – Pagina Non Trovata.

Un altro modo per trovare pagine orfane in Google Analytics è creare raggruppamenti di contenuti personalizzati e assegnare tutte le 404 pagine a un gruppo di contenuti.

Sito: Comando di ricerca operatore

Non è possibile utilizzare il comando site: search per trovare gli errori 404 perché Google non indicizza le pagine web 404 o le pagine web soft 404.

Sito di Google: l’operatore di ricerca è utile per trovare pagine web su un sito che contengono una frase chiave specifica nel contenuto delle pagine web.

La Search Console di Google è la migliore fonte per identificare un elenco di 404 soft e 404 normali.

I log degli errori di traffico del sito web sono una fonte utile per identificare le risposte agli errori 404.

Altri strumenti di ricerca sui backlink

Anche strumenti di ricerca sui backlink come Majestic, Ahrefs, Moz Open Site Explorer, Sistrix, Semrush, LinkResearchTools e CognitiveSEO possono aiutare.

La maggior parte di questi strumenti esporterà un elenco di backlink che collegano al tuo dominio. Da lì puoi controllare tutte le pagine collegate e cercare gli errori 404.

Come correggere gli errori Soft 404

Gli strumenti di scansione non rileveranno un soft 404 perché non è un errore 404. Ma puoi utilizzare gli strumenti di scansione per catturare qualcos’altro.

Ecco alcune cose da trovare:

  • Contenuto sottile: Alcuni strumenti di scansione segnalano le pagine con contenuti scarni insieme a un conteggio delle parole ordinabili. Inizia con le pagine con il minor numero di parole per valutare se la pagina ha contenuti scarni.
  • Contenuto duplicato: Alcuni strumenti di scansione sono abbastanza sofisticati da distinguere quale percentuale della pagina è costituita dal contenuto del modello. E ci sono anche strumenti realizzati appositamente per trovare contenuti duplicati interni come SiteLiner. Se il contenuto principale è quasi uguale a quello di molte altre pagine, dovresti esaminare queste pagine e determinare il motivo per cui sul tuo sito sono presenti contenuti duplicati.

Oltre agli strumenti di scansione, puoi anche utilizzare Google Search Console e controllare gli errori di scansione per trovare le pagine elencate nei soft 404.

La scansione di un intero sito per trovare i problemi che causano i soft 404 ti consente di individuare e correggere i problemi prima che Google li rilevi.

Dopo aver rilevato questi problemi soft 404, dovrai correggerli.

La maggior parte delle volte, le soluzioni sembrano essere il buon senso. Ciò può includere cose semplici come espandere le pagine con contenuti scarni o sostituire contenuti duplicati con contenuti nuovi e unici.

Durante questo processo, ecco alcune cose da considerare:

Consolida le pagine

A volte, i contenuti scarni sono causati dall’essere troppo specifici con l’argomento della pagina, lasciandoti poco da dire.

Unire più pagine sottili in un’unica pagina può essere più appropriato se gli argomenti sono correlati. Ciò non solo risolve i problemi relativi ai contenuti scarsi, ma può anche risolvere i problemi relativi ai contenuti duplicati.

Ad esempio, un sito di e-commerce che vende scarpe in diversi colori e taglie potrebbe avere un URL diverso per ciascuna taglia e combinazione di colori. Ciò lascia un gran numero di pagine con contenuti scarsi e relativamente identici.

L’approccio più efficace è invece quello di mettere tutto su un’unica pagina ed enumerare le opzioni disponibili.

Individua i problemi tecnici che causano contenuti duplicati

Utilizzando anche lo strumento di scansione web più semplice come Xenu (che non esamina il contenuto ma solo URL, codici di risposta e tag del titolo), puoi comunque trovare problemi di contenuto duplicato esaminando gli URL.

Ciò include URL www e non www, HTTP e HTTPS, con index.html e senza, con parametri di tracciamento e senza, ecc.

Errori 404 ed errori Soft 404

La cosa più importante da ricordare sugli errori 404 è che se le pagine mancano davvero, non c’è nulla da correggere. È consentito mostrare una risposta 404 per le richieste di pagine che non esistono.

Ma se le pagine esistono ma su un URL diverso, allora è qualcosa da risolvere reindirizzando un collegamento interrotto all’URL effettivo, ripristinando una pagina mancante o reindirizzando il vecchio URL a una nuova pagina che lo ha sostituito.

Un soft 404 è sempre il risultato di un problema che deve essere diagnosticato e risolto.

Comprendere la differenza tra i 404 è essenziale per mantenere un sito Web operativo al massimo delle prestazioni.

Autore

In stretto contatto con la tecnologia e gaming fin dall'infanzia, è felice di fare ricerche e condividere le sue esperienze con le persone.

Articoli correlati

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *