Mercoledì 14 dicembre 2022
Mentre ci avviciniamo al 2023, vogliamo introdurre un altro strumento che consenta al pubblico di comprendere lo stato più recente dei sistemi che hanno un impatto sulla Ricerca: scansione, indicizzazione e pubblicazione. Sebbene le interruzioni di sistema siano estremamente rare, vogliamo essere trasparenti quando si verificano. In passato, abbiamo collaborato con i nostri Site Reliability Engineer (SRE) per comunicare queste interruzioni nel nostro Twitter di Google Search Central. Oggi presentiamo la Dashboard dello stato della Ricerca Google, in cui comunicheremo lo stato della Ricerca in futuro.
Negli ultimi due anni abbiamo lavorato con i nostri SRE per rendere le informazioni sui principali incidenti accessibili e utili per tutti. L'obiettivo era rendere la segnalazione dei problemi rapida, precisa e semplice; di conseguenza, abbiamo lanciato una nuova dashboard dello stato e semplificato la procedura di comunicazione durante gli incidenti.
Questa dashboard segnala i problemi diffusi che si sono verificati negli ultimi 7 giorni, con alcuni dettagli e lo stato attuale dell'incidente. Un problema diffuso è un problema sistemico relativo a un sistema della Ricerca che interessa un numero elevato di siti o utenti della Ricerca. In genere, questo tipo di problemi è molto visibile all'esterno, mentre internamente i meccanismi di monitoraggio e avviso dei SRE sono all'opera dietro le quinte per segnalarli.
La dashboard include una serie di funzionalità che potreste già conoscere da altre dashboard dello stato, ad esempio un feed RSS a cui potete iscrivervi e la visualizzazione dei dati storici.
Come comunichiamo incidenti e aggiornamenti
Una volta confermato con i SRE che è presente un problema in corso e diffuso nella Ricerca, miriamo a pubblicare un incidente sulla dashboard entro un'ora e gli aggiornamenti consecutivi dell'incidente entro 12 ore. A differenza di una dashboard automatica tradizionale, il nostro staff globale segnala questi aggiornamenti; in genere, l'ora di inizio dell'incidente corrisponde al momento in cui siamo riusciti a confermare il problema.
Al di fuori dell'aggiornamento di stato tradizionale che potreste vedere, cercheremo anche di fornire ulteriori informazioni che potrebbero fornire una soluzione. Ad esempio, nello scenario ipotetico in cui il nameserver che gestisce la risoluzione dei nomi di dominio per milioni di siti rifiuti le richieste di connessione di Googlebot, potremmo pubblicare un aggiornamento che afferma che la modifica dei nameserver potrebbe mitigare il problema riscontrato dai siti. Ovviamente, come per qualsiasi problema, continueremo a pubblicare aggiornamenti relativi all'incidente, con possibilità di mitigazione se disponibili, fino alla completa risoluzione.
Consideriamo risolto un incidente quando i nostri tecnici hanno apportato delle modifiche che metteranno fine all'impatto sul sistema. Sebbene ciò significhi che il sistema stesso è ora integro, i siti potrebbero riscontrare problemi per un po' di tempo fino a quando non vengono rielaborati, a seconda del tipo di incidente.
Per saperne di più sulla dashboard, abbiamo una pagina dedicata alla Dashboard dello stato della Ricerca su Google Search Central. Se volete lasciare un feedback sulla dashboard, inviateci un tweet a @googlesearchc.