Cosa è la memoria cache
I principali motori di ricerca conservano una copia del sito web nella memoria creata nei loro server, la cosiddetta copia cache, l’ultima volta che l’hanno visitata. La copia cache rappresenta un’istantanea di ogni pagina web, da utilizzare come copia di backup qualora la pagina corrente non fosse disponibile. Alcune indicazioni sulla cache di Google si trovano nella pagina di supporto https://support.google.com/websearch/answer/1687222?hl=it
Cache e social media
I motori di ricerca considerano come siti web anche le pagine pubbliche di Facebook, Twitter, ecc. in cui le informazioni sono disponibili senza vincoli di privacy e le possono leggere anche chi non vuole entrare nella piattaforma social. Pertanto, è possibile utilizzare la loro copia cache per:
a. ritrovare contenuti cancellati, se la cancellazione avviene dopo l’ultima memorizzazione nella cache;
b. stimare quanto è importante la pagina web, secondo la distanza temporale tra due memorizzazioni successive, questa distanza non è uguale per tutti, la pagina web può essere memorizzata anche più volte nello stesso giorno o una sola volta al mese;
c. verificare quali informazioni vengono memorizzate dal motore di ricerca.
Rispetto al 2017 è stata notevolmente ridotta la quantità di informazioni mostrate, per esempio non si trovano più trovare i nominativi delle persone che hanno interagito con la pagina Facebook e non vengono conservate le schede elencate a sinistra della pagina.
Vediamo ora le principali caratteristiche della memoria cache in Google e Bing e quali informazioni utili possiamo ricavare.
Cache di Google
Per cercare nella copia di cache in Google bisogna scrivere cache:URL sostituendo URL con l’indirizzo desiderato, per esempio cache:https://www.facebook.com/ACMilan/ oppure cache:https://www.facebook.com/Inter/ oppure cache:https://it-it.facebook.com/corrieredellasera/ con la specifica della lingua italiana su it-it.
Purtroppo funziona solo per pagine molto attive e con grandi dimensioni, in passato funzionava anche per le piccole pagine. Si ottiene una pagina come quella indicata nell’immagine successiva.

La frase “È un’istantanea della pagina visualizzata il 24 apr 2018 09:20:48 GMT.” è molto importante per misurare la distanza temporale tra le visite successive, se questa ricerca viene eseguita molto spesso. Si può cercare una parola in questa tipologia di risultato, essendo formato da testo, con i metodi indicati nella frase che comincia con “Suggerimento”.
Scorrendo la pagina verso il basso si può notare che le fotografie non vengono conservate, al loro posto compaiono le frasi che iniziano con “L’immagine può contenere:” e alcune parole per descrivere il contenuto dell’immagine, come descritto nell’articolo presentato in questo blog.
Volendo considerare Twitter, si può cercare cache:https://twitter.com/robertomarmo si può trovare qualcosa anche se la presenza su Twitter è modesta. C’è un piccolo problema con la visualizzazione del contenuto come mostrato nell’immagine seguente.

Il testo contenente data e ora della visita di Google è nascosto da una barra bianca, bisogna cliccare su link “Versione solo testo” per avere la versione senza la grafica in cui viene mostrato il dato temporale di interesse, come mostrato nell’immagine successiva.

Non viene conservato niente riguardante LinkedIn e Instagram.
Cache di Bing
Per cercare nella cache di Bing bisogna andare su http://www.bing.it e scrivere l’indirizzo URL della pagina, per esempio https://www.facebook.com/socialmediamining/, nel risultato compare a destra una piccola freccia su cui cliccare, come indicato nell’immagine seguente.

A differenza di Google in questo caso compare solo la data senza l’orario, come indicato nell’immagine seguente, però riesce a catturare anche pagine Facebook con poca interazione.

La ricerca di un account Twitter richiede qualche passaggio da compiere, perché compare una barra con link di Twitter che copre il testo con la data di interesse. Si può selezionare tutto il contenuto della pagina, il testo copiato si può incollare in un software per gestire il testo, come il Blocco Note in Windows, da cui si può leggere la frase “Di seguito è disponibile lo snapshot della pagina Web alla data”. In Google Chrome non funziona CTRL+A per selezionare tutto il contenuto della pagina, si può cliccare con il tasto destro del mouse per scegliere “Visualizza sorgente pagina”, nel codice HTML mostrato si può cercare la frase “pagina Web alla data” continuando a leggere dopo alcuni tag si trova la data desiderata.
Non viene conservato niente riguardante LinkedIn e Instagram.