Il 23 ottobre 2018 Roberto Marmo ha tenuto un workshop in fiera SMAU Milano con titolo “Analisi della concorrenza con il social media mining” riguardante un tema tanto importante quanto sottovalutato, molto utile da conoscere per fare meglio dei concorrenti e per difendersi dai, non rari, comportamenti sleali.
L’intervento formativo è stato svolto in collaborazione con IWA – International Webmaster Association è descritto in una pagina specifica, in cui si può notare lo stile adottato per la descrizione dell’intervento: si comincia con alcune domande che si pone chi frequenta i social media per fare marketing e vendere, si finisce con le risposte che si possono ottenere partecipando al workshop.
Il 5 ottobre hanno aperto le iscrizioni gratuite per gli 80 posti a sedere, la sera del 7 ottobre i posti gratuiti sono terminati! A dimostrazione dell’interesse per l’argomento trattato.
Di seguito una fotografia gentilmente fornita da Davide Mendola che ha dedicato al workshop un post nel suo profilo LinkedIn
Maria Teresa Bozzini ha scritto un articolo su LinkedIn Pulse in cui ha definito il mio intervento così: “presentazione molto ricca di informazioni utili e chiare”.
Altre fotografie si possono trovare scorrendo le decine di tweet lanciati da Inside Marketing con @InsideMarketing associato a @RobertoMarmo @smaunotes
Per leggere le slide presentate bisogna andare alla mia pagina relatore nel sito SMAU andare in fondo alla pagina e trovare la sezione “ULTIME SLIDE CARICATE” oppure “ARCHIVIO INTERVENTI” dove si trovano i link alle presentazioni svolte nelle altre edizioni di SMAU. Buona lettura!
Uno dei primi strumenti forniti da Facebook è il “gruppo”, uno spazio dove discutere di interessi condivisi con determinate persone. Facebook descrive gli obiettivi di questo strumento di socializzazione e fornisce diversi strumenti per sviluppare l’interazione tra le persone e gli amministratori hanno strumenti specifici per gestire i partecipanti, con cui stimolare l’interazione e gestire la sicurezza e la privacy degli iscritti.
Quando si scorrono i post pubblicati nel gruppo si possono notare alcune piccole icone vicino al nome e cognome della persona che ha scritto il contenuto. Sono molto utili per capire:
chi amministra la pagina, cui rivolgersi per problemi e necessità varie, visitando il suo profilo personale si può ipotizzare le motivazioni che lo spingono a guidare il gruppo, quali sono i suoi obiettivi e le sue capacità;
chi si è iscritto da poco tempo, potrebbe essere una persona da curare con attenzione per non farla andare subito via, magari è in una fase di ascolto per capire cosa fare, il numero indicato può fare stimare la crescita veloce o lenta del numero di iscritti;
chi avvia spesso conversazioni, indica una persona molto attiva nello stimolare la partecipazione altrui, un profilo da analizzare per valutarne le capacità di influencer, il numero indicato va messo in rapporto con il numero degli iscritti per capire se il gruppo è più o meno attivo nel fare discussioni.
Nella seguente immagine si possono notare le icone e il significato associato, mostrato quando si lascia fermo il mouse per qualche secondo sull’icona alla destra del nominativo.
Le icone che rappresentano il’interazione degli iscritti in un gruppo Facebook.
I principali motori di ricerca conservano una copia del sito web nella memoria creata nei loro server, la cosiddetta copia cache, l’ultima volta che l’hanno visitata. La copia cache rappresenta un’istantanea di ogni pagina web, da utilizzare come copia di backup qualora la pagina corrente non fosse disponibile. Alcune indicazioni sulla cache di Google si trovano nella pagina di supporto https://support.google.com/websearch/answer/1687222?hl=it
Cache e social media
I motori di ricerca considerano come siti web anche le pagine pubbliche di Facebook, Twitter, ecc. in cui le informazioni sono disponibili senza vincoli di privacy e le possono leggere anche chi non vuole entrare nella piattaforma social. Pertanto, è possibile utilizzare la loro copia cache per:
a. ritrovare contenuti cancellati, se la cancellazione avviene dopo l’ultima memorizzazione nella cache;
b. stimare quanto è importante la pagina web, secondo la distanza temporale tra due memorizzazioni successive, questa distanza non è uguale per tutti, la pagina web può essere memorizzata anche più volte nello stesso giorno o una sola volta al mese;
c. verificare quali informazioni vengono memorizzate dal motore di ricerca.
Rispetto al 2017 è stata notevolmente ridotta la quantità di informazioni mostrate, per esempio non si trovano più trovare i nominativi delle persone che hanno interagito con la pagina Facebook e non vengono conservate le schede elencate a sinistra della pagina.
Vediamo ora le principali caratteristiche della memoria cache in Google e Bing e quali informazioni utili possiamo ricavare. Cache di Google
Per cercare nella copia di cache in Google bisogna scrivere cache:URL sostituendo URL con l’indirizzo desiderato, per esempio cache:https://www.facebook.com/ACMilan/ oppure cache:https://www.facebook.com/Inter/ oppure cache:https://it-it.facebook.com/corrieredellasera/ con la specifica della lingua italiana su it-it.
Purtroppo funziona solo per pagine molto attive e con grandi dimensioni, in passato funzionava anche per le piccole pagine. Si ottiene una pagina come quella indicata nell’immagine successiva.
Risultato della ricerca di pagina Facebook in cache di Google
La frase “È un’istantanea della pagina visualizzata il 24 apr 2018 09:20:48 GMT.” è molto importante per misurare la distanza temporale tra le visite successive, se questa ricerca viene eseguita molto spesso. Si può cercare una parola in questa tipologia di risultato, essendo formato da testo, con i metodi indicati nella frase che comincia con “Suggerimento”.
Scorrendo la pagina verso il basso si può notare che le fotografie non vengono conservate, al loro posto compaiono le frasi che iniziano con “L’immagine può contenere:” e alcune parole per descrivere il contenuto dell’immagine, come descritto nell’articolo presentato in questo blog.
Volendo considerare Twitter, si può cercare cache:https://twitter.com/robertomarmo si può trovare qualcosa anche se la presenza su Twitter è modesta. C’è un piccolo problema con la visualizzazione del contenuto come mostrato nell’immagine seguente.
Risultato di ricerca dell’account Twitter in cache di Google.
Il testo contenente data e ora della visita di Google è nascosto da una barra bianca, bisogna cliccare su link “Versione solo testo” per avere la versione senza la grafica in cui viene mostrato il dato temporale di interesse, come mostrato nell’immagine successiva.
Risultato con solo testo di ricerca dell’account Twitter in cache di Google.
Non viene conservato niente riguardante LinkedIn e Instagram.
Cache di Bing
Per cercare nella cache di Bing bisogna andare su http://www.bing.it e scrivere l’indirizzo URL della pagina, per esempio https://www.facebook.com/socialmediamining/, nel risultato compare a destra una piccola freccia su cui cliccare, come indicato nell’immagine seguente.
Come cercare nella cache di Bing.
A differenza di Google in questo caso compare solo la data senza l’orario, come indicato nell’immagine seguente, però riesce a catturare anche pagine Facebook con poca interazione.
Risultato della ricerca di pagina Facebook in cache di Bing.
La ricerca di un account Twitter richiede qualche passaggio da compiere, perché compare una barra con link di Twitter che copre il testo con la data di interesse. Si può selezionare tutto il contenuto della pagina, il testo copiato si può incollare in un software per gestire il testo, come il Blocco Note in Windows, da cui si può leggere la frase “Di seguito è disponibile lo snapshot della pagina Web alla data”. In Google Chrome non funziona CTRL+A per selezionare tutto il contenuto della pagina, si può cliccare con il tasto destro del mouse per scegliere “Visualizza sorgente pagina”, nel codice HTML mostrato si può cercare la frase “pagina Web alla data” continuando a leggere dopo alcuni tag si trova la data desiderata.
Non viene conservato niente riguardante LinkedIn e Instagram.
La custom audience in Facebook permette di creare un’audience personalizzata, cui mandare uno specifico messaggio pubblicitario con una buona probabilità di successo perché viene mostrato a persone interessate e ben definite. Questa funzione permette di caricare dentro Facebook una lista di nomi, indirizzi email, numeri identificativi di utenti, numeri telefonici. Il caricamento di questi dati avviene con l’account in Business Manager https://business.facebook.com/ nella sezione Audiences del menu. Altre informazioni alla pagina Pubblico personalizzato nelle pagine di help fornite da Facebook.
L’importante novità riguarda la sospensione della pubblicazione della stima di copertura (reach estimates for custom audiences) per alcune tipologie di personalizzazione, ovvero il numero di persone potenzialmente raggiungibili in possesso delle caratteristiche desiderate.
Il numero di persone con certe caratteristiche non è disponibile in custom audience create con e-mail.
L’annuncio ufficiale è stato pubblicato il 23 gennaio 2018 nel blog per gli sviluppatori nella sezione dedicata alle inserzioni, in cui sono pubblicati i dettagli su altre tipologie di informazioni sospese.
L’articolo pubblicato su fastcompany.com spiega come la stima della copertura possa creare un pericolo per la privacy degli utenti Facebook, grazie alla possibilità di ricavare informazioni riservate dal suo profilo personale.
Per esempio, si può caricare una sola email nel sistema e, tramite la scelta tra le centinaia di caratteristiche possibili per la targetizzazione dettagliata come nell’immagine seguente.
Alcune caratteristiche possibili per la targetizzazione dettagliata
Si può leggere il numero di persone che hanno l’opzione indicata, la risposta è del tipo 1/0 ovvero la persona individuata ha o non ha la specifica caratteristica. Oppure, si può inserire una lista di email e scegliere la fascia di età, si legge il numero delle persone raggiungibili suggerito dalla grafica, poi si aggiunge una nuova email, si ripete la stima del numero, se esso non cambia vuol dire che la persona associata alla nuova email non ha la stessa caratteristica delle altre persone nell’elenco creato.
Si aspettano comunicazioni da Facebook su cosa intende fare, per offrire una funzione equivalente con meno rischi per la privacy.
Ironia e humor si possono analizzare nell’ambito di un testo pubblicato sui famosi social network? Le difficoltà non mancano, nuove possibilità sono fornite dalla ricerca sui fenomeni sintattico-semantici dell’italiano giovanile usato in Facebook. Alcuni spunti per creare un approccio semiautomatico al riconoscimento dell’ironia e humor in Facebook sono stati trattati nella tesi di laurea magistrale in Linguistica Teorica, Applicata e delle Lingue Moderne del Dott. Andrea Martocchi presso l’Università degli Studi di Pavia.
Un problema complesso
L’Opinion Mining (OM) fornisce strumenti per l’estrazione automatica di opinioni e valutazioni soggettive da un testo, perciò sta conoscendo un notevole sviluppo in molti ambiti: strategie di marketing, servizi per la cura del cliente, analisi politiche. Un sistema di Opinion Mining deve considerare la presenza di ironia e humor, fenomeni che incidono profondamente nell’interpretazione di un testo scritto e che sono assai frequenti. Infatti, la mancata individuazione della sola ironia verbale (ironia che trasmette un significato opposto a quello letterale) può ridurre del 30% la precisione di un sistema di OM.
La questione, complessa e ancora poco studiata, è complicata dal fatto che ironia e humor dipendono ampiamente da fattori esterni al testo: per esempio, nel caso di un commento di Facebook occorre conoscere il contesto di enunciazione (il contenuto del post a cui il commento si riferisce) e condividere un insieme di conoscenze con l’autore del testo (Common Shared Knowledge), poiché spesso l’ironia evidenzia il sovvertimento di regole e situazioni comuni.
Vantaggi dei modelli integrati
Servono dunque dei modelli integrati che valutino allo stesso tempo fattori linguistici e contestuali; ma questi fattori, specialmente quelli contestuali, variano molto a seconda del tipo di testo e della situazione comunicativa (chi parla, a chi si rivolge, che mezzo usa).
Elaborare una teoria “generale” di ironia e humor applicabile a un algoritmo per fargliele riconoscere in un testo resta altamente improbabile. Un obiettivo più fattibile riguarda modelli ad hoc per individuare ironia e humor, ad esempio, in una determinata comunità online. Ne è un esempio il lavoro descritto nella tesi di laurea di Bernardini, che ha analizzato il comportamento dei commentatori della pagina Il Fatto Quotidiano Online scoprendo che la maggioranza dei commenti ironici sono prodotti da un ristretto gruppo di utenti abituali (+500 commenti sul sito). Bernardini ha combinato questa e altre osservazioni con un sistema di riconoscimento dei segni espliciti di ironia (risate, emoticon, punteggiatura enfatica ecc.); è stato così ottenuto un algoritmo per stabilire la probabilità che un commento sia ironico o meno.
Il rapporto tra comicità e popolarità nell’italiano dell’ignoranza
Lo studio di Bernardini ha una base sociologica (identità e comportamento degli utenti; interazione tra gruppi di utenti abituali) e probabilistica, perché mira a calcolare la probabilità che un commento sia ironico senza nemmeno leggerlo; questi aspetti sono centrali nella ricerca semiautomatica di ironia e humor svolta in questa tesi di laurea.
Obiettivo primario del lavoro di tesi qui presentato era creare un corpus di commenti di Facebook per studiare l’italiano dell’ignoranza, una forma di italiano giovanile che prevede l’impiego comico/ironico di tratti linguistici del parlato colloquiale e dei dialetti, come la costruzione transitiva del verbo uscire (ho uscito la penna).
Data la definizione dell’italiano dell’ignoranza, occorreva raccogliere commenti che avessero intento comico o ironico. Classificare i commenti manualmente avrebbe significato lavorare su una quantità di dati insufficiente per il tipo di analisi linguistiche da condurre. Per evitare questo problema, è stato ideata una procedura che incrementasse la probabilità di trovare commenti ironici o comici senza leggerli. Il metodo è semiautomatico, poiché prevede sia operazioni manuali che automatiche.
Analisi delle comunità online
Si inizia con la selezione manuale del “dominio”, cioè la ricerca di pagine pubbliche create a scopo di intrattenimento comico, popolari (oltre 200.000 Mi Piace) e frequentate soprattutto da giovani, un esempio è indicato nell’immagine successiva.
Esempio di post comico/ironico con il suo commento più popolare.
Si osserva che queste pagine (circa una quarantina) sono suddivisibili in due classi in base agli atteggiamenti e alle intenzioni delle rispettive comunità di utenti:
pagine post-oriented: gli utenti leggono e condividono in modo “acritico” i post comici pubblicati dalla pagina, i commenti hanno un ruolo marginale e solitamente non contengono testo;
pagine comment-oriented: produzione e lettura di commenti comici o ironici sono obiettivi primari; i commenti ritenuti più sagaci sono valorizzati dalla comunità (tramite Mi Piace e reazioni) e sono tra i primi a comparire quando si apre un post.
Una statistica condotta su 50 post per pagina, scelti casualmente, mostra che le pagine tendono a essere costantemente comment-oriented o costantemente post-oriented. Sono state scelte 15 pagine comment-oriented, per le quali vale la corrispondenza “comicità del commento = popolarità”.
Utilizzo di Facepager
La parte automatica del procedimento è svolta da Facepager disponibile su https://github.com/strohne/Facepager , un software che estrae contenuti pubblici sfruttando il Facebook Graph API. Nell’immagine seguente il meccanismo di estrazione dei post dalla pagina Facebook tramite Facepager.
Descrizione dell’estrazione di dati pubblici con Facepager.
Un pregio di Facepager consiste nello scaricare i commenti a un post secondo l’ordine di relevance («pertinenza, rilevanza» ma anche «popolarità»), ovvero chiedendo al programma 10 commenti per post, vengono scaricati i 10 commenti più “rilevanti”. Il parametro principale (anche se non l’unico) per stabilire la relevance è il numero di Mi Piace/reazioni: per cui, tra i primi 10 commenti ci sarà un’altra probabilità di trovare i commenti con più Mi Piace/reazioni, ossia quelli ritenuti “più comici/ironici” dagli utenti. In questo modo sono stati raccolti oltre 35.000 commenti in cui i tratti dell’italiano dell’ignoranza compaiono molto frequentemente, come riepilogato nell’immagine successiva.
Finestra principale di Facepager. La seconda linea indica il post e alcuni dati come il numero di condivisioni (shares.count). Al livello inferiore vi sono i commenti al post: quello con più Mi Piace compare in cima.
Conclusioni: pro e contro del metodo semiautomatico
La procedura ha alcuni difetti: è efficace solo su un dominio prestabilito, la distinzione tra ironia e humor (importante in OM) non è valutabile e vi sono commenti né ironici né comici che però hanno alta relevance (commenti degli admin, commenti con pochi Mi Piace ma molte risposte ecc.).
Ciononostante, si tratta di un metodo efficace sulle pagine selezionate, economico (buona resa con risorse limitate) e applicabile a grandi quantità di dati. Bisogna sottolineare che su Facebook l’osservazione di abitudini e comportamenti delle comunità di utenti è un parametro fondamentale, da unire alle tecniche di social media mining per ottenere modelli integrati sempre più precisi e affidabili.
Bibliografia
– Sull’incidenza di ironia in un sistema di OM: Sarmento et al. 2009. Automatic creation of a reference corpus for political opinion mining in user-generated content. Proceedings of the 1st internationalCIKM workshop on topic-sentiment analysis for mass opinion. ACM. 29– 36. Link: https://dl.acm.org/citation.cfm?id=1651468
– Per la ricerca di Bernardini sul Fatto Quotidiano Online: Bernardini, Lorenzo. 2014. Un nuovo parametro per l’individuazioneautomatica dell’ironia: la fonte dell’enunciato. Tesi di Laurea Magistrale in Linguistica Teorica e Applicata. Pavia: Università di Pavia.
Martocchi, Andrea. 2017. Transitivizzazione e inaccusativizzazione nell’italiano “dell’ignoranza” su Facebook: creazione e analisi di un corpus di commenti. Tesi di laurea magistrale in Linguistica teorica, applicata e delle lingue moderne. Manoscritto: Università degli Studi di Pavia. Relatrice: prof.ssa Elisabetta Ježek.
Breve CV dell’autore della tesi di laurea Andrea Martocchi è nato a Chiavenna (SO) nel 1992, dopo la maturità scientifica ha conseguito la laurea triennale in Lettere Moderne presso l’Università degli Studi di Milano, seguita dalla laurea magistrale in Linguistica Teorica, Applicata e delle Lingue Moderne presso l’Università degli Studi di Pavia, con una tesi su alcuni fenomeni sintattico-semantici dell’italiano giovanile di Facebook.
Si occupa di corpus linguistics e di sociolinguistica applicate a Facebook, di sociofonetica dei dialetti della Valchiavenna (SO) e di alcuni aspetti dell’interazione tra lessico e sintassi nell’italiano contemporaneo. Sta curando un atlante toponomastico del Comune di Piuro (SO) e sta lavorando sull’uso della punteggiatura nei social network. I suoi interessi futuri sono rivolti all’insegnamento superiore e all’attività di ricerca negli ambiti del Social Media Mining, della linguistica teorica e della dialettologia.
Si può contattare su LinkedIn con https://www.linkedin.com/in/andrea-martocchi-230929153/
Facebook usa algoritmi sofisticati per riconoscere gli oggetti nelle immagini. Le sue capacità di riconoscimento si possono verificare tramite le parole scritte nel tag IMG alla clausola ALT, utili per aiutare i software in grado di leggere con una voce artificiale il contenuto di una pagina web, come già spiegato in un articolo pubblicato in questo blog,
Facebook è in grado di associare la descrizione “albero di natale” a tante immagini contenenti un Albero di Natale, anche in immagini al buio con un albero illuminato, come la seguente immagine ripresa davanti alla stazione di Milano Centrale.
Nel periodo delle festività di Natale può essere utile cercare tra le immagini caricate in Facebook e contenenti un Albero di Natale, per avere idee nel comporre un messaggio di auguri, fare una fotografia particolare, capire quale immagine natalizia ha maggiore diffusione.
L’export italiano cresce a ritmi importanti, per trarne vantaggio non bisogna sbagliare la scelta del mercato estero in cui esportare.
Questo trattato spiega le principali tecniche di Social Media Mining per estrarre informazioni dai Social Media con cui scrivere il piano export, documento necessario per individuare la corretta strategia per il processo di internazionalizzazione verso il mercato estero di interesse.
Scritto da Roberto Marmo, autore di questo blog e del libro Social Media Mining, e Giuseppe Lavalle, Temporary Export Manager specializzato in percorsi di internazionalizzazione delle PMI, le competenze sono descritte nel profilo LinkedIn email g_lavalle@hotmail.com
Tra gli argomenti trattati:
Cosa vuol dire internazionalizzare
Preparare la ricerca di informazioni
Tipologie di informazioni estraibili
Dieci esempi
Riepilogare le informazioni trovate
Pubblicato da StreetLib per avere un e-book a basso prezzo con ampia diffusione.
Ebook su Amazon per 2,99 euro con ISBN 9788826092430, libro di 102 pagine su StreetLib con ISBN 9788826491097.
Alla fiera SMAU a Milano il 24 ottobre ore 13 presso Arena Digital Trends Roberto Marmo, autore del libro “Social Media Mining“, spiegherà come fare ricerche di mercato con il Social Media Mining, dettagli su https://www.smau.it/milano17/schedules/ricerche-di-mercato-con-il-social-media-mining/
I 100 posti disponibili sono stati esauriti in 48 ore, a dimostrazione del grande interesse per le tematiche trattate, sono disponibili posti in piedi.
Dalle ore 14 alle 14.30 sarà presente allo stand dell’editore Hoepli. Dalle ore 14.30 sarò presente nello stand di IWA l’associazione internazionale per la professionalità nel web, che ha permesso di organizzare il workshop.
La fotografia seguente viene usata come seconda immagine nella pagina ufficiale dell’edizione SMAU a Milano, mostra Roberto Marmo mentre parla di informazioni dalle pagine Facebook in un evento SMAU del 2016.
Marmo Roberto parla di Facebook in un workshop in Fiera SMAU.
Giandomenico De Franco di http://www.compedata.com/ e Roberto Marmo, autore di questo blog, hanno usato le tecniche di Social Media Mining per cercare dati sull’interazione social dei brand nell’abbigliamento intimo, e per cercare di capire se c’è una correlazione tra il successo sui social media e le performance economico finanziarie delle aziende.
I risultati sono stati pubblicati in un articolo della rivista LargoConsumo nel numero di 07-08/2017 alle pagine 80-81. Nell’articolo viene descritto il confronto finanziario fra i leader e la media del settore, il raffronto fra i principali operatori circa l’uso dei social media permette di analizzarne le caratteristiche dell’attività di comunicazione.
L’articolo è disponibile a pagamento su http://www.largoconsumo.info/dettaglio_notizia?notizia=L%E2%80%99interazione-social-dei-brand&documentId=248415 percorso di lettura: http://www.largoconsumo.info/AbbigliamentoIntimo un estratto è rappresentato nell’immagine seguente.