Facebook toglie la stima del pubblico nelle Custom Audiences

La custom audience in Facebook permette di creare un’audience personalizzata, cui mandare uno specifico messaggio pubblicitario con una buona probabilità di successo perché viene mostrato a persone interessate e ben definite. Questa funzione permette di caricare dentro Facebook una lista di nomi, indirizzi email, numeri identificativi di utenti, numeri telefonici. Il caricamento di questi dati avviene con l’account in Business Manager https://business.facebook.com/  nella sezione Audiences del menu. Altre informazioni alla pagina Pubblico personalizzato nelle pagine di help fornite da Facebook.

L’importante novità riguarda la sospensione della pubblicazione della stima di copertura (reach estimates for custom audiences) per alcune tipologie di personalizzazione, ovvero il numero di persone potenzialmente raggiungibili in possesso delle caratteristiche desiderate.

custom audiences facebook numero persone 4
Il numero di persone con certe caratteristiche non è disponibile in custom audience create con e-mail.

L’annuncio ufficiale è stato pubblicato il 23 gennaio 2018 nel blog per gli sviluppatori nella sezione dedicata alle inserzioni, in cui sono pubblicati i dettagli su altre tipologie di informazioni sospese.

Questa decisione proviene dalla segnalazione di bug nella privacy creata dai ricercatori della Northeastern University, in particolare dal prof. Alan Mislove  https://www.ccis.northeastern.edu/people/alan-mislove/

L’articolo pubblicato su fastcompany.com   spiega come la stima della copertura possa creare un pericolo per la privacy degli utenti Facebook, grazie alla possibilità di ricavare informazioni riservate dal suo profilo personale.

Per esempio, si può caricare una sola email nel sistema e, tramite la scelta tra le centinaia di caratteristiche possibili per la targetizzazione dettagliata come nell’immagine seguente.

custom audiences facebook caratteristiche persone
Alcune caratteristiche possibili per la targetizzazione dettagliata

Si può leggere il numero di persone che hanno l’opzione indicata, la risposta è del tipo 1/0 ovvero la persona individuata ha o non ha la specifica caratteristica. Oppure, si può inserire una lista di email e scegliere la fascia di età, si legge il numero delle persone raggiungibili suggerito dalla grafica, poi si aggiunge una nuova email, si ripete la stima del numero, se esso non cambia vuol dire che la persona associata alla nuova email non ha la stessa caratteristica delle altre persone nell’elenco creato.

Si aspettano comunicazioni da Facebook su cosa intende fare, per offrire una funzione equivalente con meno rischi per la privacy.

 

Approccio semiautomatico per riconoscere ironia e humor nei commenti di Facebook

Ironia e humor si possono analizzare nell’ambito di un testo pubblicato sui famosi social network? Le difficoltà non mancano, nuove possibilità sono fornite dalla ricerca sui fenomeni sintattico-semantici dell’italiano giovanile usato in Facebook. Alcuni spunti per creare un approccio semiautomatico al riconoscimento dell’ironia e humor in Facebook sono stati trattati nella tesi di laurea magistrale in Linguistica Teorica, Applicata e delle Lingue Moderne del Dott. Andrea Martocchi presso l’Università degli Studi di Pavia.

Un problema complesso

L’Opinion Mining (OM) fornisce strumenti per l’estrazione automatica di opinioni e valutazioni soggettive da un testo, perciò sta conoscendo un notevole sviluppo in molti ambiti: strategie di marketing, servizi per la cura del cliente, analisi politiche. Un sistema di Opinion Mining deve considerare la presenza di ironia e humor, fenomeni che incidono profondamente nell’interpretazione di un testo scritto e che sono assai frequenti. Infatti, la mancata individuazione della sola ironia verbale (ironia che trasmette un significato opposto a quello letterale) può ridurre del 30% la precisione di un sistema di OM.

La questione, complessa e ancora poco studiata, è complicata dal fatto che ironia e humor dipendono ampiamente da fattori esterni al testo: per esempio, nel caso di un commento di Facebook occorre conoscere il contesto di enunciazione (il contenuto del post a cui il commento si riferisce) e condividere un insieme di conoscenze con l’autore del testo (Common Shared Knowledge), poiché spesso l’ironia evidenzia il sovvertimento di regole e situazioni comuni.

Vantaggi dei modelli integrati

Servono dunque dei modelli integrati che valutino allo stesso tempo fattori linguistici e contestuali; ma questi fattori, specialmente quelli contestuali, variano molto a seconda del tipo di testo e della situazione comunicativa (chi parla, a chi si rivolge, che mezzo usa).

Elaborare una teoria “generale” di ironia e humor applicabile a un algoritmo per fargliele riconoscere in un testo resta altamente improbabile. Un obiettivo più fattibile riguarda modelli ad hoc per individuare ironia e humor, ad esempio, in una determinata comunità online. Ne è un esempio il lavoro descritto nella tesi di laurea di Bernardini, che ha analizzato il comportamento dei commentatori della pagina Il Fatto Quotidiano Online scoprendo che la maggioranza dei commenti ironici sono prodotti da un ristretto gruppo di utenti abituali (+500 commenti sul sito). Bernardini ha combinato questa e altre osservazioni con un sistema di riconoscimento dei segni espliciti di ironia (risate, emoticon, punteggiatura enfatica ecc.); è stato così ottenuto un algoritmo per stabilire la probabilità che un commento sia ironico o meno.

Il rapporto tra comicità e popolarità nell’italiano dell’ignoranza

Lo studio di Bernardini ha una base sociologica (identità e comportamento degli utenti; interazione tra gruppi di utenti abituali) e probabilistica, perché mira a calcolare la probabilità che un commento sia ironico senza nemmeno leggerlo; questi aspetti sono centrali nella ricerca semiautomatica di ironia e humor  svolta in questa tesi di laurea.

Obiettivo primario del lavoro di tesi qui presentato era creare un corpus di commenti di Facebook per studiare l’italiano dell’ignoranza, una forma di italiano giovanile che prevede l’impiego comico/ironico di tratti linguistici del parlato colloquiale e dei dialetti, come la costruzione transitiva del verbo uscire (ho uscito la penna).

Data la definizione dell’italiano dell’ignoranza, occorreva raccogliere commenti che avessero intento comico o ironico. Classificare i commenti manualmente avrebbe significato lavorare su una quantità di dati insufficiente per il tipo di analisi linguistiche da condurre. Per evitare questo problema, è stato ideata una procedura che incrementasse la probabilità di trovare commenti ironici o comici senza leggerli. Il metodo è semiautomatico, poiché prevede sia operazioni manuali che automatiche.

Analisi delle comunità online

Si inizia con la selezione manuale del “dominio”, cioè la ricerca di pagine pubbliche create a scopo di intrattenimento comico, popolari (oltre 200.000 Mi Piace) e frequentate soprattutto da giovani, un esempio è indicato nell’immagine successiva.

esempio di post comico/ironico con il suo commento più popolare
Esempio di post comico/ironico con il suo commento più popolare.

Si osserva che queste pagine (circa una quarantina) sono suddivisibili in due classi in base agli atteggiamenti e alle intenzioni delle rispettive comunità di utenti:

  • pagine post-oriented: gli utenti leggono e condividono in modo “acritico” i post comici pubblicati dalla pagina, i commenti hanno un ruolo marginale e solitamente non contengono testo;
  • pagine comment-oriented: produzione e lettura di commenti comici o ironici sono obiettivi primari; i commenti ritenuti più sagaci sono valorizzati dalla comunità (tramite Mi Piace e reazioni) e sono tra i primi a comparire quando si apre un post.

Una statistica condotta su 50 post per pagina, scelti casualmente, mostra che le pagine tendono a essere costantemente comment-oriented o costantemente post-oriented. Sono state scelte 15 pagine comment-oriented, per le quali vale la corrispondenza “comicità del commento = popolarità”.

Utilizzo di Facepager

La parte automatica del procedimento è svolta da Facepager disponibile su https://github.com/strohne/Facepager , un software che estrae contenuti pubblici sfruttando il Facebook Graph API. Nell’immagine seguente il meccanismo di estrazione dei post dalla pagina Facebook tramite Facepager.

Descrizione dell’estrazione di dati pubblici con Facepager
Descrizione dell’estrazione di dati pubblici con Facepager.

Un pregio di Facepager consiste nello scaricare i commenti a un post secondo l’ordine di relevance («pertinenza, rilevanza» ma anche «popolarità»), ovvero chiedendo al programma 10 commenti per post, vengono scaricati i 10 commenti più “rilevanti”. Il parametro principale (anche se non l’unico) per stabilire la relevance è il numero di Mi Piace/reazioni: per cui, tra i primi 10 commenti ci sarà un’altra probabilità di trovare i commenti con più Mi Piace/reazioni, ossia quelli ritenuti “più comici/ironici” dagli utenti. In questo modo sono stati raccolti oltre 35.000 commenti in cui i tratti dell’italiano dell’ignoranza compaiono molto frequentemente, come riepilogato nell’immagine successiva.

tesiMartocchi3.jpg
Finestra principale di Facepager. La seconda linea indica il post e alcuni dati come il numero di condivisioni (shares.count). Al livello inferiore vi sono i commenti al post: quello con più Mi Piace compare in cima.

Conclusioni: pro e contro del metodo semiautomatico

La procedura ha alcuni difetti: è efficace solo su un dominio prestabilito, la distinzione tra ironia e humor (importante in OM) non è valutabile e vi sono commenti né ironici né comici che però hanno alta relevance (commenti degli admin, commenti con pochi Mi Piace ma molte risposte ecc.).

Ciononostante, si tratta di un metodo efficace sulle pagine selezionate, economico (buona resa con risorse limitate) e applicabile a grandi quantità di dati. Bisogna sottolineare che su Facebook l’osservazione di abitudini e comportamenti delle comunità di utenti è un parametro fondamentale, da unire alle tecniche di social media mining per ottenere modelli integrati sempre più precisi e affidabili.

Bibliografia

– Sull’incidenza di ironia in un sistema di OM:  Sarmento et al. 2009. Automatic creation of a reference corpus for political opinion mining in user-generated content. Proceedings of the 1st international CIKM workshop on topic-sentiment analysis for mass opinion. ACM. 29– 36. Link: https://dl.acm.org/citation.cfm?id=1651468

– Per la ricerca di Bernardini sul Fatto Quotidiano Online: Bernardini, Lorenzo. 2014. Un nuovo parametro per l’individuazione automatica dell’ironia: la fonte dell’enunciato. Tesi di Laurea Magistrale in Linguistica Teorica e Applicata. Pavia: Università di Pavia.

 Martocchi, Andrea. 2017. Transitivizzazione e inaccusativizzazione nell’italiano “dell’ignoranza” su Facebook: creazione e analisi di un corpus di commenti. Tesi di laurea magistrale in Linguistica teorica, applicata e delle lingue moderne. Manoscritto: Università degli Studi di Pavia. Relatrice: prof.ssa Elisabetta Ježek.      

Breve CV dell’autore della tesi di laurea
Andrea Martocchi è nato a Chiavenna (SO) nel 1992, dopo la maturità scientifica ha conseguito la laurea triennale in Lettere Moderne presso l’Università degli Studi di Milano, seguita dalla laurea magistrale in Linguistica Teorica, Applicata e delle Lingue Moderne presso l’Università degli Studi di Pavia, con una tesi su alcuni fenomeni sintattico-semantici dell’italiano giovanile di Facebook.
Si occupa di corpus linguistics e di sociolinguistica applicate a Facebook, di sociofonetica dei dialetti della Valchiavenna (SO) e di alcuni aspetti dell’interazione tra lessico e sintassi nell’italiano contemporaneo. Sta curando un atlante toponomastico del Comune di Piuro (SO) e sta lavorando sull’uso della punteggiatura nei social network. I suoi interessi futuri sono rivolti all’insegnamento superiore e all’attività di ricerca negli ambiti del Social Media Mining, della linguistica teorica e della dialettologia.
Si può contattare su LinkedIn con https://www.linkedin.com/in/andrea-martocchi-230929153/

Andrea Martocchi
Andrea Martocchi

Facebook riconosce l’Albero di Natale nelle immagini

Facebook usa algoritmi sofisticati per riconoscere gli oggetti nelle immagini. Le sue capacità di riconoscimento si possono verificare tramite le parole scritte nel tag IMG alla clausola ALT, utili per aiutare i software in grado di leggere con una voce artificiale il contenuto di una pagina web, come già spiegato in un articolo pubblicato in questo blog, 

Facebook è in grado di associare la descrizione “albero di natale” a tante immagini contenenti un Albero di Natale, anche in immagini al buio con un albero illuminato, come la seguente immagine ripresa davanti alla stazione di Milano Centrale.

albero natale stazione milano centrale

Nel periodo delle festività di Natale può essere utile cercare tra le immagini caricate in Facebook e contenenti un Albero di Natale, per avere idee nel comporre un messaggio di auguri, fare una fotografia particolare, capire quale immagine natalizia ha maggiore diffusione.

Per realizzare tutto ciò, si possono leggere i suggerimenti indicati nell’articolo “Le immagini di Natale per l’algoritmo di Facebook: il data mining” pubblicato sul blog curato da Alessia Camera dedicato al Growth Hacking

Social Media Mining dei mercati esteri

social-mining-export

L’export italiano cresce a ritmi importanti, per trarne vantaggio non bisogna sbagliare la scelta del mercato estero in cui esportare.

Questo trattato spiega le principali tecniche di Social Media Mining per estrarre informazioni dai Social Media con cui scrivere il piano export, documento necessario per individuare la corretta strategia per il processo di internazionalizzazione verso il mercato estero di interesse.

Scritto da Roberto Marmo, autore di questo blog e del libro Social Media Mining, e Giuseppe Lavalle, Temporary Export Manager specializzato in percorsi di internazionalizzazione delle PMI, le competenze sono descritte nel profilo LinkedIn  email g_lavalle@hotmail.com

Tra gli argomenti trattati:

  • Cosa vuol dire internazionalizzare
  • Preparare la ricerca di informazioni
  • Tipologie di informazioni estraibili
  • Dieci esempi
  • Riepilogare le informazioni trovate

Pubblicato da StreetLib per avere un e-book a basso prezzo con ampia diffusione.

Ebook su Amazon per 2,99 euro con ISBN 9788826092430, libro di 102 pagine su StreetLib con ISBN 9788826491097.

Workshop SMAU Milano 2017 su ricerche di mercato con Social Media Mining

Alla fiera SMAU a Milano il 24 ottobre ore 13 presso Arena Digital Trends Roberto Marmo, autore del libro “Social Media Mining“, spiegherà come fare ricerche di mercato con il Social Media Mining, dettagli su https://www.smau.it/milano17/schedules/ricerche-di-mercato-con-il-social-media-mining/
I 100 posti disponibili sono stati esauriti in 48 ore, a dimostrazione del grande interesse per le tematiche trattate, sono disponibili posti in piedi.
Dalle ore 14 alle 14.30 sarà presente allo stand dell’editore Hoepli. Dalle ore 14.30 sarò presente nello stand di IWA l’associazione internazionale per la professionalità nel web, che ha permesso di organizzare il workshop.
La fotografia seguente viene usata come seconda immagine nella pagina ufficiale dell’edizione SMAU a Milano,  mostra Roberto Marmo mentre parla di informazioni dalle pagine Facebook in un evento SMAU del 2016.

Marmo Roberto, SMAU, workshop, Facebook
Marmo Roberto parla di Facebook in un workshop in Fiera SMAU.

 

Interazione social dei brand nell’abbigliamento intimo

Giandomenico De Franco di http://www.compedata.com/ e Roberto Marmo, autore di questo blog, hanno usato le tecniche di Social Media Mining per cercare dati sull’interazione social dei brand nell’abbigliamento intimo, e per cercare di capire se c’è una correlazione tra il successo sui social media e le performance economico finanziarie delle aziende.
I risultati sono stati pubblicati in un articolo della rivista LargoConsumo nel numero di 07-08/2017 alle pagine 80-81. Nell’articolo viene descritto il confronto finanziario fra i leader e la media del settore, il raffronto fra i principali operatori circa l’uso dei social media permette di analizzarne le caratteristiche dell’attività di comunicazione.
L’articolo è disponibile a pagamento su http://www.largoconsumo.info/dettaglio_notizia?notizia=L%E2%80%99interazione-social-dei-brand&documentId=248415 percorso di lettura: http://www.largoconsumo.info/AbbigliamentoIntimo un estratto è rappresentato nell’immagine seguente.

largoconsumo-intimo-social-2017