Così il coronavirus domina le ricerche sul web dal Sud al Nord: ricerca di Alkemy

59

Il 33% degli italiani risulta essere sensibile al tema “stare a casa”, con una prevalenza nel Sud Italia rispetto al Nord. E’ una delle evidenze emerse dalla ricerca “Topic Modeling Italia Covid-19 basata su Twitter Listening” condotta da Alkemy Lab, stream di ricerca e innovazione del gruppo Alkemy, nel periodo che va dal 18 febbraio al 20 marzo 2020.In particolare, Alkemy Lab ha realizzato una mappa (vedi qui) in cui sono stati individuati gli argomenti maggiormente discussi in Italia, nelle singole regioni e nelle città con la selezione speciale degli hashtag #covid19, #coronavirus, #coronavirusitalia.
Da un primo sguardo ai dati emerge innanzitutto che quasi la metà dei tweet sull’argomento si è concentrata in due regioni, il Lazio – in testa con il 28,1% dei tweet sul totale – e la Lombardia con il 21%, con una concentrazione sui principali centri Roma (27% dei tweet sul totale a livello nazionale) e Milano (15,2%). Con grande distacco rispetto alle precedenti, segue l’Emilia- Romagna al terzo posto (6,74%) e la Campania (6,31%).
Gli hashtag più numerosi, abbinati alle parole Covid19 (#coronavirus, #coronavirusitalia, ecc) sono stati quelli relativi al topic “Ricerca Informazioni” che rappresenta il 61,80% dei tweet sul totale: nell’ultimo mese gli italiani si sono molto concentrati sull’informazione, cercando e chiedendo spiegazioni soprattutto per quanto riguarda decreti e sanità. Segue il tema “Stare a Casa”con il 33,28% dei tweet. L’appello delle Istituzioni a rimanere a casa sembra quindi aver funzionato per circa 1/3 del campione; marginale, invece, sembra essere stato l’interesse verso le politiche europee, con solo il 4,92% dei tweet.
Addentrandosi nell’analisi dei topic regione per regione, un trend interessante è che il tema “Stare a Casa” è più caro alle regioni del Sud: al primo posto, per numero di tweet nella regione, c’è la Sardegna (43,7% sul totale dei tweet localizzati nella regione), seguita da Campania (42,8%) e Calabria (41,3%), fuori dal podio Veneto e Lombardia. Il tema delle politiche europee ha interessato maggiormente le regioni del centro-Italia (Abruzzo 9,29%, Lazio 9,16% e Umbria 8,76%) mentre per quanto riguarda il topic più popolare, “Ricerca delle Informazioni”, in cima alla classifica troviamo la Valle d’Aosta (con oltre il 70% dei tweet localizzati nella regione), seguita dal Trentino (64,9%) e dalla Sicilia (64,1%).

Informazioni metodologiche
La ricerca ha svolto una prima fase di raccolta dati, tramite le Twitter API, concentrandosi su segmento temporale che va dal 18 febbraio 2020 (prima dell’inizio della diffusione dell’epidemia in Italia su larga scala) al 20 marzo 2020. Dopo l’attività di Data Cleaning ed estrapolazione della Location Utente, è stato utilizzato il modello statistico generativo Latent Dirichlet Allocation (LDA) che ha individuato i seguenti tre topic principali:
1. “Stare a casa”: tema comune invito a rimanere a casa (parole chiave: ‘iorestoacasa’, ‘uscire’, ‘casa’, ‘stare’, ‘porto’, ‘tempo’, ‘restare’)
2. “Politiche Europee”: temi incentrati sul tema politico europeo, crisi finanziaria e idea di uscire dall’Europa a causa dei mancati aiuti (‘Europa’, ‘chiedere’, ‘Bce’, ‘paese’, ‘euro’, ‘Germania’, ‘ruolo’, ‘Russia’, ‘Ue’, ‘staccarci’)
3. “Ricerca informazioni”: le persone cercano e chiedono informazioni riguardo decreti e Sanità (parole chiave: ‘emergenza’, ‘decretare’, ‘rischiare’, ‘notizia’, ‘smartphone’).
L’elemento più originale della ricerca sta nell’organizzare i dati raccolti su una mappa interattiva dell’Italia (vedi qui) che individua in termini percentuali gli argomenti maggiormente discussi nelle singole regioni e nelle città grazie alla selezione speciale degli hashtag #covid19, #coronavirus, #coronavirusitalia.