Anteprima
Vedrai una selezione di 7 pagine su 28
Giornalismo Digitale - Appunti lezioni Pag. 1 Giornalismo Digitale - Appunti lezioni Pag. 2
Anteprima di 7 pagg. su 28.
Scarica il documento per vederlo tutto.
Giornalismo Digitale - Appunti lezioni Pag. 6
Anteprima di 7 pagg. su 28.
Scarica il documento per vederlo tutto.
Giornalismo Digitale - Appunti lezioni Pag. 11
Anteprima di 7 pagg. su 28.
Scarica il documento per vederlo tutto.
Giornalismo Digitale - Appunti lezioni Pag. 16
Anteprima di 7 pagg. su 28.
Scarica il documento per vederlo tutto.
Giornalismo Digitale - Appunti lezioni Pag. 21
Anteprima di 7 pagg. su 28.
Scarica il documento per vederlo tutto.
Giornalismo Digitale - Appunti lezioni Pag. 26
1 su 28
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Tweet + alcuni dati delle pagine Facebook: SociovizScraping

Uno scrape è un programmino che simula la navigazione in Internet di un essere umano: simula un essere umano che si cerca un sito Internet. È considerata una pratica controversa (non è illegale) dal punto di vista etico, perché:

  • Lo scraping ha la capacità di far crashare i siti web o i server perché questa operazione (bot che fa copia e incolla come un essere umano) viene velocizzata al massimo;
  • Spesso viene usato per aggirare i blocchi di privacy;
  • Dati che i social media non vogliono condividere.

Parliamo di etica quando ragionando su come fare ricerca sociale, ci poniamo il problema dei valori morali e come questi entrano nei nostri processi di raccolta e di processamento dei dati.

Ricerca incentrata sugli attori e ricerca incentrata sul topic:

Il primo caso è il più semplice: quando faccio una ricerca su un piccolo gruppo di persone, i principi etici visti sopra sono...

La network analysis è una metodologia di ricerca sociale che ha alla base un principio epistemologico. La realtà viene concepita come una rete di interazioni; studia la rete della società e questa struttura emerge da una rete di interazioni sociali quotidiane. L'unità di analisi (entità da cui estraggo informazioni) è composta dalle relazioni tra persone e ci interessa cosa succede tra i nodi.

La disciplina è molto antica:

Il collegamento tra un nodo e l'altro si chiama edge (sinonimo di collegamento). L'insieme di nodi e edge si chiama network (graph). La direzione delle relazioni tra i nodi sono due: diretta e non diretta. Una relazione diretta ha una direzione, mentre una non diretta è senza direzione. Ogni relazione ha un attributo che può essere quantitativo (peso) o qualitativo (rank e type).

La metrica fondamentale è la

centralità: qual è il nodo più importante di un network? Quando parliamo di questa metrica, abbiamo: degree: la somma dei legali che sono connesse ad un nodo; in-Degree: numero di link che un nodo riceve; out-Degree: numero di collegamenti di link che escono da un nodo. Ci sono altre metriche più avanzate. Una metrica molto importante è la densità: si calcola prendendo le connessioni effettive che ci sono tra i nodi, dividendole per le connessioni potenziali. Le ultime due metriche si chiamano closeness centrality e betweenness centrality. Network Path: percorso che bisogna fare da un nodo del network per arrivare ad un altro nodo. Geodesic Path: il percorso più breve che si può fare. Closeness centrality: la media della distanza che separa un nodo da qualsiasi altro nodo. Se io prendo un nodo sulla rete e voglio arrivare ad un altro, in media dovrò fare tot passi. Ci da un'idea sulla velocità in cui si propaga.

l'informazione.

Betweenness centrality: ci dà la misura di quanto spesso un nodo appare nel percorso più breve tra due nodi in un network. Un nodo che ha un'alta betweenness centrality, è un nodo che funziona da ponte che connette dei nodi o comunità.

Un'altra metrica è la modularità: è la tendenza di un network a comporsi in sotto-network (comunità). La modularità ci dà un'informazione più raffinata sulla densità di un network. Più un network si scompone, meno è denso.

Come si visualizzano i network?

Fruchterman-ringold: prende i nodi e li posiziona in maniera circolare, spingendo verso al centro i nodi con alto degree e butta alla periferia del disegno i nodi con un basso degree.

Yifan Yu: fa la stessa cosa di quello precedente, ma inoltre individua le sotto comunità facendo attenzione ai gradi di connessione.

12/04 Sentiment Analysis

Il testo è un intreccio di cose,

Un tessuto intrecciato: un testo è un qualsiasi insieme di segni integrati che riguardano più codici.

La content analysis è una tecnica di ricerca usata per la descrizione oggettiva e sistematica del contenuto manifesto di un testo, ossia il contenuto che io percepisco con i miei sensi. Questa definizione è stata aggiornata nel tempo aggiungendo anche il contenuto latente, ossia le cose che non necessariamente vedo con i miei occhi ma che in un modo o nell'altro sono li nel testo (esempio: emozione che trasmette un testo).

La sentiment analysis è una tecnica di ricerca usata per misurare l'attitudine emozionale di un testo digitale, ossia l'emozione che un testo digitale esprime nei confronti di un certo oggetto. Non è da confondere con un questionario. Generalmente ci sono tre tipi di emozioni: positive, negative e neutrali. È molto utilizzata nel marketing digitale ed è utile per analizzare le conversazioni dei consumatori.

sui social network. Ci sono due modi per analizzare la sentiment: 1. Automaticamente; 2. Manualmente. È opportuno combinare queste due modalità. Modo automatizzato: Vengono raccolti i dati ed un software riconoscerà se i pareri sono positivi o negativi utilizzando dei vocabolari che categorizzano tutte le parole. Ha vari limiti: non tiene conto del contesto perché posso usare la parola "brutto" in un contesto per me positivo. Modo semi automatico: Abbiamo il nostro vocabolario ma insegniamo alla macchina a capire se un testo è positivo o negativo in base al contesto (machine learning). Il machine learning capisce il contesto semantico, ma non quello sociale (esempio: se il M5S si esprime con parolacce, la macchina non potrà mai saperlo). C'è da fare qualche scelta manuale. Modo manuale: Segmentare i testi, pesarli e associare a loro un tema. Test segmentation: Abbiamo due sentiment differenti in uno stesso testo. Un software automatico definirebbequesto testo come neutro perché ci sono due emozioni opposte.
Weight
Con peso intendiamo un'operazione matematica, infatti nel terzo messaggio ci sono tre elementi che ci fanno capire che il sentiment è negativo. Il peso può essere diverso anche in base all'utente: magari l'opinione di un food blogger pesa di più rispetto all'opinione di un utente normale. Un'altra distinzione può essere fatta anche guardando il numero di retweet: maggiori sono le condivisioni, maggiore potrebbe essere il peso.
Associare il testo a un topic
Se ad ogni messaggio associamo un topic diverso, non è ottimale.
19/04
Content Analysis
L'analisi del contenuto è la tecnica di ricerca maggiormente usata quando si studia la comunicazione. È una tecnica che consiste nella descrizione oggettiva, sistematica e quantitativa del contenuto manifesto di un testo (quello che posso direttamente percepire). Anche un contenuto latente puòessere studiato e osservato con la sentiment analysis. L'analisi del contenuto ci permette di rispondere a domande cruciali anche per capire come funziona la società, anche se si studiano i media e la comunicazione. L'analisi del contenuto procede con degli step molto specifici. Si parte da una domanda di ricerca, poi si raccolgono i testi e campionarli, poi si passa al coding (stabilire categorie con cui classificare i testi) e infine dobbiamo contare e rispondere alla domanda di ricerca. Campionamento: differenza tra unità di analisi e unità di osservazione. La prima è il luogo semantico dove io estraggo le informazioni, mentre la seconda è il testo specifico che io estraggo dal campo su cui mi focalizzo. Spesso queste cose coincidono, ma non necessariamente. Ci sono diversi tipi di campionamento: - Census: quando la popolazione è piccola; - Campionamento randomico: tecnica statistica. Dobbiamo capire qual è la nostra popolazione e

Poi randomicamente estraggo un campione;

Campionamento a scelta ragionata: utile per la ricerca qualitativa. Si vanno a selezionare quegli elementi che in maniera migliore ci permettono di rispondere alla domanda di ricerca.

Esempio: mi vado a vedere i notiziari entro un dato periodo di tempo e vado a prendere quelli natalizi per capire cosa è successo in quel periodo.

Cosa si può contare? Un po' tutto, ma ci sono tre cose principali.

Parole;

Tematiche;

Disposizioni: sentiment.

Per il Coding ci sono due strumenti fondamentali.

Griglia di codifica: stabilisce delle variabili (categorie);

Manuale del coding: serve per capire come funziona la nostra griglia.

Tre regole d'oro per la suddivisione in categorie:

Chiarezza: la categoria deve essere chiara;

Esaustività: trovare categorie che permettono di analizzare tutti gli elementi del testo che mi interessa;

Mutualmente esclusive: non devono mai esserci sovrapposizioni.

Affidabilità: un

ipotetico ricercatore che arriva dopo di noi deve poterottenere gli stessi risultati effettuando la stessa ricerca.

Digital content analysis

La content analysis può essere potenziata grazie agli strumenti digitali di raccolta dati che automatizzano il processo che abbiamo visto in precedenza.

Campionamento/Filtraggio:

randomico, timeline (follow the medium), a seconda degli utenti (esempio quali sono i più attivi), hashtag.

Codificazione:

alcuni esempi.

YouTube Research

La cultura algoritmica è un fenomeno in cui i processi di classificazione, gerarchizzazione delle cose, degli oggetti, ecc, sembra che sia sempre più demandato a processi computazionali.

Ranking cultures: processo di gerarchizzazione della visibilità dei contenuti che dipende dall'attività congiunta di utenti, content creators e piattaforme. I ricercatori si rendono conto che i video che sono al top, non sono necessariamente quelli che hanno più visualizzazioni.

Come si studia

YouTube con i Digital Methods

YouTube con i Digital Methods

Le API di YouTube sono molto aperte e consentono di raccogliere molte informazioni. Ogni volta che si lancia una ricerca possiamo ottenere fino a 500 video, per poi chiedere al software di dividerli in categorie. La Rilevanza (rispecchia il funzionamento stesso del ranking di YouTube) è la più importante. È possibile studiare anche fenomeni prettamente sociali.

04/05 Cross-platform Analysis

Parliamo di Digital Methods e ciò significa guardare al web come un oggetto di studio per ricerche culturali e sociali. La cross-platform analysis è un tipo di approccio metodologico secondo cui ogni piattaforma viene integrata all'interno del disegno di ricerca.

Dettagli
Publisher
A.A. 2021-2022
28 pagine
2 download
SSD Scienze politiche e sociali SPS/08 Sociologia dei processi culturali e comunicativi

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher rickyvarotto di informazioni apprese con la frequenza delle lezioni di Giornalismo Digitale e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Pavia o del prof Caliandro Alessandro.