Che materia stai cercando?

Anteprima

ESTRATTO DOCUMENTO

La ricerca dei contenuti in Rete

Emmanuel Mazzucchi

emmanuel.mazzucchi@uniroma1.it

@

Il deep web e i limiti dei motori

• Il web è molto più vasto della porzione cui

potenzialmente potremmo accedere tramite i motori

di ricerca • Utilizzare vari strumenti di ricerca

• Il motore è utile, ma non basta

La ricerca dei contenuti in Rete 30/11/2009 slide 2

In generale….

• Nessuno strumento trova tutto

• È p

più difficile trovare ciò che è stato appena

pp

pubblicato

• Ciò che è online oggi non è detto che ci sarà anche

domani

• Nessuno strumento di classificazione e ricerca è

neutro

La ricerca dei contenuti in Rete 30/11/2009 slide 3

Articolazione degli strumenti di classificazione -ricerca

Gestito da

software

Popolamento

archivi

hi i

Gestito da Gestito da

persone software

interfacce interfacce

Gestito da

persone

La ricerca dei contenuti in Rete 30/11/2009 slide 4

Primo asse - Popolare il db: non solo motori

• I motori veri e propri effettuano la ricerca all’interno di un

archivio costruito automaticamente da un software (spider,

crawler)

• Le directory sono archivi ordinati per categorie e curati dai

redattori del portale

• Si parla di folksonomy per indicare una classificazione

collettiva che parte dal basso ed è prodotta dagli utenti di un

servizio

La ricerca dei contenuti in Rete 30/11/2009 slide 5

Secondo asse - Cercare un’informazione vs navigare un

argomento

http://www.google.com/ http://it.dir.yahoo.com /

La ricerca dei contenuti in Rete 30/11/2009 slide 6

Browsing – navigare - sfogliare

• http://it.wikipedia.org/wiki/Pagina_principale

• Cercare una stringa di testo: metodo veloce,

efficiente, preciso

• Navigare una categoria: si colgono associazioni,

vengono scartati a priori i contenuti di scarsa

qualità, il percorso di ricerca è significativo

La ricerca dei contenuti in Rete 30/11/2009 slide 7

Folksonomy: del.icio.us

• http://del.icio.us/

Serve a mantenere online i propri bookmark e a raggiungerli

da qualsiasi pc,

pc classificarli e utilizzare le classificazioni fatte

dagli altri.

• Emergono delle classificazioni per tag e per utente, che

mettono in gioco anche la variabile del tempo

• http://labs

http://labs.digg.com/swarm/

digg com/swarm/

La ricerca dei contenuti in Rete 30/11/2009 slide 8

I problemi dei motori

• Decontestualizzazione dei risultati

• Ricerca p

per stringa,

g , non p

per concetto (

(cane è

diverso da dog per un motore)

• Difficile discriminare tra tantissimi risultati

La ricerca dei contenuti in Rete 30/11/2009 slide 9

Tra cercare e navigare

Cercare in una directory

Navigare i risultati di una ricerca

Clustering:

g http://clusty.com/

p y

La ricerca dei contenuti in Rete 30/11/2009 slide 10

Come popolo gli archivi?

Archivio Nell’archivio viene inserita Punti di forza

popolato da

Motore di ricerca Software Tutte le pagine trovate, tutto o Numero di contenuti

www.google.it , quasi il contenuto della pagina archiviati, velocità degli

www.yahoo.it , aggiornamenti

www.bing.com ,

www.ask.com

Directory Persone Il link alla sola home page, una Pertinenza e qualità dei

http://it

http://it.dir.yahoo.com/

dir yahoo com/ , descrizione del sito

sito, risultati archiviati

http://dmoz.org/ un’indicazione sulla pertinenza

,

http://directory.alice.it Molteplicità di classificazioni

Folksonomy Persone Il link alla sola home page, personali, continuità tra

http://del.icio.us/ parole chiave che lo etichettano,

, classificazione e ricerca,

eventuali descrizioni del sito,

www.flickr.com/ , efficienza sui contenuti

riferimento all’utente che ha

www.digg.com/ operato la classificazione multimediali

http://labs.digg.com/swarm/

La ricerca dei contenuti in Rete 30/11/2009 slide 11

Come seleziono i risultati

Selezione prodotta da Punti di forza

Motore di ricerca Utenti (popolarità), Ottime performance per

software (pertinenza le esigenze più comuni

rispetto alla ricerca)

Directory Utenti e redattori I contenuti più scadenti

vengono scartati, i più

autorevoli ottengono

visibilità

Folksonomy Utenti Compresenza di

classificazioni standard

(

(basate sulla popolarità)

)

e non-standard

(personali)

La ricerca dei contenuti in Rete 30/11/2009 slide 12

Interfacce

Punti di forza Potenziali problemi

p

Ricerca (digitare una o •Efficace •Refusi

più parole in un per utenti •Difficoltà

apposito campo) esperti del tema a individuare o

•Porta velocemente ricordare le parole

all’obiettivo, una volta chiave

stabilito

Navigazione •Accessibile •Scarsa

ipertestuale (seguire a utenti efficacia delle

una serie di link) meno esperti del tema classificazioni

•Durante •Scarsa

il percorso si chiarezza delle

colgono associazioni e si etichette scelte per le

trovano informazioni che categorie

non si cercavano

La ricerca dei contenuti in Rete 30/11/2009 slide 13

www.google.it

• L’ordine dei risultati: il Pagerank

– Non necessariamente l’ordine di presentazione dei risultati

corrisponde alla rilevanza per chi sta preparando una tesi

di laurea

• La ricerca avanzata

http://www.google.it/advanced_search?hl=it

• Le preferenze e le azioni sui risultati della ricerca:

Cache, traduzioni, pagine simili

La ricerca dei contenuti in Rete 30/11/2009 slide 14

Creative commons

• E’ possibile attribuire al lettore diritti maggiori di

quelli garantitigli dal tradizionale copyright

(ridistribuire, modificare, etc)

La ricerca dei contenuti in Rete 30/11/2009 slide 15

Wikipedia

• Chiunque potrebbe aver inserito quel testo

• Verificare almeno la storia della p

pagina

g e

confrontarla con versioni in altre lingue

• Neutral Point of View

La ricerca dei contenuti in Rete 30/11/2009 slide 16


PAGINE

36

PESO

192.39 KB

AUTORE

Atreyu

PUBBLICATO

+1 anno fa


DESCRIZIONE DISPENSA

Questa lezione fa riferimento al Laboratorio tesi di laurea tenuto dalla Prof.ssa. Valentina Martino, e spiega come avviene la ricerca di contenuti all'interno della rete Web. In particolare, all'interno di motori di ricerca come Google e dei sui servizi aggiuntivi quali Google scholar, Googlele books, di directory (Yahoo) e folksonomy come Del.icio.us.


DETTAGLI
Corso di laurea: Corso di laurea magistrale in editoria multimediale e nuove professioni dell'informazione
SSD:
A.A.: 2010-2011

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Atreyu di informazioni apprese con la frequenza delle lezioni di Laboratorio tesi di laurea e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università La Sapienza - Uniroma1 o del prof Martino Valentina.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Laboratorio tesi di laurea

Tesi - Editing e confezionamento
Dispensa
Tesi - Bibliografia e note
Dispensa
Tesi -  Struttura e metodologia
Dispensa
Tesi come Scelta
Dispensa