Che materia stai cercando?

Motori di ricerca

Questa lezione fa riferimento al corso di Interfacce, contenuti e servizi per le tecnologie interattive, tenuto dal Prof. Marinelli. Nella prima parte si mette in luce come dal XX secolo la vita sociale e professionale dell’uomo è stata sempre più influenzata dai mezzi che consentono la manipolazione, l’accesso e la diffusione... Vedi di più

Esame di INTERFACCE, CONTENUTI E SERVIZI PER LE TECNOLOGIE INTERATTIVE docente Prof. A. Marinelli

Anteprima

ESTRATTO DOCUMENTO

MACCHINE DELLA CONOSCENZA: IL MEMEX DI VANNEVAR

BUSH

punto di partenza:

Il

Come gestire l’accesso alla conoscenza e la sua selezione?

Vannevar Bush

(1890 -1974)

Memex

(Memory Extender)

“As we may think”,

Atlantic Monthly, 1945

Il Memex: una macchina personale, mai costruita, per archiviare e ricercare la conoscenza

organizzata attraverso collegamente associativi. 7

METTERE ORDINE NELLA RETE: I MOTORI DI RICERCA

Information Retrieval (IR): gestire il rumore, la ridondanza e l'affidabilità nella

ricerca di informazioni

Crescita del web esponenziale

Motori di ricerca: ricercano sul web la ricorrenza di parole chiave fornendo una

lista di URL in cui tale sequenza è stata rinvenuta (molteplici tipologie di

contenuti: testo, immagini, video, gruppi di discussione, mappe) 8

I MOTORI DI RICERCA:

• Gli spider e la scansione della rete

• L’indicizzazione

Creare un database interrogabile dal navigatore.

L'analisi dell'informazione e la sua catalogazione avvengono in base ad algoritmi matematici, che

cercano di ignorare le parole ritenute non significative.

Es.eliminazione delle stopwords: parole portatrici di funzioni sintattiche (proposizioni, congiunzioni)

Le parole chiave sono considerate più o meno significative in base al loro “peso”, misurato

attraverso la frequenza e la collocazione nel testo.

Es. Una parola posta all'interno del tag HTML <h1> e’ ritenuta molto importante

• Creazione degli ‘indici invertiti’ e attribuzione del ranking

La porzione di testo in cui si compare la parola chiave viene affiancata da un coefficiente che ne

esprime il suo ‘peso’. Una volta formulata una query il motore di ricerca, basandosi sugli indici,

produce un lista di pagine web contenenti la parola chiave richiesta. I risultati sono presentati

secondo una graduatoria di rilevanza. 9

IL PAGE RANK DI GOOGLE

Il PageRank: l’autorità che emerge dalla rete

• (Gli antecedenti del PageRank: Garfield e il Citation index)

Il Page Rank determina la popolarità attribuita a una determinata pagina web esaminando la

struttura di citazione in cui e’ inserita. Ogni link viene ‘pesato’ in base alla provenienza

La novita’ introdotta del Page Rank consiste nel considerare la struttura stessa del web “in grado di

discriminare tra dati irrilevanti e rilevanti”. I link finiscono per diventare “un filtro sul contenuto svolto

attraverso l’intelligenza umana”, dal momento che linkare una pagina web significa esprimere un

giudizio di valore sul suo contenuto. (Paolo Massa e Conor Hayes)

10

IL PAGE RANK DI GOOGLE

The invisible web: i motori di ricerca archiviano solo una parte dei contenuti pubblicati

sul web

Alcune osservazioni sul PageRank:

- non è un meccanismo ‘democratico’ (‘i ricchi sono sempre più ricchi’,

distribuzione degli hub in rete, leggi di potenza, preferential attachment, ecc.)

- è un algoritmo che non considera il significato semantico di un link

(ovvero non fa distinzione tra un link che esprime attenzione e un link che

esprime apprezzamento/critica (+/-) 11

I MOTORI DI RICERCA: METTERE ORDINE NELLA RETE 12

I MOTORI DI RICERCA: COMPOSIZIONE DEL MERCATO

Negli Usa

64,9% Google

18,8% Yahoo! Search

9,4% Microsoft Search 13

I MOTORI DI RICERCA: COMPOSIZIONE DEL MERCATO IN ITALIA

circa 25 milioni di utenti online

Dati ISTAT (2008):

42% di abitazioni raggiunte da connessione Internet;

50% di famiglie in possesso del pc

- Google monopolio: 85% - 90% della search (partnership con Tiscali, Libero,

Virgilio)

A Yahoo e MSN restano le briciole… 14

LA RICERCA SUL WEB: I MOTORI DI RICERCA E GOOGLE

“Google's mission is to organize the world's information

and make it universally accessible and useful” 15

LO SVILUPPO DI GOOGLE

-1997: Larry Page e Sergey Brin lavorano all’algoritmo BackRub, (poi denominato Google), presso la Stanford

University (CA, USA)

-1998: brevettato il PageRank. Il 7 settembre nasce Google Inc.

-2000: 60 milioni di ricerche al giorno

-2002: nel sistema pubblicitario AdWords(2000) viene introdotto il modello CPC (cost per click), nasce Google

News

-2003: Google Print (oggi Google Book)

-2004: quotazione in borsa (IPO) al prezzo di 85$ ad azione. Oggi un’azione vale circa 460$.

-2004: Gmail e Google Scholar

2005: 380 milioni di ricerche quotidiane, 8 miliardi di pagine web archiviate, 1.5 miliardi $ di utili

-2005-2006: Google Maps, Google Earth, Google Chat, Google Calendar

-2007: Google acquista YouTube, lancio di Streetview

2008: Google Chrome, Android

2009: Google Wave, Google Latitude 16

GOOGLE OGGI

Il 99% delle entrate di Google

proviene da annunci pubblicitari

Utili: 5,9 miliardi di dollari

Giro di affari: 21 miliardi di dollari Crescita finanziaria di Google: andamento delle entrate dal gen 2008 al

30 set 2009. Fonte: 2009 Q3 Earnings Conference Call, 15.10.2009

17

GOOGLE OGGI

Google top 20 domains: 70% Search

10% YouTube

6% Image

6% Gmail 18

ADWORDS

Il sistema Adwords introdotto nel 2000 basato sul CPM

(Cost Per thousand Model), viene modificato nel 2002

con l’introduzione del CPC (Cost Per Clicktrought)

“Google firmly believes that ads can provide useful information if, and

only if, they are relevant to what you wish to find”

“Placement in search results is never sold to anyone”

Advertising on Google is always clearly identified as a Sponsored Link. We never manipulate rankings to put our

partners higher in our search results. No one can buy better PageRank. Our users trust Google's objectivity and

no short-term gain could ever justify breaching that trust.

Paid placement: annuncio a pagamento associato ad una determinata parola chiave nei risultati di un

motore di ricerca

Paid inclusion: pratica che consiste nel pagare per avere il proprio sito inserito in buona posizione e ad

un maggior livello di profondità nell’indicizzazione di un motore di ricerca (non utilizzata da Google) 19

ADWORDS 20


PAGINE

33

PESO

3.42 MB

AUTORE

Atreyu

PUBBLICATO

+1 anno fa


DESCRIZIONE DISPENSA

Questa lezione fa riferimento al corso di Interfacce, contenuti e servizi per le tecnologie interattive, tenuto dal Prof. Marinelli. Nella prima parte si mette in luce come dal XX secolo la vita sociale e professionale dell’uomo è stata sempre più influenzata dai mezzi che consentono la manipolazione, l’accesso e la diffusione della conoscenza. Oggi si parla di macchine della conoscenza: i motori di ricerca in particolare, di cui il caso Google è esemplare. Nella seconda parte: l'informazione nello spazio fisico, grazie alla mobilità, connettività e disponibilità di punti di accesso alla rete.


DETTAGLI
Corso di laurea: Corso di laurea magistrale in industria culturale e comunicazione digitale
SSD:
A.A.: 2010-2011

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Atreyu di informazioni apprese con la frequenza delle lezioni di INTERFACCE, CONTENUTI E SERVIZI PER LE TECNOLOGIE INTERATTIVE e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università La Sapienza - Uniroma1 o del prof Marinelli Alberto.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Interfacce, contenuti e servizi per le tecnologie interattive

Piano marketing
Dispensa
Marketing Mix - Politiche di promozione
Dispensa
Principi di marketing e marketing relazionale
Dispensa
Web - Requisiti e design
Dispensa