Anteprima
Vedrai una selezione di 4 pagine su 14
Tesina sul Deep Web Pag. 1 Tesina sul Deep Web Pag. 2
Anteprima di 4 pagg. su 14.
Scarica il documento per vederlo tutto.
Tesina sul Deep Web Pag. 6
Anteprima di 4 pagg. su 14.
Scarica il documento per vederlo tutto.
Tesina sul Deep Web Pag. 11
1 su 14
Disdici quando vuoi 162x117
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Sintesi
Introduzione Tesina sul Deep Web


Questa tesina di maturità descrive il deep web. Gli argomenti che vengono trattati nella tesina sono i seguenti: in Informatica la rete Internet e i motori di ricerca e in Diritto un piccolo cenno ai partiti politici.

Collegamenti

Tesina sul Deep Web


Informatica - La rete Internet e i motori di ricerca.
Diritto - Piccolo cenno ai partiti politici.
Estratto del documento

Il lato oscuro

della rete Tesina di Martina Chiaramonte

Esame di Stato 2013

INDICE

La rete Internet

 1

- I browser 2

Cosa sono i motori di ricerca?

 3

- Indici

- Meta-tag

- PageRank 4

Il deep web

 5

- come funziona?

- cosa vi si può trovare 6

I Bitcoin

 7

- confronto con la moneta reale

8

Pericolo economico?

 9

Bibliografia e sitografia 10

La rete Internet

Internet è un’infrastruttura di internetworking, cioè letteralmente di interconnessione tra reti diverse. È

data dal collegamento di linee telefoniche classiche, fibre ottiche, reti locali LAN, MAN, WAN,

connessioni satellitari e dorsali transoceaniche.

È la rete più estesa di tutte, ricopre l’intero pianeta e attualmente rappresenta il principale mezzo di

comunicazione di massa. Si tratta di un'interconnessione resa possibile da protocolli di rete chiamati

"TCP/IP", dal nome dei due principali, che costituiscono la "lingua" comune con cui i computer

connessi ad Internet (gli host) comunicano tra loro. Questo indipendentemente dalla loro architettura

hardware e software, garantendo così l'interoperabilità dei dati, ovvero la possibilità dei dati di essere

scambiati tra dispositivi di tipo diverso.

È possibile immaginare la rete internet come una gigantesca ragnatela in quanto non possiede una

topologia ben definita, ma varia e capillare, com'è tipico anche della rete telefonica.

Ciò che realmente viaggia in Internet sono i messaggi, scomposti in veri e propri pacchetti, che

costituiscono l'unità minima di scissione dei dati. I pacchetti viaggiano nei link e nodi interni di rete

usando la tecnica della commutazione di pacchetto (packet switching) che consente di percorrere i

canali migliori, piuttosto che fare uso di un percorso unico e dedicato come accade invece nella

classica commutazione di circuito della rete telefonica. Di conseguenza i pacchetti di una stessa

comunicazione possono seguire percorsi diversi per arrivare ad uno stesso destinatario, a tal proposito

si esegue una procedura detta di imbustamento che crea pacchetti formati da una parte di dati (payload)

e da una parte di intestazione (header), contenente l’indirizzo del mittente, quello del destinatario e il

numero progressivo, attributo fondamentale per la ricomposizione del messaggio formato da più

pacchetti che solitamente seguono percorsi diversi per raggiungere il destinatario.

L’architettura TCP/IP è composta da 4 livelli: RETE, IP, TCP, PROCESSO e rappresenta

l’applicazione semplificata dell’architettura ISO-OSI che invece è il modello concettuale delle reti ed è

formata da 7 livelli di cui solo i primi due sono fondamentali perché standard.

1

I browser

Internet è spesso confuso con i browser, letteralmente sfogliatori, che invece sono solo dei programmi

che consentono agli utenti di accedere alla vasta rete, visualizzando le pagine ipertestuali del WWW

(world wide web) scritte con linguaggio HTML, acronimo di HyperText Markup Language.

I browser sono programmi gratuiti e liberamente scaricabili da Internet.

Stando alle ultime rilevazioni di Net Application, che si

occupa di rilevare la percentuale d'uso dei programmi di

navigazione, per quanto riguarda quelli accessibili da PC

Internet Explorer è saldamente in testa alla classifica con il

55,9 %, seguito da Firefox con il 20,6 %, terzo posto per

Chrome, il software di Google, con 15,7 %. Stabile, infine, la

fetta catturata da Apple Safari, che sfiora il 5,5% degli utenti.

Ben diversa, per contro, la situazione in campo mobile,

sempre secondo i dati di Net Applications: Safari è in testa

con circa il 60% delle preferenze, seguito da Android

Browser 20%, Opera Mini 10,5% e Chrome 3,2%. Fanalino

di coda Internet Explorer, fermo all'1,97 %.

2

Di default all’apertura dei browser si ha la pagina del corrispondente motore di ricerca.

Cosa sono i motori di ricerca?

Un motore di ricerca, chiamato anche search engine, è un programma web, in grado di indicizzare

automaticamente informazioni e classificarle in base a formule statistico-matematiche che indicano il

grado di importanza, data una certa chiave di

ricerca

.

Indici

3

Per indicizzare, i motori di ricerca usano i cosiddetti Spiders, ovvero dei piccoli programmi che

partendo da una singola pagina Web (solitamente dalla homepage di un sito) riescono a navigare

attraverso tutte le pagine ad essa collegate e ne archiviano delle parti in Data center.

Un’indicizzazione ben fatta deve tener conto di altre informazioni oltre a parole e URL, quali ad

esempio il “peso” di ogni parola.

Questo dato viene calcolato con differenti algoritmi, logicamente una parola che appare nel titolo o nei

meta-tag ha naturalmente un peso maggiore rispetto ad una che appare solo in fondo alla pagina.

Meta-tag

I Meta-tag sono degli speciali tag HTML che possono essere inseriti dai programmatori all'interno di

una pagina web per permettere ai motori di ricerca di classificare con maggior precisione la pagina

stessa all'interno dell'indice di ricerca.

Esistono poi alcuni motori di ricerca, tra cui Google, che oltre ad applicare le tecniche precedenti

memorizzano anche il carattere, la grandezza del font ed il colore di ogni parola, utilizzando tali

informazioni nelle successive fasi di ricerca. E' ovvio infatti che parole scritte con colore o carattere

diverso hanno una particolare rilevanza rispetto alle altre presenti nel testo.

PageRank

Quando una persona effettua una ricerca online, i motori devono analizzare i miliardi di pagine

indicizzate e fare due cose: restituire solo quei risultati utili rispetto alla ricerca effettuata e ordinarli in

base ad un criterio di importanza. La maggior parte dei motori di ricerca identifica l'importanza di un

sito con la sua "popolarità"; quanto più popolare è un sito, una pagina o un documento, tanto maggiore

deve essere il valore dell'informazione presente in questi contenuti.

Google per assegnare un indice di importanza ad una risorsa web all’interno di una serie di risultati, fa

ricorso

all’algoritmo del PageRank. Il nome di questo procedimento matematico di calcolo deriva dal fatto che

è un sistema di rank, ossia di classificazione, costituito da un valore numerico che Google attribuisce

ad ognuna delle pagine Web conosciute, questo algoritmo è stato progettato in buona parte da Larry

Page, uno dei fondatori di Google.

Il valore di PageRank di una pagina è un fattore che contribuisce a determinare la posizione della

pagina stessa nei risultati delle ricerche: più il PageRank è alto e più sarà alta la posizione della pagina

nelle ricerche su Google.

Purtroppo ci sono alcuni limiti tecnici che possono creare alcune problematiche sia per

l’indicizzazione che per il posizionamento:

 Siti con una struttura e una gerarchia di link imperfetta possono impedire ai motori di trovare

tutti i contenuti del sito.

 I contenuti della pagine che usano Flash, applet Java, video e file audio non sono interpretabili

da parte dei crawler (o spider).

 Qualsiasi testo che non segua lo standard HTML all’interno del codice non è analizzabile dai

motori di ricerca.

Conoscendo tali limiti negli anni si sono sviluppate tecniche di costruzione delle pagine web per

renderle ottimamente strutturate agli occhi dei motori e degli utenti. Il SEO (Search Engine

Optimization) si occupa del raggruppamento delle regole da seguire.

Ad esempio ecco alcune soluzioni ai limiti dei motori di ricerca:

 I contenuti inseriti in Flash o plug-in Java possono essere ripetuti in formato testuale nella

pagina, in modo da poter essere analizzato da parte degli spider.

 I contenuti audio e video dovrebbero essere accompagnati da una trascrizione testuale se si

4 vuole che vengano interpretati dai motori.

Il Deep Web

Deep Web, viene chiamato così il posto della rete in cui tutto è

possibile. Questo immenso luogo di internet, che da uno studio

condotto da Michael Bergman avrebbe una dimensione circa 550

volte maggiore del Word Wide Web (chiamato in questo ambito Surf

Web, poiché “navigabile”), viene utilizzato per lo scambio di

informazioni e contenuti che in una pagina Web normale non si

potrebbero pubblicare. È una parte di Web che si trova online ma alla

quale non viene applicato il processo di indicizzazione, sfruttando i

limiti tecnici degli spiders, risultando così irrintracciabile dai classici

motori di ricerca. Questa è proprio una delle caratteristiche principali

della parte sommersa del web.

Come funziona?

Se non è rintracciabile come è possibile entrarvi? Ecco la seconda

caratteristica: l’anonimato. Al Deep Web si può accedere solo attraverso un

programma che faccia da “scudo”, ossia che occulti l’indirizzo IP in maniera

che non si possa essere rintracciati. Il programma più in voga per rendere

possibile la navigazione anonima è TOR.

Questo browser è simile a Firefox, ma modificato per far in modo che, anziché TOR, acronimo di

The Onion

raggiungere direttamente il server relativo al sito che stai visitando, il tuo Routing

pacchetto dopo essere stato criptato passi per stazioni intermedie fino alla (letteralmente

instradamento a

destinazione. Questa è la diversità: nessuno sa da chi parte e a chi arriva il cipolla).

messaggio, si conosce solo l’indirizzo di chi te lo trasmette e quello a cui lo si Inizialmente

nasce per

deve indirizzare. Questo tipo di trasmissione prende il nome di comunicazione rendere sicure le

stratificata, rimandando alla composizione di una cipolla, simbolo del software. comunicazioni

della Marina

statunitense.

Tutti i link dentro questa rete sono molto particolari, ogni indirizzo è

caratterizzato da un codice seguito dal dominio “.Onion”; può anche capitare che questo non funzioni

momentaneamente, in questo caso si sostituisce con “tor2web.org”.

Dentro il Deep Web non esiste alcun motore di ricerca, poiché come si è detto non è possibile eseguire

la classica indicizzazione, esistono cose simili ma la quantità di pagine su cui si basano è molto

limitata. Per ovviare a ciò solitamente si utilizza come homepage una pagina contenente un sunto degli

url più visitati, la più nota si chiama “Hidden Wiki”. Questa è strutturata esattamente come Wikipedia

e per ogni categoria fornisce numerosi link di URL con cui si passa direttamente ai siti, in alternativa si

salvano le pagine a cui si è interessati nei segnalibri, proprio come si fa navigando abitualmente.

5

Cosa vi si può trovare

Il Deep Web è soprattutto uno spazio di libertà con lati

convenienti, come la gran massa di informazioni libere

alle quali poter accedere, basti pensare ad esempio che lì

si trovano i contenuti di Wikileaks e Vatileaks,

organizzazioni internazionali senza scopo di lucro che

ricevono documenti di carattere governativo, bancario, o

aziendale da fonti anonime. I documenti, che

solitamente sono coperti da segreto, (segreto di stato,

segreto militare, segreto industriale, segreto bancario,

segreto Vaticano) prima di esser pubblicati vengono analizzati per garantirne l’autenticità e poi resi

disponibili online.

Oltre a questi siti, divenuti famosi anche nel Surf Web, l’informazione libera è caratterizzata

soprattutto da blog e forum con argomenti consueti, a volte sullo scambio di pareri su libri e film

appena usciti, fino a sfociare in vere e proprie discussioni con tanto di documenti inerenti a

cospirazioni segrete e contatti alieni con la quale la umanità avrebbe avuto un legame …

Si passa poi da siti in cui è possibile scambiarsi dischi, musica, libri, manuali, ecc… a pagine che

vendono droghe, armi, documenti falsi, offrono materiale pedopornografico, è anche possibile

imbattersi in gruppi dedicati all'occultismo, in sette sataniche ed accedere facilmente a siti in cui è

possibile acquistare banconote contraffatte.

Si può trovare letteralmente di tutto, perfino cambiare identità o assoldare killer a buon prezzo in siti

come Assassination Market.

Ecco come si presenta il sito ad un utente europeo qualsiasi che non ha ancora effettuato il Log in:

Si tratta di mercati che offrono protezione e anonimato a potenziali trafficanti di armi e droghe,

Dettagli
Publisher
14 pagine
56 download