vuoi
o PayPal
tutte le volte che vuoi
Questa tesina di maturità descrive il deep web. Gli argomenti che vengono trattati nella tesina sono i seguenti: in Informatica la rete Internet e i motori di ricerca e in Diritto un piccolo cenno ai partiti politici.
Informatica - La rete Internet e i motori di ricerca.
Diritto - Piccolo cenno ai partiti politici.
Il lato oscuro
della rete Tesina di Martina Chiaramonte
Esame di Stato 2013
INDICE
La rete Internet
1
- I browser 2
Cosa sono i motori di ricerca?
3
- Indici
- Meta-tag
- PageRank 4
Il deep web
5
- come funziona?
- cosa vi si può trovare 6
I Bitcoin
7
- confronto con la moneta reale
8
Pericolo economico?
9
Bibliografia e sitografia 10
La rete Internet
Internet è un’infrastruttura di internetworking, cioè letteralmente di interconnessione tra reti diverse. È
data dal collegamento di linee telefoniche classiche, fibre ottiche, reti locali LAN, MAN, WAN,
connessioni satellitari e dorsali transoceaniche.
È la rete più estesa di tutte, ricopre l’intero pianeta e attualmente rappresenta il principale mezzo di
comunicazione di massa. Si tratta di un'interconnessione resa possibile da protocolli di rete chiamati
"TCP/IP", dal nome dei due principali, che costituiscono la "lingua" comune con cui i computer
connessi ad Internet (gli host) comunicano tra loro. Questo indipendentemente dalla loro architettura
hardware e software, garantendo così l'interoperabilità dei dati, ovvero la possibilità dei dati di essere
scambiati tra dispositivi di tipo diverso.
È possibile immaginare la rete internet come una gigantesca ragnatela in quanto non possiede una
topologia ben definita, ma varia e capillare, com'è tipico anche della rete telefonica.
Ciò che realmente viaggia in Internet sono i messaggi, scomposti in veri e propri pacchetti, che
costituiscono l'unità minima di scissione dei dati. I pacchetti viaggiano nei link e nodi interni di rete
usando la tecnica della commutazione di pacchetto (packet switching) che consente di percorrere i
canali migliori, piuttosto che fare uso di un percorso unico e dedicato come accade invece nella
classica commutazione di circuito della rete telefonica. Di conseguenza i pacchetti di una stessa
comunicazione possono seguire percorsi diversi per arrivare ad uno stesso destinatario, a tal proposito
si esegue una procedura detta di imbustamento che crea pacchetti formati da una parte di dati (payload)
e da una parte di intestazione (header), contenente l’indirizzo del mittente, quello del destinatario e il
numero progressivo, attributo fondamentale per la ricomposizione del messaggio formato da più
pacchetti che solitamente seguono percorsi diversi per raggiungere il destinatario.
L’architettura TCP/IP è composta da 4 livelli: RETE, IP, TCP, PROCESSO e rappresenta
l’applicazione semplificata dell’architettura ISO-OSI che invece è il modello concettuale delle reti ed è
formata da 7 livelli di cui solo i primi due sono fondamentali perché standard.
1
I browser
Internet è spesso confuso con i browser, letteralmente sfogliatori, che invece sono solo dei programmi
che consentono agli utenti di accedere alla vasta rete, visualizzando le pagine ipertestuali del WWW
(world wide web) scritte con linguaggio HTML, acronimo di HyperText Markup Language.
I browser sono programmi gratuiti e liberamente scaricabili da Internet.
Stando alle ultime rilevazioni di Net Application, che si
occupa di rilevare la percentuale d'uso dei programmi di
navigazione, per quanto riguarda quelli accessibili da PC
Internet Explorer è saldamente in testa alla classifica con il
55,9 %, seguito da Firefox con il 20,6 %, terzo posto per
Chrome, il software di Google, con 15,7 %. Stabile, infine, la
fetta catturata da Apple Safari, che sfiora il 5,5% degli utenti.
Ben diversa, per contro, la situazione in campo mobile,
sempre secondo i dati di Net Applications: Safari è in testa
con circa il 60% delle preferenze, seguito da Android
Browser 20%, Opera Mini 10,5% e Chrome 3,2%. Fanalino
di coda Internet Explorer, fermo all'1,97 %.
2
Di default all’apertura dei browser si ha la pagina del corrispondente motore di ricerca.
Cosa sono i motori di ricerca?
Un motore di ricerca, chiamato anche search engine, è un programma web, in grado di indicizzare
automaticamente informazioni e classificarle in base a formule statistico-matematiche che indicano il
grado di importanza, data una certa chiave di
ricerca
.
Indici
3
Per indicizzare, i motori di ricerca usano i cosiddetti Spiders, ovvero dei piccoli programmi che
partendo da una singola pagina Web (solitamente dalla homepage di un sito) riescono a navigare
attraverso tutte le pagine ad essa collegate e ne archiviano delle parti in Data center.
Un’indicizzazione ben fatta deve tener conto di altre informazioni oltre a parole e URL, quali ad
esempio il “peso” di ogni parola.
Questo dato viene calcolato con differenti algoritmi, logicamente una parola che appare nel titolo o nei
meta-tag ha naturalmente un peso maggiore rispetto ad una che appare solo in fondo alla pagina.
Meta-tag
I Meta-tag sono degli speciali tag HTML che possono essere inseriti dai programmatori all'interno di
una pagina web per permettere ai motori di ricerca di classificare con maggior precisione la pagina
stessa all'interno dell'indice di ricerca.
Esistono poi alcuni motori di ricerca, tra cui Google, che oltre ad applicare le tecniche precedenti
memorizzano anche il carattere, la grandezza del font ed il colore di ogni parola, utilizzando tali
informazioni nelle successive fasi di ricerca. E' ovvio infatti che parole scritte con colore o carattere
diverso hanno una particolare rilevanza rispetto alle altre presenti nel testo.
PageRank
Quando una persona effettua una ricerca online, i motori devono analizzare i miliardi di pagine
indicizzate e fare due cose: restituire solo quei risultati utili rispetto alla ricerca effettuata e ordinarli in
base ad un criterio di importanza. La maggior parte dei motori di ricerca identifica l'importanza di un
sito con la sua "popolarità"; quanto più popolare è un sito, una pagina o un documento, tanto maggiore
deve essere il valore dell'informazione presente in questi contenuti.
Google per assegnare un indice di importanza ad una risorsa web all’interno di una serie di risultati, fa
ricorso
all’algoritmo del PageRank. Il nome di questo procedimento matematico di calcolo deriva dal fatto che
è un sistema di rank, ossia di classificazione, costituito da un valore numerico che Google attribuisce
ad ognuna delle pagine Web conosciute, questo algoritmo è stato progettato in buona parte da Larry
Page, uno dei fondatori di Google.
Il valore di PageRank di una pagina è un fattore che contribuisce a determinare la posizione della
pagina stessa nei risultati delle ricerche: più il PageRank è alto e più sarà alta la posizione della pagina
nelle ricerche su Google.
Purtroppo ci sono alcuni limiti tecnici che possono creare alcune problematiche sia per
l’indicizzazione che per il posizionamento:
Siti con una struttura e una gerarchia di link imperfetta possono impedire ai motori di trovare
tutti i contenuti del sito.
I contenuti della pagine che usano Flash, applet Java, video e file audio non sono interpretabili
da parte dei crawler (o spider).
Qualsiasi testo che non segua lo standard HTML all’interno del codice non è analizzabile dai
motori di ricerca.
Conoscendo tali limiti negli anni si sono sviluppate tecniche di costruzione delle pagine web per
renderle ottimamente strutturate agli occhi dei motori e degli utenti. Il SEO (Search Engine
Optimization) si occupa del raggruppamento delle regole da seguire.
Ad esempio ecco alcune soluzioni ai limiti dei motori di ricerca:
I contenuti inseriti in Flash o plug-in Java possono essere ripetuti in formato testuale nella
pagina, in modo da poter essere analizzato da parte degli spider.
I contenuti audio e video dovrebbero essere accompagnati da una trascrizione testuale se si
4 vuole che vengano interpretati dai motori.
Il Deep Web
Deep Web, viene chiamato così il posto della rete in cui tutto è
possibile. Questo immenso luogo di internet, che da uno studio
condotto da Michael Bergman avrebbe una dimensione circa 550
volte maggiore del Word Wide Web (chiamato in questo ambito Surf
Web, poiché “navigabile”), viene utilizzato per lo scambio di
informazioni e contenuti che in una pagina Web normale non si
potrebbero pubblicare. È una parte di Web che si trova online ma alla
quale non viene applicato il processo di indicizzazione, sfruttando i
limiti tecnici degli spiders, risultando così irrintracciabile dai classici
motori di ricerca. Questa è proprio una delle caratteristiche principali
della parte sommersa del web.
Come funziona?
Se non è rintracciabile come è possibile entrarvi? Ecco la seconda
caratteristica: l’anonimato. Al Deep Web si può accedere solo attraverso un
programma che faccia da “scudo”, ossia che occulti l’indirizzo IP in maniera
che non si possa essere rintracciati. Il programma più in voga per rendere
possibile la navigazione anonima è TOR.
Questo browser è simile a Firefox, ma modificato per far in modo che, anziché TOR, acronimo di
The Onion
raggiungere direttamente il server relativo al sito che stai visitando, il tuo Routing
pacchetto dopo essere stato criptato passi per stazioni intermedie fino alla (letteralmente
instradamento a
destinazione. Questa è la diversità: nessuno sa da chi parte e a chi arriva il cipolla).
messaggio, si conosce solo l’indirizzo di chi te lo trasmette e quello a cui lo si Inizialmente
nasce per
deve indirizzare. Questo tipo di trasmissione prende il nome di comunicazione rendere sicure le
stratificata, rimandando alla composizione di una cipolla, simbolo del software. comunicazioni
della Marina
statunitense.
Tutti i link dentro questa rete sono molto particolari, ogni indirizzo è
caratterizzato da un codice seguito dal dominio “.Onion”; può anche capitare che questo non funzioni
momentaneamente, in questo caso si sostituisce con “tor2web.org”.
Dentro il Deep Web non esiste alcun motore di ricerca, poiché come si è detto non è possibile eseguire
la classica indicizzazione, esistono cose simili ma la quantità di pagine su cui si basano è molto
limitata. Per ovviare a ciò solitamente si utilizza come homepage una pagina contenente un sunto degli
url più visitati, la più nota si chiama “Hidden Wiki”. Questa è strutturata esattamente come Wikipedia
e per ogni categoria fornisce numerosi link di URL con cui si passa direttamente ai siti, in alternativa si
salvano le pagine a cui si è interessati nei segnalibri, proprio come si fa navigando abitualmente.
5
Cosa vi si può trovare
Il Deep Web è soprattutto uno spazio di libertà con lati
convenienti, come la gran massa di informazioni libere
alle quali poter accedere, basti pensare ad esempio che lì
si trovano i contenuti di Wikileaks e Vatileaks,
organizzazioni internazionali senza scopo di lucro che
ricevono documenti di carattere governativo, bancario, o
aziendale da fonti anonime. I documenti, che
solitamente sono coperti da segreto, (segreto di stato,
segreto militare, segreto industriale, segreto bancario,
segreto Vaticano) prima di esser pubblicati vengono analizzati per garantirne l’autenticità e poi resi
disponibili online.
Oltre a questi siti, divenuti famosi anche nel Surf Web, l’informazione libera è caratterizzata
soprattutto da blog e forum con argomenti consueti, a volte sullo scambio di pareri su libri e film
appena usciti, fino a sfociare in vere e proprie discussioni con tanto di documenti inerenti a
cospirazioni segrete e contatti alieni con la quale la umanità avrebbe avuto un legame …
Si passa poi da siti in cui è possibile scambiarsi dischi, musica, libri, manuali, ecc… a pagine che
vendono droghe, armi, documenti falsi, offrono materiale pedopornografico, è anche possibile
imbattersi in gruppi dedicati all'occultismo, in sette sataniche ed accedere facilmente a siti in cui è
possibile acquistare banconote contraffatte.
Si può trovare letteralmente di tutto, perfino cambiare identità o assoldare killer a buon prezzo in siti
come Assassination Market.
Ecco come si presenta il sito ad un utente europeo qualsiasi che non ha ancora effettuato il Log in:
Si tratta di mercati che offrono protezione e anonimato a potenziali trafficanti di armi e droghe,