Archivi, memorie di massa e fault tolerance

Concetti Chiave

Un archivio è un insieme di informazioni logicamente collegate, registrate su supporti per consentire lettura e scrittura nel tempo.
I file sono memorizzati su memorie di massa, che estendono la memoria centrale, permettendo la permanenza dei dati.
Il sistema di file gestisce l'organizzazione, protezione e accesso ai dati, utilizzando directory per tracciare e trovare file specifici.
Copie di sicurezza e tecniche di fault tolerance, come mirroring e duplexing, assicurano la continuità operativa del sistema.
Tre principali modalità di organizzazione degli archivi: sequenziale, ad accesso diretto e a indici, ognuna con vantaggi distinti.

Archivi

Un archivio è un insieme di informazioni caratterizzate da:

uno stesso argomento, ovvero esiste un nesso logico che le lega.
Sono rappresentate in un formato che ne rende possibile l’interpretazione.
Sono registrate su un supporto che ne consente la lettura e scrittura nel tempo.
Sono facilmente consultabili.

Un archivio possiede tre elementi principali:
Un file, che è una collezione di record, cioè di informazioni logicamente omogenee, che descrivono le istanze di una entità;
Un record, che rappresenta un elemento dell’insieme di informazioni relative ad un unico soggetto.

Un campo rappresenta una parte dell’informazione relativa ad un soggetto.
La creazione di un archivio richiede: Il nome dell’archivio, che lo identifica e serve a ricordarne il nome;
Il tracciato del record, cioè le informazioni che compongono il record;
La scelta del supporto (dischi, nastri, etc.);
L’indicazione della sua dimensione massima;
La definizione del modo in cui le informazioni da archiviare sono collegate tra loro;

Dopo aver creato un archivio su di esso si possono effettuare diverse operazioni:

Manipolazione: cioè l’inserimento di nuovi dati o la manipolazione di dati già registrati;
Interrogazione: cioè la ricerca all’interno dell’archivio delle informazioni richieste.

File e memorie di massa

I file sono memorizzati sulle memorie di massa o memorie ausiliarie, perché costituiscono l’estensione della memoria centrale di un computer, e consentono, a differenza della memoria centrale che è una memoria volatile, la permanenza delle registrazioni nel tempo. Tali apparecchi sono esterni all’unità centrale e prendono il nome di unità periferiche di memoria. Sulle memorie di massa possono essere effettuate operazioni di I/O, che non comprende la comunicazione tra utente e macchina, ma è un dispositivo che permette il dialogo tra le parti della macchina in modo da creare una memoria aggiuntiva molto capiente e permanente in ausilio alla memoria di centrale. I parametri che caratterizzano una memoria di massa sono:
○ Tipo di accesso che può essere random, come dischi o sequenziale come nei nastri;
○ Capacità la quantità di dati che il supporto può contenere (Gigabyte o Terabyte);
○ Access time il tempo medio di accesso misurato in millisecondi;
○ Transfert rate la velocità di trasferimento dei dati dalla memoria di massa alla centrale (KB/sec o MB/sec).
Il trasferimento dei dati tra memoria centrale e memoria di massa nelle operazioni di Input/Output avviene per blocchi (record fisici). Fisicamente non viene trasferito un singolo byte (carattere) ma generalmente blocchi da 2 KB, 4KB o 8 KB. Ogni blocco è un’unità fisica e prende il nome di record fisico, e può capitare che un blocco contenga più record logici. In questo modo le operazioni di lettura e scrittura non riguardano un singolo record logico ma gruppi di record, e quindi complessivamente diminuisce in numero di accessi alla periferica, e quindi di operazioni lente rispetto agli accessi ai dati contenuti in memori centrale.
Oltre ai record a lunghezza fissa abbiamo anche i record a lunghezza variabile, in questo caso bisogna specificare dove finisce ogni record (end of record). Ci sono due metodi fondamentali per individuare la fine di un record:

Scrivere la lunghezza del record in un campo a dimensione fissa collocato all’inizio del record stesso;
Far seguire ogni record da una speciale sequenza che ne indichi la fine del medesimo come i caratteri (carriage return e line feed).

Il file system regola l’organizzazione, l’assegnamento, la protezione e il ritrovamento di insieme di dati. In particolare esso svolge diverse funzioni:

Tiene traccia dei dati usando particolari strutture dati dette file directory.
Decide secondo le richieste, le protezioni e i diritti di accesso a quale programma assegnare un file o una parte di esso;
Assegna un file al programma che lo ha richiesto;
Togli l’uso di un file ad un programma rendendolo disponibile ad altri programmi.

Il file system utilizzano le directory o tabelle che contengono le informazioni che servono per identificare e trovare un file, e questi elementi sono:

Il nome del file;
Il tipo di file;
Il tipo di protezione e di accesso consentiti;
Il nome dell’utente che ha creato o modificato il file;
La dimensione del file in byte;
Le informazioni necessarie per trovare il file sul disco;
La data della creazione, dell’ultima modifica o dell’ultimo accesso.

Copie di sicurezza e fault tolerance

Le tecniche per copiare e ripristinare i dati sono due cioè il backup e il restore. Il restore si occupa del ripristino dei dati, mente il backup è l’operazione che viene eseguita per copiare i dati di un archivio. Le copie di backup devono essere fatte con regolarità e con una frequenza legata alla qualità di lavoro effettuata. E ci sono alcune tecniche di backup che prevedono la possibbilità di copiare solamente quei file che sono stati modificati di recente, attraverso un controllo sulla data di creazione o dell’ultima modifica senza dover effettuare la copia di tutti i file. Un'altra precauzione da adottare in merito alla sicurezza dei dati, consiste nell’utilizzo di un gruppo di continuità, detto UPS(uninterruptiblr power supply) che serve per proteggere il computer da inconvenienti sulla rete elettrica, quali cadute di tensione o interruzioni.
Nelle situazioni dove non è consentito l’interruzione dell’attività di un sistema di elaborazione la sicurezza viene garantita anche nella parte hardware attraverso la duplicazione di parti o dell’intero sistema, e queste tecniche prendono il nome di fault tolerance, e riguardano principalmente le memorie di massa nei server delle reti e nei sistemi di medie e grandi dimensioni. La fault tolerance ha tre diversi livelli:

Il primo livello si chiama mirroring e consente di avere nelle unità di memoria di massa due copie identiche dello stesso disco. Quando un operazione di I/O riscontra un errore l’elaborazione non viene interrotta potendo essa utilizzare la copia alternativa. Le operazioni di lettura vengono eseguite sulla copia disponibile, mentre le operazioni di scrittura vengono effettuati su entrambi i dischi, garantendo un backup continuamente aggiornato di tutti i dati.
Il secondo livello è il duplexing, che consiste nella duplicazione sia del disco sia dell’unità di controllo (controller). L’utente può continuare l’attività di elaborazione anche nel caso di un guasto al controller o al disco diminuendo così i rischi di interruzione.
Il terzo livello riguarda la duplicazione dell’intero sistema, del serve nel caso di reti locali e del mainframe nel caso di un sistema di grandi dimensioni. Viene garantita la continuità del lavoro a fronte di un guasto a una qualsiasi delle parti del sistema.

Organizzazione degli archivi

Nel lavoro con gli archivi è importante organizzare i dati nel miglior modo possibile secondo due parametri fondamentali di spazio e di tempo: ottimizzare l’uso dello spazio disponibile sul supporto, rendendo bassi i tempi di accesso. E ci sono diverse tecniche:

Organizzazione sequenziale: il file organizzato sequenzialmente può essere utilizzato solo per scrivere nuovi record, per leggere record o per aggiungere record in coda a quelli già registrati. I record sono memorizzati uno di seguito all’altro intervallati da caratteri speciali di EOR (End of record). La scrittura di un record in posizione intermedia provoca la perdita di tutti i successivi.
Organizzazione ad accesso diretto: Tutti record hanno la stessa lunghezza (dimensione in byte) che possiamo indicare con Lrec, quest’organizzazione viene fatta maggiormente nelle applicazioni, ed è possibile accedere al record in posizione N utilizzando la formula: posizione del primo byte del record N = (N-1)*Lrec+1. I file ad accesso diretto sono sconsigliate nelle applicazioni gestionali in quanto nella maggior parte dei casi non basta poter accedere al record n-esimo, ma serve saper accedere a un record in base a informazioni contenute nel record stesso.
Organizzazione a indici: L’archivio è composto da due file un file indice che contiene una chiave (campo univoco del record) e la posizione dei restanti campi del record in un altro file ad accesso diretto e un file ad accesso diretto. In questa organizzazione l’archivio occupa più spazio sulla memoria di massa e le operazioni di inserimento, modifica e cancellazione sono più complesse e richiedono più tempo. Ma un punto di forza che ha l’organizzazione ad indici è il tempo di accesso ai dati perché con questo metodo si diminuisce il tempo in fase di lettura.

Domande da interrogazione

Quali sono gli elementi principali di un archivio?

Un archivio possiede tre elementi principali: un file, che è una collezione di record; un record, che rappresenta un elemento dell’insieme di informazioni relative a un unico soggetto; e un campo, che rappresenta una parte dell’informazione relativa a un soggetto.

Quali sono i parametri che caratterizzano una memoria di massa?

I parametri che caratterizzano una memoria di massa includono il tipo di accesso (random o sequenziale), la capacità (Gigabyte o Terabyte), il tempo medio di accesso (misurato in millisecondi), e la velocità di trasferimento dei dati (KB/sec o MB/sec).

Quali tecniche di backup sono menzionate nel testo?

Il testo menziona il backup e il restore come tecniche per copiare e ripristinare i dati. Il backup è l’operazione di copia dei dati di un archivio, mentre il restore si occupa del ripristino dei dati.

Cosa si intende per fault tolerance e quali sono i suoi livelli?

La fault tolerance si riferisce alla capacità di un sistema di continuare a funzionare in caso di guasti. I suoi livelli includono il mirroring, il duplexing, e la duplicazione dell’intero sistema.

Quali sono le tecniche di organizzazione degli archivi descritte?

Le tecniche di organizzazione degli archivi descritte includono l’organizzazione sequenziale, l’organizzazione ad accesso diretto, e l’organizzazione a indici. Ognuna di queste tecniche ha vantaggi e svantaggi specifici in termini di spazio e tempo di accesso.

Archivi, memorie di massa e fault tolerance

Appunto di informatica con descrizione degli archivi e della loro organizzazione. descrizione delle memorie di massa e delle fault tolerance per quanto riguarda le macchine.

Concetti Chiave

Archivi

File e memorie di massa

Copie di sicurezza e fault tolerance

Organizzazione degli archivi

Domande da interrogazione

Recensioni

Domande e risposte

I migliori insegnanti di Informatica

Salvatore F.

Andrea D.

Concetti Chiave

Archivi

File e memorie di massa

Copie di sicurezza e fault tolerance

Organizzazione degli archivi

Domande da interrogazione

Appunti correlati

Archivi e file

Archivi e database

File, archivi e record

Memorie RAM e ROM

Recensioni

Domande e risposte

I migliori insegnanti di Informatica

Salvatore F.

Andrea D.