I materiali pubblicati sul sito costituiscono rielaborazioni personali del Publisher di informazioni apprese con la frequenza delle lezioni e lo studio autonomo di eventuali testi di riferimento in preparazione all’esame finale o della tesi. Non devono intendersi come materiale ufficiale dell’università attribuibile al docente del corso.
…continua

Filtra per

Tutte le tipologie

Ordina

Filtra

Appunti degli studenti per corsi ed esami del Prof. Brambilla Marco

Risorsa accademica completa e dettagliata, basata sul corso del Prof. Marco Brambilla e redatta da Andrea Mikhaiel presso il Politecnico di Milano. Questo materiale fornisce una panoramica approfondita dei moderni sistemi di gestione dei dati, con un'attenzione particolare alle tecnologie NoSQL e alle soluzioni per il trattamento dei big data. Struttura chiara e ben organizzata: Il documento è articolato in sezioni tematiche distinte che affrontano in modo sistematico aspetti fondamentali dei database NoSQL, tra cui: - Graph database - Documental - Key-value - Columnar - Elasticsearch - Vector database - Spark Ogni sezione è introdotto da una solida trattazione teorica, seguita da esempi pratici che rendono i contenuti fruibili sia per i neofiti sia per utenti più esperti. Approfondimenti tecnologici: Le principali tecnologie vengono analizzate in profondità. Tra gli argomenti trattati: - Neo4j: sintassi delle query Cypher, creazione e navigazione dei grafi - MongoDB: operazioni CRUD, gestione dello sharding, vantaggi di JSON/BSON - Redis: architettura masterless, persistenza dei dati, utilizzo nei sistemi di caching - Cassandra: struttura column-family, consistenza configurabile, architettura distribuita - Elasticsearch: indici invertiti, ranking TF-IDF, gestione di query avanzate Contenuti aggiornati e innovativi: Il materiale include anche sezioni su tecnologie emergenti, come i database vettoriali, rilevanti per applicazioni in ambito AI e machine learning, nonché su piattaforme moderne come Apache Spark e Snowflake, con focus sull’elaborazione distribuita e sulle architetture di data warehousing in cloud.
...continua
The whole file is in English IT: Questo file contiene il appunti delle slide integrati con delle note prese a lezione di tutti i capitoli del corso di System and Method for Big and Unstructured Data (Magistrale Ingegneria Informatica) del professor Brambilla (AC 2021/2022). Inoltre sono integrati alcune note prese dalle domande degli esami passati EN: This file contains the notes of the slides integrated with the notes taken in class of all the chapters of the System and Method for Big and Unstructured Data course (Master's degree in Computer Engineering) by Professor Brambilla (AC 2021/2022). Also integrated are some notes taken from past exam questions Argomenti / Topics: 1. Big Data 2. Toward NoSQL (5) 2.1. Transactional Properties 2.2 Cap Theorem 5 2.3 No-SQL World 2.4 Acid VS Base Properties 3. Data Ingestion: API 7.1 How to expose API 7.2 Some Problem 4. Graph Databases - Neo4J (6) 3.1 Neo4j 4. Key Value Database - Redis (8) 4.1 Caching Purpose - MemCached 4.2 Redis 4.2.1 Redis Features The main characteristic of Redis are: 4.2.2 Redis Topologies 5. Document Databases - MongoDB (7) 5.1. Sharding 6. IR Based Databases - Elastic ELK (10) 6.1 ElasticSearch 6.1.1 Score Function 6.1.2 Mapping 6.1.3 Analyzer 6.1.4 Shard 6.2 Query 8. DataWareHouse and SnowFlake 8.1 Data Warehouse Models 8.2 SnowFlake Software 9. Columnar Databases - Cassandra 9.1 Cassandra Data Model 9.2 Decentralized Cassandra and Server Mapping 9.3 Cassandra Operations 9.4 Some notes from Exercise Session 10. Spark 10.1 Importing Data 11. Hadoop & HDFS 11.1 HDFS 11.1.1 HDFS Architecture 11.2 Map Reduce
...continua
Appunti completi del corso Ingegneria del Software tenuto dal prof Marco Brambilla al Politecnico di Milano. Argomenti trattati: - Fattibilità e requisiti (con diagramma I* ) - Programmazione ad oggetti - UML - Design Pattern - Java - Project Planning
...continua