Gli algoritmi di classificazione per i Big Data e la loro valutazione
- Authors: Trobia
- Publication year: 2020
- Type: Capitolo o Saggio
- OA Link: http://hdl.handle.net/10447/452832
Abstract
La classificazione è uno degli obiettivi principali dell’analisi dei Big Data. In questo capitolo, presento la tecnica degli alberi decisionali. Ne riassumo, anzitutto, la logica di base e ne illustro, a partire da un semplice esempio, alcuni dettagli computazionali. Successivamente, utilizzando KNIME, una potente piattaforma user friendly per l’analisi dei Big Data, analizzo un dataset remoto su Amazon S3, mostro i principali risultati ottenuti e accenno ad alcune strategie più complesse d’analisi. Concludo il contributo con una panoramica sulle metriche e le tecniche più diffuse per valutare la bontà di un modello di classificazione e con un bilancio metodologico sulle applicazioni degli alberi decisionali nelle scienze sociali.