DATA SCIENCE E AI

02 / 32

Indice

01Data Science

02Intelligenza Artificiale

03Machine Learning

04Approcci e tassonomie dell'AI

05Data Science, ML, AI: chi è chi

06Glossario e algoritmi di ML

07Regressione lineare

DATA SCIENCE E AI

03 / 32

Cosa è la Data Science

Disciplina che applica il metodo scientifico ai dati per estrarne conoscenza utile, combinando programmazione, matematica e statistica. Trasforma dati grezzi in modelli e analisi a supporto delle decisioni. Concetto di Data Science introdotto da Tukey (1962), formalizzato da Cleveland (2001).

DATA SCIENCE E AI

04 / 32

Fasi della Data Science

Definizione del problema

Quale domanda vogliamo rispondere con i dati?

Acquisizione dati

Raccolta da database, API, file, sensori

Pulizia dei dati

Gestione valori mancanti, duplicati, outlier

Esplorazione (EDA)

Visualizzazioni, correlazioni, pattern

Modellazione

Algoritmi di ML, validazione, tuning

Comunicazione

Report, dashboard, storytelling con i dati

DATA SCIENCE E AI

05 / 32

Applicazioni Data Science

E-commerce

Finanza & Banking

Medicina & Healthcare

Trasporti & Logistica

Streaming

Sport

Industria 4.0

Pubblica Amm.

DATA SCIENCE E AI

06 / 32

Strumenti della Data Science

Linguaggi

Python • R • SQL • Julia

Manipolazione dati

Pandas • NumPy • Polars

Visualizzazione

Matplotlib • Seaborn • Plotly

Machine Learning

scikit-learn • XGBoost • LightGBM

Deep Learning

TensorFlow • PyTorch • Keras

Big Data

Spark • Hadoop • Dask

Notebook & ambiente

Jupyter • VS Code • Colab

Cloud & MLOps

AWS SageMaker • Databricks • MLflow

DATA SCIENCE E AI

07 / 32

Cosa è la Intelligenza Artificiale

L'intelligenza artificiale è lo sviluppo di sistemi capaci di risolvere problemi che richiederebbero intelletto umano. Branca dell'informatica che studia come progettare sistemi in grado di percepire, ragionare, apprendere e agire in modo autonomo.

DATA SCIENCE E AI

08 / 32

Cosa è la Intelligenza Artificiale

Capacità di una macchina di esibire comportamenti che, se osservati in un essere umano, sarebbero considerati "intelligenti" (Test di Turing).

1950: Alan Turing si chiede "Can machines think?"

"Un giudice umano fa una conversazione testuale con due interlocutori nascosti, uno umano e uno macchina. Se il giudice non riesce a distinguerli, la macchina pensa*."

O almeno fa qualcosa di indistinguibile.

DATA SCIENCE E AI

09 / 32

Cosa è il Machine Learning

Branca dell'IA, consente ai programmi di imparare dai dati invece di seguire regole scritte a mano dal programmatore tramite pattern statistici estratti da grandi quantità di esempi.

Dati (tanti, e di qualità)

Modello (l'algoritmo che impara)

Obiettivo (cosa vogliamo che impari)

Nel ML il programma scopre le regole basandosi sui dati che noi forniamo, cambio di paradigma: dal "cosa fare" al "cosa imparare a fare".

DATA SCIENCE E AI

10 / 32

Cosa è il Machine Learning

Approccio più diffuso negli ultimi anni grazie a:

Disponibilità massiva di dati

Potenza di calcolo

Algoritmi più sofisticati

DATA SCIENCE E AI

11 / 32

Cosa è il Machine Learning

La programmazione classica funziona bene quando le regole sono esprimibili in modo esplicito: se età ≥ 18 → maggiorenne.

Funziona però meno bene per problemi dove i dati sono sporchi o incompleti, difficile scrivere in maniera esplicita il pattern.

Riconoscere un gatto in una foto

Capire l'intento dietro una frase

Filtrare lo spam in milioni di email diverse

DATA SCIENCE E AI

12 / 32

Approcci alla IA

Symbolic AI (anni 50-80): codifichiamo a mano la conoscenza in regole logiche. Funziona bene per problemi chiusi (scacchi, sistemi esperti medici degli anni '80), fallisce su problemi del mondo reale per le troppe eccezioni da scrivere.

Search & Planning (anni 60-90): l'intelligenza è cercare la soluzione migliore in uno spazio di possibilità. Funziona bene dove le regole sono chiare e lo spazio è esplorabile (Deep Blue agli scacchi), fallisce dove non sai nemmeno definire bene il problema.

DATA SCIENCE E AI

13 / 32

Approcci alla IA

Machine Learning (anni 2010-oggi): non scrivo né regole né algoritmi di ricerca, faccio imparare al sistema dai dati. Funziona bene quando ci sono dati abbondanti e strutturati (approccio più usato oggi).

DATA SCIENCE E AI

14 / 32

Come catalogare una IA?

L'AI è un campo composito, fatto di tante discipline, approcci e applicazioni diverse. Esistono diverse "viste", ciascuna risponde a una domanda diversa.

Tassonomia tecnica → da cosa è fatta l'AI

Modalità di apprendimento → come imparano i modelli ML

Domini applicativi → a cosa serve in pratica?

DATA SCIENCE E AI

15 / 32

Catalogare una IA: Tassonomia

ARTIFICIAL INTELLIGENCE

Machine Learning

Impara dai dati

Symbolic AI

Logica, regole, ontologie

Search & Planning

Algoritmi, ottimizzazione

Robotics

Percezione, controllo

Applicazioni

Computer Vision, NLP, Speech, GenAI...

DATA SCIENCE E AI

16 / 32

Catalogare una IA: Apprendimento

Supervised Learning

"Imparo dagli esempi etichettati"

Predire prezzo casa, classificare spam

Unsupervised Learning

"Scopro pattern senza etichette"

Clustering di clienti, riduzione dimensionalità

Reinforcement Learning

"Imparo per tentativi ed errori"

AlphaGo, robot autonomi, auto a guida autonoma

DATA SCIENCE E AI

17 / 32

Catalogare una IA: Domini

Computer Vision

Riconoscimento immagini, object detection

NLP

Traduzione, chatbot, sentiment analysis

Speech & Audio

Speech-to-text, assistenti vocali

Generative AI

LLM, image generation, code generation

Tabular / Predictive

Forecasting, fraud detection, scoring

Reinforcement applicato

Game AI, robotica, ottimizzazione

DATA SCIENCE E AI

18 / 32

Le origini

1936: Alan Turing formalizza la "macchina di Turing" ponendo le basi teoriche dell'informatica moderna.

1943: primo modello matematico di neurone, idea è che il cervello sia come rete di unità che si attivano o no.

1950: Turing pubblica "Computing Machinery and Intelligence" (Test di Turing).

1956: Conferenza di Dartmouth, nasce il termine "Artificial Intelligence".

DATA SCIENCE E AI

19 / 32

Le origini

1958: Percettrone e la prima rete neurale artificiale fisica.

1966: ELIZA, il primo "chatbot" che simula uno psicoterapeuta con poche regole.

1969: Inizia il primo "inverno dell'AI".

1986: Backpropagation, l'algoritmo che rende possibile addestrare reti neurali profonde.

DATA SCIENCE E AI

20 / 32

Le origini

1997: Deep Blue (IBM) batte Garry Kasparov a scacchi, per la prima volta una macchina batte il campione del mondo.

2011: IBM Watson vince a Jeopardy! Una macchina capisce e risponde in linguaggio naturale, in TV.

2011-2014: Siri, Cortana, Alexa entrano nelle case, per molti è il primo contatto quotidiano con un'AI.

2012: AlexNet vince la ImageNet Challenge. Le reti neurali profonde stracciano i metodi classici. Inizia l'era del Deep Learning moderno.

DATA SCIENCE E AI

21 / 32

Le origini

2014: Implementate prime reti generative. La base concettuale dietro l'AI generativa.

2015: Nasce OpenAI, fondata da Elon Musk, Sam Altman e altri come laboratorio no-profit per un'AI "sicura e benefica per l'umanità".

2016: AlphaGo batte Lee Sedol a Go. Una macchina supera l'uomo in un gioco a stati infiniti.

2017: Paper "Attention is All You Need" (Google). Nascono i Transformer, l'architettura dietro tutti gli LLM moderni.

DATA SCIENCE E AI

22 / 32

Le origini

2020: GPT-3 (OpenAI), il modello pre-ChatGPT, già con 175 miliardi di parametri.

2022: Lancio di ChatGPT, l'AI entra nelle mani di centinaia di milioni di persone.

DATA SCIENCE E AI

23 / 32

L'IA al Cinema

1968: 2001: Odissea nello Spazio (Kubrick)

1982: Blade Runner (Scott)

1983: WarGames (Badham)

1984: Terminator (Cameron)

1995: Ghost in the Shell (Oshii)

2001: A.I. Intelligenza Artificiale (Spielberg)

2004: I, Robot (Proyas)

2008: Iron Man (Favreau)

2013: Her (Jonze)

DATA SCIENCE E AI

24 / 32

Data Science, ML, AI

Data Science e AI sono due cerchi che si sovrappongono parzialmente. L'area di sovrapposizione è il Machine Learning.

Solo DS: statistica classica, EDA, BI, reporting.

Solo AI: Symbolic AI, Search, Robotics.

Intersezione (ML): il lavoro del data scientist moderno (RL nei robot, computer vision standalone).

DATA SCIENCE E AI

25 / 32

Data Science, ML, AI

Data Science: disciplina che usa dati per prendere decisioni.

cosa ci dicono i dati?

Machine Learning: tecnica per costruire modelli predittivi imparando dai dati.

come faccio prevedere/classificare automaticamente?

IA: campo molto più ampio, include il ML + sistemi a regole, ricerca, pianificazione, robotica.

come faccio una macchina che si comporti in modo intelligente?

DATA SCIENCE E AI

26 / 32

Data Science, ML, AI

Data Science senza AI esiste: dashboard, statistica descrittiva, BI.

AI senza DS esiste: motori scacchistici classici, sistemi esperti.

ML è il punto di contatto: tecnica usata da entrambe.

DATA SCIENCE E AI

27 / 32

Glossario per il ML

Quando diciamo che un modello "impara dai dati", concretamente intendiamo:

Dati: esempi (x, y), input e output desiderati

Modello: una famiglia di funzioni f possibili

Training: trovare i parametri di f che fanno f(x) ≈ y sui dati che ho

Predizione: usare f trovata su nuovi x mai visti

Errore: quanto f(x) si discosta da y

DATA SCIENCE E AI

28 / 32

Tipologie di algoritmi di ML

Modelli lineari: Regressione lineare, Regressione logistica. Sono algoritmi semplici, interpretabili, veloci.

Forecasting di vendite, analisi causale in economia, modelli di pricing

Alberi: Decision Tree, Random Forest, XGBoost. Flessibili, gestiscono bene dati tabellari complessi.

Sistemi anti-frode, ranking di Spotify/Netflix, previsioni di churn nelle telco

Reti neurali: MLP, CNN, RNN, Transformer. Potentissime su immagini, testo, audio. Richiedono molti dati e potenza di calcolo.

DATA SCIENCE E AI

29 / 32

Tipologie di algoritmi di ML

Reti neurali: MLP, CNN, RNN, Transformer. Potentissime su immagini, testo, audio. Richiedono molti dati e potenza di calcolo.

ChatGPT, GitHub Copilot, Midjourney, Google Translate, Tesla Autopilot

Modelli probabilistici: Naive Bayes, Gaussian Mixture, HMM. Ragionamento esplicito sull'incertezza.

Filtri antispam classici (Gmail dei primi anni), diagnosi medica assistita, NLP

DATA SCIENCE E AI

30 / 32

Tipologie di algoritmi di ML

Modelli basati su distanze: k-NN, K-Means. Idea: "cose simili stanno vicine". Semplici e intuitivi.

Sistemi di raccomandazione "prodotti simili", riconoscimento di volti su iPhone (parzialmente)

DATA SCIENCE E AI

31 / 32

Regressione lineare

L'obiettivo del ML è imparare dai dati una funzione f tale che f(x) ≈ y.

L'obiettivo della regressione lineare è trovare la f più semplice possibile: una funzione lineare.

y ≈ a·x + b

Data Science
e AI

Indice

Target

Cosa è la Data Science

Fasi della Data Science

Definizione del problema

Acquisizione dati

Pulizia dei dati

Esplorazione (EDA)

Modellazione

Comunicazione

Applicazioni Data Science

Strumenti della Data Science

Cosa è la Intelligenza Artificiale

Cosa è la Intelligenza Artificiale

Cosa è il Machine Learning

Cosa è il Machine Learning

Cosa è il Machine Learning

Approcci alla IA

Approcci alla IA

Come catalogare una IA?

Catalogare una IA: Tassonomia

Catalogare una IA: Apprendimento

Catalogare una IA: Domini

Le origini

Le origini

Le origini

Le origini

Le origini

L'IA al Cinema

Data Science, ML, AI

Data Science, ML, AI

Data Science, ML, AI

Glossario per il ML

Tipologie di algoritmi di ML

Tipologie di algoritmi di ML

Tipologie di algoritmi di ML

Regressione lineare

Laboratorio

Data Sciencee AI

Indice

Target

Cosa è la Data Science

Fasi della Data Science

Definizione del problema

Acquisizione dati

Pulizia dei dati

Esplorazione (EDA)

Modellazione

Comunicazione

Applicazioni Data Science

Strumenti della Data Science

Cosa è la Intelligenza Artificiale

Cosa è la Intelligenza Artificiale

Cosa è il Machine Learning

Cosa è il Machine Learning

Cosa è il Machine Learning

Approcci alla IA

Approcci alla IA

Come catalogare una IA?

Catalogare una IA: Tassonomia

Catalogare una IA: Apprendimento

Catalogare una IA: Domini

Le origini

Le origini

Le origini

Le origini

Le origini

L'IA al Cinema

Data Science, ML, AI

Data Science, ML, AI

Data Science, ML, AI

Glossario per il ML

Tipologie di algoritmi di ML

Tipologie di algoritmi di ML

Tipologie di algoritmi di ML

Regressione lineare

Laboratorio

Data Science
e AI