SPS_2023

27 supervisione (supervised),senza supervisione (unsupervised) e con rinforzo (reinforcement). Nell’unsupervised learning il sistema intelligente elabora informazioni prive di‘etichetta’per estrarre inmaniera autonoma delle carat- teristiche che gli permettanodi‘comprendere’la strutturadei dati.L’obiettivo è tipicamente quello di isolare tratti essenziali (riduzione di dimensionalità), separare elementi logicamente collegati tra loro (clustering) o identificare anomalie (anomaly detection). Nel supervised learning l’algoritmo richiede una fase di addestramento in cui opera su dati opportunamente etichettati (labeled training set) per costruire unmodellomatematico in grado di asso- ciare conun certo livellodi confidenza i dati in ingresso alla corretta etichetta. Questa metodologia di ML è simile al modo con cui un essere umano ap- prende sotto la supervisione di un insegnante. Classificazione e regressione sono le due principali applicazioni del supervised learning. Un aspetto importante del supervised learning è la separazione dei dati in dati di addestramento e dati di validazione. I secondi vengono utilizzati per verificare che il modello creato raggiunga il giusto compromesso tra bias e varianza, ossia che non soffra né di overfitting, né di undermodeling. La tec- nicadi cross-validationche consistenel crearepartizionimultipledai dati adi- sposizione in training set e validation set, viene comunemente impiegata per selezionare il modello con lemigliori prestazioni a prescindere da come i dati vengano ripartiti. Il reinforcement learning (RL) è un processo di apprendi- mento in cui la conoscenza viene acquisitaper tentativi successivi,valutando il successo o il fallimento di ogni azione e modificando il comportamento per ottimizzare i risultati. La retroazione rappresentata dalla ricompensa (reward) rappresenta l’incentivo, o ‘rinforzo’, a perseguire comportamenti con maggiori probabilità di successo. Spazi astratti per ML Possiamo definire machine learning lo studio di sistemi e algoritmi che, con l’esperienza, migliorano le proprie prestazioni o la propria cono- scenza. Tre concetti costituiscono la base di questi sistemi intelligenti: gli attributi (o feature), i compiti (task) e i modelli. Per poter operare sui dati del problema, l’algoritmo deve essere in grado di interpretarli. Il primo passo consiste nel ‘tradurre’ le informazioni del mondo reale in dati elabo- rabili: le feature sono corrispondenze tra lo spazio degli elementi (istanze) che sono parte del problema da risolvere, e un nuovo spazio (dominio) gestibile dall’algoritmo. Il nuovo dominio può contenere numeri interi, reali, variabili booleane o categorie discrete. Ad esempio, un rudimentale sistema di identificazione facciale potrebbe estrarre dagli elementi X rap- presentati da foto segnaletiche, una serie di parametri numerici (distanza tra gli occhi, distanza naso bocca, ...) e categorici (colore degli occhi, della pelle, dei capelli) che in un opportuno spazio multidimensionale riassu- mono le caratteristiche di una particolare fotografia. Il compito o modello è in sostanza il problema da risolvere: classificazione e regressione sono due esempi nell’ambito del supervised learning; clustering e riduzione di dimensionalità sono invece task tipici dell’unsupervised learning. Sebbene nelle applicazioni reali il numero di dimensioni dello spazio delle feature sia troppo elevato per poter essere visualizzato fedelmente, la sua rap- presentazione in uno spazio ridotto bi o tridimensionale rende possibile apprezzare l’azione degli algoritmi in maniera intuitiva sotto forma di Regressione e classificazione rappresentano le due principali categorie di algoritmi impiegati nell’unsupervised machine learning. A seguito delle fasi di training e validazione, i modelli possono essere impiegati per effettuare previsioni Fonte foto shutterstock