- apprendimento con supervisione,
- apprendimento senza supervisione
- apprendimento di rafforzamento.
Esamineremo le differenze fondamentali che esistono fra questi tre diversi tipi di apprendimento , utilizzando esempi concettuali, svilupperemo alcune idee relative ai domini pratici dei problemi ai quali tali tecniche possono essere applicate.
Effettuare previsioni sul futuro grazie all’apprendimento con supervisione
Lo scopo principale dell’apprendimento con supervisione consiste nel trarre un modello a partire da dati di addestramento etichettati, i quali ci consentono di effettuare previsioni relative a dati non disponibili o futuri.
Qui il termine con supervisione fa riferimento al fatto che nell’insieme di campioni i segnali di output desiderati (le etichette) sono già noti.
Esempio
Considerando l’esempio del filtraggio dei messaggi spam di posta elettronica, possiamo addestrare un modello applicando un algoritmo di apprendimento con supervisione a un insieme di messaggi di posta elettronica già etichettati, che siano stati correttamente contrassegnati come spam oppure non-spam, per fargli determinare se un nuovo messaggio di posta elettronica appartiene all’una o all’altra categoria.
Un compito di apprendimento con supervisione, sulla base di etichette delle classi discrete, come nel precedente esempio del filtraggio dello spam nella posta elettronica, è chiamato anche compito di classificazione.
Classificazione per la predizione delle etichette delle classi
La classificazione è una sottocategoria dell’apprendimento con supervisione, dove l’obiettivo è quello di prevedere le etichette di categoria delle classi per le nuove istanze, sulla base delle osservazioni compiute nel passato.
Queste etichette sono valori discreti, non ordinati, che possono essere considerati come appartenenti a un gruppo delle istanze.
L’esempio menzionato in precedenza del rilevamento dello spam nella posta elettronica rappresenta un tipico esempio di classificazione binaria: l’algoritmo di apprendimento automatico impara un insieme di regole con lo scopo di distinguere fra due possibili classi: messaggi di posta elettronica che sono spam o che sono non-spam.
Tuttavia, l’insieme delle etichette delle classi non deve necessariamente avere una natura binaria.
Un tipico esempio di un compito di classificazione multiclasse è il riconoscimento del testo scritto a mano. Qui possiamo raccogliere un dataset di apprendimento che è costituito da più esempi di scrittura a mano di ciascuna lettera dell’alfabeto. Ora, se un utente fornisce un nuovo carattere scritto a mano tramite un dispositivo di input, il nostro modello predittivo sarà in grado di prevedere con una certa precisione la lettera corretta dell’alfabeto. Tuttavia, il nostro sistema di apprendimento automatico non sarebbe in grado di riconoscere correttamente le cifre da 0 a 9, per esempio, se queste non facevano già parte del dataset di apprendimento.
La Figura sotto illustra il concetto del compito di classificazione binaria sulla base di campioni di apprendimento: quindici di essi sono etichettati
come classe negativa (i cerchi) e altrettanti campioni sono etichettati come classe positiva (i segni +). In questa situazione, il nostro dataset è bidimensionale, il che significa che a ogni campione possono essere associati due colori: x1 e x2
Ora, possiamo utilizzare un algoritmo di apprendimento automatico con supervisione per trarre una regola (il confine decisionale è rappresentato dalla linea tratteggiata) che sia in grado di separare queste due classi e classificare i nuovi dati in ognuna di queste due categorie sulla base dei loro valori x1 e x2.