Come funziona davvero l’algoritmo di TikTok

Notiamo che stai usando un AdBlocker.

Gli annunci pubblicitari ci aiutano a mantenere questo sito gratuito e accessibile a tutti. Ti saremmo davvero grati se volessi disattivare AdBlocker per il nostro sito: niente pubblicità invasive, promesso! Grazie per il tuo supporto ❤️Our team work realy hard to produce quality content on this website and we noticed you have ad-blocking enabled.

Ti è mai capitato di posare il telefono e chiederti dove siano finiti gli ultimi quaranta minuti della tua vita?

Non è mancanza di forza di volontà e non è un caso.

È l’effetto di una partita a scacchi giocata contro un avversario che processa miliardi di dati al secondo per capire esattamente cosa eccita i tuoi neuroni. Mentre i vecchi social si limitano a mostrarti le foto dei tuoi amici o di chi hai scelto di seguire, TikTok ha rimosso l’intermediario umano.

Non gli interessa chi conosci, gli interessa chi sei nei tuoi momenti di distrazione.

Dietro quella sequenza infinita di video c’è un’architettura matematica brutale, progettata per una sola cosa: trasformare la tua attenzione in una variabile prevedibile. Analizziamo come funziona davvero il motore che ha reso obsoleto il concetto stesso di “seguire qualcuno”.

La matematica nascosta dietro il feed più potente del mondo

TikTok non è un social network tradizionale.

È un prediction engine alimentato da intelligenza artificiale che trasforma ogni scroll in un dato per raffinare il modello del nostro comportamento.

Mentre l’AI generativa (come quella che crea immagini o testi) produce contenuti nuovi, la recommendation AI di TikTok predice e massimizza il tempo di attenzione.

La differenza con i social tradizionali è abissale: questi ultimi sono basati sul social graph (chi segui, chi ti segue), TikTok sul content graph e sul behavior graph (cosa guardi davvero, come lo guardi, quanto a lungo).

TikTok NON funziona come Instagram

Instagram (e la maggior parte dei social pre-TikTok) è follower-centrico: mostra prima i contenuti di chi segui, poi esplora.

Il successo dipende dalle relazioni sociali esistenti.

TikTok ribalta tutto: è interest graph puro.

Un video può arrivare a milioni di persone che non seguono il creator e che non hanno mai interagito con lui.

Conta pochissimo il numero di follower all’inizio; conta quasi esclusivamente come il contenuto performa in termini di attenzione.

Questa è la rivoluzione: le relazioni sociali passano in secondo piano rispetto ai segnali comportamentali grezzi.

Il problema del “cold start”

Quando apri TikTok per la prima volta, l’algoritmo non sa ancora chi sei.

Questo è un classico problema dei recommendation system chiamato cold start problem.

All’inizio il sistema utilizza:

dati demografici approssimativi,
lingua,
geolocalizzazione,
dispositivo,
trend globali,
segnali medi della popolazione.

Poi osserva rapidamente:

cosa skippi,
dove rallenti,
quali video riguardi,
quanto tempo resti.

Ed è qui che TikTok mostra la sua forza:

bastano spesso pochi minuti di utilizzo perché il sistema inizi a costruire un embedding comportamentale sorprendentemente preciso.

Come TikTok addestra il tuo comportamento in tempo reale

Marco apre TikTok “solo un attimo”, mentre aspetta che l’acqua della pasta bolla. Il primo video scorre via. Il secondo lo ferma.

L’algoritmo registra il micro‑movimento del pollice: +1 secondo di attenzione. Poi un altro. Poi un altro ancora.

Nel suo “cervello” vettoriale, un numero cambia leggermente: P(guarderà fino alla fine) = 0.62 → 0.74.

Il terzo video è un colpo perfetto. Marco non lo sa, ma quel contenuto è stato mostrato prima a 312 utenti simili a lui. Retention alta. Completion altissima. Il modello decide: vale la pena rischiare.

Marco resta. L’acqua inizia a bollire, ma lui non se ne accorge.

Il quarto video è ancora più preciso. Non parla dei suoi interessi dichiarati. Parla dei suoi interessi impliciti, quelli che emergono quando è stanco, distratto, vulnerabile.

Il quinto video lo sorprende. Lo riguarda due volte. Nel registro invisibile dell’algoritmo, una nuova correlazione si rafforza:

RR (Rewatch Rate) = segnale di dopamina → aumentare contenuti simili.

Il feed si stringe. Si affina. Si chiude.

Marco non sta scegliendo. Sta addestrando.

E mentre lui scorre, l’algoritmo aggiorna il suo profilo comportamentale centinaia di volte al minuto, come un maestro di scacchi che anticipa ogni mossa con tre mosse di vantaggio.

Forse potrebbe interessarti anche: Pandas Series vs NumPy Array: La Differenza Pratica che Ogni Sviluppatore Python Deve Conoscere

Quando finalmente spegne il telefono, sono passati quaranta minuti. L’acqua è evaporata. La cucina odora di bruciato.

L’algoritmo no. Lui non brucia mai. Lui osserva, predice, impara.

E aspetta il prossimo scroll.

Il cuore matematico: il prediction engine

Al centro di tutto c’è una probabilità:

P(utente guarda fino alla fine | video, contesto, utente)

TikTok cerca continuamente di stimare questa e altre probabilità correlate:

Watch time (tempo totale di visualizzazione)
Completion rate (percentuale di chi guarda tutto il video)
Rewatch rate (quante volte viene rivisto)
Skip probability (probabilità di scrollare via subito)
Engagement signals (like, commenti, share, salvataggi)

Ogni interazione aggiorna in tempo reale il modello predittivo. Non è magia: è machine learning su scala enorme.

Le metriche che contano davvero nell’algoritmo di TikTok

Uno degli errori più comuni quando si parla di TikTok è pensare che l’algoritmo funzioni come i vecchi social network.

Molti credono ancora che le variabili decisive siano:

numero di follower,
like,
commenti.

In realtà TikTok utilizza un approccio molto più sofisticato.

L’obiettivo principale del sistema non è premiare la popolarità “sociale”.

È massimizzare una cosa molto più preziosa:

l’attenzione dell’utente.

Per questo motivo le metriche più importanti sono quelle che misurano:

coinvolgimento reale,
permanenza,
comportamento implicito,
probabilità di continuare a guardare.

Ed è qui che TikTok diventa estremamente interessante dal punto di vista matematico.

1. Watch Time: il tempo di visualizzazione

La metrica più importante è probabilmente il watch time.

In pratica:

quanto tempo una persona guarda il video.

TikTok interpreta il tempo di visualizzazione come un segnale molto forte di interesse.

Per esempio:

mettere like richiede una scelta cosciente,
ma restare a guardare significa che il contenuto ha catturato davvero l’attenzione.

Formula

Possiamo definire il watch time medio come:

[math]\displaystyle WT = \frac{\sum_{i=1}^{n} t_i}{n}[/math]

Dove:

[math]t_i[/math] è il tempo di visualizzazione del singolo utente,
[math]n[/math] è il numero totale di visualizzazioni.

Esempio pratico

Supponiamo:

video da 30 secondi,
100 utenti.

Scenario A:

media visualizzazione = 27 secondi.

Scenario B:

media visualizzazione = 6 secondi.

Anche se il video B ha più like, TikTok potrebbe preferire il video A perché:

mantiene l’utente dentro la piattaforma più a lungo.

Ed è esattamente questo il business model della piattaforma.

2. Retention Rate: quanto riesci a trattenere l’utente

Il watch time assoluto da solo non basta.

TikTok misura anche:

quanto del video viene realmente visto.

Questa è la retention.

Formula della retention

[math]\displaystyle \text{Retention} = \frac{\text{tempo medio visto}}{\text{durata totale video}}[/math]

Esempio

Video:

Durata = 20 secondi.
Tempo medio visualizzato = 18 secondi.

Calcolo:
[math]\displaystyle \text{Retention} = \frac{18}{20} = 0.9 = 90\%[/math]

Un retention rate del 90% è enorme.

Significa che:

Quasi tutti restano fino alla fine;
Il contenuto mantiene alta l’attenzione;
Il video ha forte probabilità di essere “spinto” dall’algoritmo.

3. Completion Rate: il video viene finito?

Molto simile alla retention, ma ancora più “aggressiva”. TikTok misura con precisione quanti utenti arrivano effettivamente alla fine del video.

Formula intuitiva

[math]\displaystyle CR = \frac{\text{visualizzazioni complete}}{\text{visualizzazioni totali}}[/math]

Esempio

Visualizzazioni totali: 10.000
Utenti che arrivano alla fine: 7.500

Calcolo:
[math]\displaystyle CR = \frac{7500}{10000} = 0.75 = 75\%[/math]

Un Completion Rate alto è un segnale potentissimo per l’algoritmo e indica:

Struttura narrativa efficace: il video non annoia;
Buon ritmo: non ci sono momenti morti che spingono allo scroll;
Forte curiosità: l’utente è motivato a scoprire il finale o la “hook” conclusiva.

4. Rewatch Rate: quando il video viene riguardato

Qui entriamo nella parte più interessante. TikTok osserva con attenzione il comportamento dell’utente se:

L’utente rivede il video;
Torna indietro in un punto specifico;
Lo lascia ripartire automaticamente (loop).

Questo è un segnale potentissimo perché implica:

Sorpresa: l’utente non ha colto tutto al primo colpo;
Curiosità/Densità informativa: ci sono dettagli che meritano una seconda occhiata;
Forte stimolo emotivo: il contenuto è così piacevole da volerlo rivivere subito.

Forse potrebbe interessarti anche: Dalla statistica al data mining e alla data science: un'evoluzione naturale

Formula intuitiva

[math]\displaystyle RR = \frac{\text{numero totale di replay}}{\text{visualizzazioni uniche}}[/math]

Esempio

Utenti unici: 1.000
Riproduzioni totali: 1.600

Calcolo:
[math]\displaystyle RR = \frac{1600}{1000} = 1.6[/math]

In media, ogni utente guarda il video 1,6 volte. Per TikTok, questo è un indicatore di qualità estremamente elevato che spinge il video verso un pubblico molto più vasto.

Perché i video brevi esplodono facilmente?

Perché il rewatch diventa molto probabile.

Un video da:

8 secondi,
12 secondi,

può essere visto:

2,
3,
4 volte automaticamente.

Questo gonfia:

watch time,
retention,
completion rate,
rewatch rate.

Ed ecco perché molti creator usano:

loop invisibili,
finali aperti,
tagli rapidissimi.

5. Stop Scrolling Rate: il vero “gancio”

Questa è una delle metriche più sottovalutate. TikTok misura con precisione quanti utenti interrompono lo scroll compulsivo nel momento esatto in cui compare il tuo video.

È il cuore del cosiddetto hook iniziale: la capacità di catturare l’attenzione nel primo secondo di riproduzione.

Formula

[math]\displaystyle SSR = \frac{\text{utenti che si fermano}}{\text{impression totali}}[/math]

Esempio

Video mostrato nel feed (Impression): 50.000 volte
Utenti che si fermano almeno 2 secondi: 15.000

Calcolo:
[math]\displaystyle SSR = \frac{15000}{50000} = 0.3 = 30\%[/math]

Un valore alto indica che il “pacchetto” iniziale è vincente grazie a:

Thumbnail/Copertina efficace: impatto visivo immediato;
Apertura forte: una promessa o una domanda che esige risposta;
Movimento iniziale: dinamismo che rompe la staticità del feed;
Curiosità immediata: un elemento fuori contesto o sorprendente.

Perché i primi 2 secondi sono cruciali?

TikTok opera in un ambiente di sovraccarico cognitivo e competizione estrema. Il sistema deve rispondere istantaneamente a una domanda: “Questo contenuto fermerà lo scrolling?”

Se la risposta è sì: l’algoritmo convalida l’hook e concede al video un nuovo pacchetto di impression.
Se la risposta è no: il video viene rapidamente penalizzato, indipendentemente dalla qualità della parte centrale o finale.

Like e follower allora non servono?

Servono.

Ma meno di quanto molti credano.

TikTok ha rivoluzionato il paradigma dei social:

Vecchio modello

popolarità sociale

Nuovo modello

performance comportamentale

Un creator piccolo può fare milioni di views se:

retention,
rewatch,
watch time

sono molto alti.

Ed è proprio questo che rende TikTok così imprevedibile.

Questo ha cambiato completamente anche l’economia dei creator:

su TikTok la distribuzione dipende molto più dalla performance del singolo contenuto che dalla dimensione dell’audience preesistente.

Feedback esplicito vs feedback implicito

I vecchi social si basavano soprattutto su feedback espliciti:

like,
follow,
commenti.

TikTok invece utilizza enormemente i feedback impliciti:

tempo di permanenza,
velocità di scroll,
replay,
pause,
esitazioni del dito.

Perché?

Perché il comportamento involontario spesso rivela preferenze più autentiche delle azioni coscienti.

Un utente può mettere like “per educazione”. Ma non può fingere di aver guardato un video per 47 secondi.

Il vero obiettivo matematico di TikTok

Tutte le metriche analizzate finora non sono fini a se stesse.

Servono all’algoritmo per stimare un valore fondamentale:

La probabilità che un contenuto massimizzi il tempo totale trascorso dall’utente sulla piattaforma.

In termini matematici, TikTok cerca continuamente di ottimizzare una funzione di punteggio (Score) complessa, che potremmo sintetizzare così:

[math]\displaystyle \text{Score} = f(WT, \text{Retention}, CR, RR, SSR, \text{Engagement})[/math]

Legenda dei fattori:

WT: Watch Time (tempo totale)
CR: Completion Rate (percentuale di completamento)
RR: Rewatch Rate (tasso di riproduzione multipla)
SSR: Stop Scrolling Rate (capacità di “gancio”)
Engagement: Like, commenti, condivisioni e salvataggi

Oltre la semplice popolarità

Il vero algoritmo è enormemente più sofisticato di una singola equazione, ma il principio cardine rimane invariato:

TikTok non premia semplicemente i contenuti popolari. Premia i contenuti che dimostrano scientificamente di saper:

Catturare l’attenzione (SSR);
Trattenere l’interesse (Retention & CR);
Ottimizzare l’esperienza umana portando al loop (RR).

In sintesi, l’algoritmo è un sofisticato sistema di machine learning che trasforma il comportamento fluido dell’utente in dati precisi per prevedere il successo di un video su scala globale.

Forse potrebbe interessarti anche: Teorema di Bayes: 6 Esercizi Pratici per Capire l'Analisi delle Recensioni

Il “test iniziale” dei video

Questo è uno dei meccanismi più geniali:

Un video nuovo viene mostrato a un piccolo campione (spesso 200-500 utenti mirati, basati su watch history simili o engagement recente).
L’algoritmo misura le reazioni in tempo reale.
Se performa bene, viene spinto a un pubblico più ampio.
Altrimenti, la distribuzione si ferma o rallenta.

È un processo iterativo di feedback loop continuo.

Exploitation vs Exploration (e il multi-armed bandit)

TikTok deve risolvere continuamente un classico problema di ottimizzazione: exploitation (mostrare contenuti che già sappiamo funzionare per quell’utente) vs exploration (testare cose nuove per scoprire preferenze latenti).

Questo è formalizzato matematicamente come multi-armed bandit problem.

Ogni “braccio” (video o tipo di contenuto) ha una distribuzione di reward incerta:

Reward = f(watch time, completion rate, retention, engagement)

Algoritmi come Upper Confidence Bound (UCB) o Thompson Sampling bilanciano le due forze: non vuoi mostrare solo cose sicure (rischi di annoiare l’utente) né solo sperimentare (rischi di perdere attenzione).

Embedding e “spazio vettoriale dei contenuti”

TikTok non “capisce” i video come un umano. Li trasforma in embedding: vettori ad alta dimensionalità (centinaia o migliaia di numeri) che catturano caratteristiche semantiche, visive, audio e, soprattutto, comportamentali.

Due video possono essere lontanissimi per contenuto (uno di cucina, uno di gaming) ma vicinissimi nello spazio vettoriale perché generano pattern di attenzione simili negli utenti (stesso orario, stessa durata di watch, stesso tipo di retention).

Il sistema raccomanda basandosi su similarità tra questi vettori utente-contenuto, aggiornati in tempo reale.

Perché TikTok crea dipendenza

Dal lato umano: reward intermittente (come le slot machine). Non sai mai quando arriverà il video perfetto → dopamina continua.

Dal lato algoritmico: è reinforcement learning applicato al comportamento umano.

Ogni scroll rafforza o indebolisce certe correlazioni nel modello.

L’utente non è passivo: sta allenando l’algoritmo mentre l’algoritmo sta allenando lui.

L’effetto “rabbit hole”

L’algoritmo eccelle nel narrowing: una volta identificato un cluster di interessi, lo approfondisce. Questo crea echo chamber probabilistiche e percorsi di radicalizzazione algoritmica (non solo politica: anche fitness, meme, teorie del complotto, estetica, ecc.).

Non è (necessariamente) cattiva fede: è l’ottimizzazione estrema della probabilità di attenzione. Più tempo passi in un rabbit hole, più il modello si rafforza su quel percorso.

Conclusione

TikTok non legge la mente. Costruisce continuamente un modello probabilistico della nostra attenzione, sempre più preciso.

Ogni scroll:

Aggiorna il sistema
Modifica il profilo comportamentale
Rafforza correlazioni statistiche

Il feed non è casuale. È una simulazione statistica in tempo reale di ciò che probabilmente guarderemo dopo, ottimizzata per massimizzare il tempo che passiamo dentro.

E funziona incredibilmente bene.

La matematica nascosta dietro il feed più potente del mondo non è solo tecnica: è una delle più sofisticate applicazioni di probabilità, ottimizzazione e apprendimento automatico mai viste nella vita quotidiana.

LLM, Statistica & AI

👉Perché gli LLM Allucinano: Plausibilità, Verità e la Nuova Era della Precisione Assistita

👉🚀 Dentro i LLM: come funzionano davvero i modelli linguistici

👉📘 Modulo 1 – Cos’è un LLM e perché non è magia

👉LLM: guida ai colloqui e quiz di autovalutazione

👉Probabilità e statistica: concetti fondamentali con esempi pratici

👉Massima Verosimiglianza (MLE): il ponte tra statistica e AI

👉Come Distinguere Stati Ricorrenti e Transitori: 6 Esercizi Pratici sulle Catene di Markov

👉PyMC e inferenza bayesiana: modellazione probabilistica con Python

👉Simulare un Mercato Finanziario in Python: Agent-Based Model vs S&P 500

Post Views: 40