Pareto è il livello di verifica per l'apprendimento per rinforzo basato sull'esperienza reale.
Trasformiamo il giudizio esperto non deterministico in segnali di ricompensa duraturi.
Misurando il confine delle capacità di un modello e calibrando i compiti in modo che impari di più, rendiamo addestrabile l'esperienza umana specializzata.