Il mondo è pieno di conferenze, luci brillanti, sedie relativamente comode e volti amichevoli. Aggiungi del cibo decente e avrai un'esperienza complessivamente fantastica.
Il mese scorso, ho avuto il piacere di partecipare a Rev 3 di Domino Data Lab nella Grande Mela, che non ha deluso. Oltre alla compagnia e ai gadget, ho appreso degli aggiornamenti sui loro prodotti e sul più ampio spazio del machine learning (ML), che condividerò qui.
La scienza dei dati non è più quella di una volta
Quando si considera la storia della scienza dei dati, due cose emergono sempre:
- Dati
- Calcolo
La storia di base è la seguente: l'ascesa dell'intelligenza artificiale (AI) come metodo tecnologico per ottenere informazioni dai dati e guidare le previsioni è stata alimentata da un significativo aumento dei dati prodotti e da metodi di calcolo più grandi e più economici.
Inizialmente, gli strumenti si concentravano sulla creazione di algoritmi per adattarsi a quei dati e produrre risultati sensati. Non si pensava molto alla riproducibilità e alla sistematizzazione. Il motto era "lancia qualcosa al muro e vedi se si attacca". Tuttavia, i tempi stanno cambiando...
MLOps al salvataggio
Finita l'epoca del caso. Ora, la nozione di operazionalizzazione del machine learning (MLOps) è in pieno vigore. MLOps promuove una cultura e una pratica che mira a unificare lo sviluppo del sistema di machine learning e l'operazione del sistema di machine learning. Attraverso il software di operazionalizzazione dell'AI e del machine learning (MLOps), le aziende possono essere sistematiche nei loro sforzi di AI monitorando e mantenendo i loro modelli. Con questa tecnologia, possono ottenere visibilità nei loro progetti di machine learning, mettere i loro modelli in produzione e capire come si comportano.
MLOps sta aiutando a affrontare le due sfide più grandi legate all'AI: dati e calcolo. Infatti, quando esaminiamo gli argomenti menzionati sopra per il prodotto MLOps più votato su G2, Databricks Lakehouse Platform, troviamo che i dati sono un aspetto spesso menzionato della tecnologia, come si vede di seguito.
Come sta aiutando MLOps a prendere il controllo dei propri dati e del calcolo?
Con MLOps, le aziende possono garantire una connessione stretta e chiara tra i loro dati e i modelli. Domino Data Lab aveva annunciato la loro partnership con la società di gestione dei dati Snowflake nel gennaio 2021, e hanno elaborato su come rafforzare quella connessione a Rev 3 (maggio 2022) con Domino 5.2. La loro relazione ha fatto un passo avanti nel giugno 2022 con l'investimento di Snowflake in Domino Data Lab per unire i modelli ML e i dati cloud in un'unica piattaforma. Con Domino 5.2, gli utenti possono accedere al monitoraggio autonomo delle prestazioni dei modelli nel Data Cloud di Snowflake.
Stig Pedersen, capo del CoE di scienza dei dati presso Topdanmark, nota:
“L'integrazione del Domino con Snowflake Data Cloud aiuta il nostro team a concentrarsi sulla scienza dei dati, non sui complicati requisiti normativi dei dati, con efficienze migliorate, come la rapida scoperta della deriva del modello per minimizzare l'impatto potenziale sul business di previsioni subottimali.”
Inoltre, hanno annunciato la loro nuova capacità IntelliSize. Questa funzione aiuta le aziende a gestire i loro costi e il carico operativo raccomandando la dimensione ottimale per un ambiente. Con questa funzione di ottimizzazione dei costi, i team IT e i leader aziendali possono garantire che venga utilizzata solo la giusta quantità di calcolo e archiviazione per il compito da svolgere.
Queste integrazioni e funzionalità aiutano a unire dati e scienza dei dati, permettendo alla tecnologia di concentrarsi sui dati in modo che gli scienziati dei dati possano concentrarsi sulla scienza dei dati.
| Leggi ora: Tendenze dei dati nel 2022 → |
Cos'è davvero la scienza dei dati?
Oltre agli aggiornamenti delle funzionalità annunciati, Rev 3 ha offerto alcune grandi intuizioni di alto livello da parte di leader del settore, come Cassie Kozyrkov (chief decision scientist di Google), che ha parlato di rendere utile la scienza dei dati. Il suo discorso era pieno di grandi illustrazioni, metafore e battute, ma una che spiccava era la sua analogia con la cucina.
La cucina non è un lavoro a oggetto unico. Ha più ingredienti, utensili e passaggi, proprio come la scienza dei dati. Se dovessimo confrontare, sarebbe:
- Dati=ingredienti
- Algoritmi=elettrodomestici
- Modelli=ricette
- Previsioni=piatti
Non possiamo dimenticare o trascurare nessuno di questi componenti chiave. Promuovendo la collaborazione e l'innovazione, le aziende possono sbloccare il potere dei loro dati e talenti.
| Leggi di più: Come scegliere una piattaforma di scienza dei dati e machine learning adatta alla tua azienda → |
Smetti di chiamarle competenze trasversali
Un altro importante spunto dal discorso di Kozyrkov è stata la sua discussione su cosa succede quando gli strumenti diventano più facili. Man mano che i prodotti MLOps come Domino diventano più facili da usare e i compiti di scienza dei dati, come la preparazione dei dati, diventano automatizzati, dove lascia questo gli esseri umani coinvolti? Un argomento caldo è il ruolo e il posto delle competenze trasversali o quelle competenze non tecniche che sono così utili e così umane.
Kozyrkov ha osservato:
“Non chiamatele competenze trasversali—chiamatele le più difficili da automatizzare.”
Questo è un ottimo punto per concludere. Mentre pensiamo all'evoluzione di queste piattaforme, a come i dati e i modelli si stanno avvicinando e a come il calcolo sta diventando sempre più facile da ottimizzare, dobbiamo costantemente pensare:
Qual è il posto di un essere umano nel processo?
Vuoi saperne di più su Piattaforme MLOps? Esplora i prodotti Piattaforme MLOps.

Matthew Miller
Matthew Miller is a former research and data enthusiast with a knack for understanding and conveying market trends effectively. With experience in journalism, education, and AI, he has honed his skills in various industries. Currently a Senior Research Analyst at G2, Matthew focuses on AI, automation, and analytics, providing insights and conducting research for vendors in these fields. He has a strong background in linguistics, having worked as a Hebrew and Yiddish Translator and an Expert Hebrew Linguist, and has co-founded VAICE, a non-profit voice tech consultancy firm.
