
Ce que j'aime le plus chez Azure Databricks, c'est la façon dont il rend le travail avec les données simple sans que je doive trop réfléchir à la configuration.
D'après mon expérience, je l'utilise principalement pour interroger, transformer et valider des données, et il gère très bien les grands ensembles de données sans me ralentir. Je n'ai pas à trop m'inquiéter des performances — j'écris simplement ce dont j'ai besoin, et ça fonctionne.
J'aime aussi la flexibilité de passer entre SQL et PySpark selon ce que je fais. Cela facilite l'exploration des données et le dépannage rapide des problèmes sans être coincé dans une seule approche.
L'environnement de notebook est un autre grand avantage pour moi. Je l'utilise pour organiser mes requêtes et ma logique en un seul endroit, afin que je puisse toujours revenir en arrière, ajuster les choses ou réutiliser des parties sans repartir de zéro.
Dans l'ensemble, cela rend simplement mon flux de travail plus propre et plus efficace, surtout lorsque je travaille avec de grands volumes de données et que j'ai besoin de résultats rapides et fiables. Avis collecté par et hébergé sur G2.com.
Ce que je n'aime pas à propos d'Azure Databricks, basé sur mon utilisation, est principalement lié à l'utilisabilité au quotidien.
Lorsque je travaille avec des fichiers (surtout autour de /dbfs), je rencontre parfois des erreurs apparemment aléatoires qui ne sont pas très claires. Il faut du temps supplémentaire pour comprendre ce qui s'est réellement passé, ce qui est frustrant lorsque j'essaie simplement d'obtenir des résultats rapides.
Le débogage est un autre domaine qui peut me ralentir. Si une requête ou une transformation ne se comporte pas comme prévu, il n'est pas toujours évident de savoir où se situe le problème, donc je finis par passer plus de temps à tracer et à réduire les possibilités que je ne le souhaiterais.
L'environnement de notebook est utile, mais à mesure qu'un seul notebook grandit, il peut devenir désordonné et plus difficile à gérer. Si je ne fais pas attention, il est facile de perdre la structure et l'organisation.
Le coût est également quelque chose que j'ai dû surveiller. Même lorsque je ne fais que tester ou exécuter des requêtes, l'utilisation peut s'accumuler rapidement si les ressources ne sont pas gérées correctement.
Dans l'ensemble, cela fonctionne bien, mais il y a encore des moments où cela semble moins intuitif que cela ne devrait l'être, surtout lorsque quelque chose ne va pas. Avis collecté par et hébergé sur G2.com.




