# Apache Sqoop Reviews
**Vendor:** The Apache Software Foundation  
**Category:** [Plateformes d&#39;intégration de Big Data](https://www.g2.com/fr/categories/big-data-integration-platforms)  
**Average Rating:** 4.3/5.0  
**Total Reviews:** 31
## About Apache Sqoop
Apache Sqoop est un outil conçu pour transférer efficacement des données en masse entre Apache Hadoop et des magasins de données structurés tels que des bases de données relationnelles.




## Apache Sqoop Reviews
  ### 1. Données sqoop d'informatica et oracle dans les applications Big Data

**Rating:** 4.5/5.0 stars

**Reviewed by:** Shubhashish V. | Data Engineer, Entreprise (> 1000 employés)

**Reviewed Date:** November 24, 2023

**Qu'aimez-vous le plus à propos de Apache Sqoop?**

Apache est très utile pour extraire de grands ensembles de données en un temps minimal. Il peut être intégré et mis en œuvre avec de nombreuses applications similaires où les grandes données sont impliquées avec une utilisation fréquente.

**Que n’aimez-vous pas à propos de Apache Sqoop?**

Parfois, la requête prend plus de temps à s'exécuter lorsqu'il y a de nombreux jointures ou jointures externes gauches ou d'autres jointures impliquées avec un filtre supplémentaire dans la condition where. L'échec lors de l'importation partielle s'est produit dans une longue requête.

**Quels sont les problèmes que Apache Sqoop résout, et en quoi cela vous est-il bénéfique?**

Il aide à créer un grand ensemble de données à partir de deux ou plusieurs tables avec un filtre de manière simple afin que nous puissions utiliser ces données optimisées pour soutenir ou développer nos applications pour les utilisateurs professionnels.

  ### 2. Un utilitaire polyvalent pour le déplacement de données et les fonctions SQL de base.

**Rating:** 5.0/5.0 stars

**Reviewed by:** Zubin D. | Associate Software Engineering Manager, Entreprise (> 1000 employés)

**Reviewed Date:** November 09, 2023

**Qu'aimez-vous le plus à propos de Apache Sqoop?**

La simplicité avec laquelle l'outil peut être utilisé dès le départ avec une configuration minimale dans un environnement distribué et la courte courbe d'apprentissage.

**Que n’aimez-vous pas à propos de Apache Sqoop?**

La journalisation semblait être quelque chose avec lequel j'ai personnellement eu du mal à identifier les anomalies de données lorsqu'il s'agissait du mouvement des données dans mes cas d'utilisation.

**Quels sont les problèmes que Apache Sqoop résout, et en quoi cela vous est-il bénéfique?**

Mouvement de données entre un environnement distribué et une base de données relationnelle

  ### 3. Application en ligne de commande pour transférer des données entre une base de données et Hadoop

**Rating:** 3.5/5.0 stars

**Reviewed by:** Utilisateur vérifié à Comptabilité | Petite entreprise (50 employés ou moins)

**Reviewed Date:** August 08, 2023

**Qu'aimez-vous le plus à propos de Apache Sqoop?**

Le transfert de données se fait en parallèle, ce qui le rend rapide et économique.

**Que n’aimez-vous pas à propos de Apache Sqoop?**

L'échec lors de l'importation et de l'exportation partielle nécessite un traitement spécial.

**Quels sont les problèmes que Apache Sqoop résout, et en quoi cela vous est-il bénéfique?**

Cela implique de transférer les données à partir de diverses sources de données structurées comme Oracle, PostgreSQL, etc.

  ### 4. Données d'importation/exportation depuis/vers RDBMS avec Sqoop

**Rating:** 4.0/5.0 stars

**Reviewed by:** A P. | Freelance Data science/ big data trainer, Marché intermédiaire (51-1000 employés)

**Reviewed Date:** June 20, 2022

**Qu'aimez-vous le plus à propos de Apache Sqoop?**

Les importations incrémentielles sont les plus utiles dans sqoop.

**Que n’aimez-vous pas à propos de Apache Sqoop?**

parfois, lorsque la même base de données est utilisée pour d'autres applications commerciales et que mes requêtes impliquent plusieurs jointures, les performances sont affectées

**Recommandations à d’autres personnes envisageant Apache Sqoop:**

Je recommande Apache Sqoop en raison de sa facilité d'utilisation.

**Quels sont les problèmes que Apache Sqoop résout, et en quoi cela vous est-il bénéfique?**

Sqoop résout le problème de l'importation facile des mises à jour de données effectuées à la base de données source en utilisant des importations incrémentielles et en automatisant ces tâches à l'aide de travaux sqoop.

  ### 5. Outil CLI standard pour l'importation et l'exportation de données depuis Hadoop

**Rating:** 4.5/5.0 stars

**Reviewed by:** Kubendra Reddy M. | Data Engineer, Entreprise (> 1000 employés)

**Reviewed Date:** March 18, 2022

**Qu'aimez-vous le plus à propos de Apache Sqoop?**

La meilleure chose est qu'il exécute le transfert de données en parallèle. Il permet de transférer les données à partir d'une variété de bases de données structurées. Il dispose d'une vaste communauté de soutien.

**Que n’aimez-vous pas à propos de Apache Sqoop?**

Sous le capot, il utilise MapReduce, ce qui prend du temps même pour un petit transfert de données. La mise en œuvre de la capture de données modifiées et des chargements incrémentiels est assez complexe. Il ne peut pas être mis en pause et repris.

**Recommandations à d’autres personnes envisageant Apache Sqoop:**

Outil standard de transfert de données.

**Quels sont les problèmes que Apache Sqoop résout, et en quoi cela vous est-il bénéfique?**

Nous importions les données de RDBMS vers le cluster Hadoop et exportions les données de Hadoop vers RDBMS. Nous utilisions cela pour transférer les données en parallèle pour de meilleures performances.

  ### 6. Apache Sqoop pour collecter des données sociales

**Rating:** 4.5/5.0 stars

**Reviewed by:** GouriS S. | Data Scientist, Marché intermédiaire (51-1000 employés)

**Reviewed Date:** October 19, 2021

**Qu'aimez-vous le plus à propos de Apache Sqoop?**

La meilleure chose à propos d'Apache Sqoop est qu'il offre une configuration facile pour obtenir les données en temps réel à partir du système source.

**Que n’aimez-vous pas à propos de Apache Sqoop?**

La chose que je n'ai pas aimée à propos d'Apache Sqoop est qu'une fois que le pipeline est cassé, il est difficile de récupérer les messages perdus.

**Quels sont les problèmes que Apache Sqoop résout, et en quoi cela vous est-il bénéfique?**

J'ai utilisé Apache Sqoop pour obtenir les données en temps réel à partir des API sources de Twitter et ensuite traiter les données.

  ### 7. Très utile et facile à utiliser.

**Rating:** 5.0/5.0 stars

**Reviewed by:** Nikunj P. | Senior Software Engineer, Logiciels informatiques, Entreprise (> 1000 employés)

**Reviewed Date:** October 23, 2020

**Qu'aimez-vous le plus à propos de Apache Sqoop?**

L'utilisation est très simple. C'est très convivial. Nous n'avons pas besoin d'écrire beaucoup de lignes de code pour obtenir les données de la base de données ou pour les y écrire.

**Que n’aimez-vous pas à propos de Apache Sqoop?**

Il n'y a rien que je puisse voir pour le moment. Si nous obtenons un support pour les bases de données NoSQL, ce serait génial.

**Quels sont les problèmes que Apache Sqoop résout, et en quoi cela vous est-il bénéfique?**

Pour l'entrepôt de données et l'analyse, nous transférons des données de diverses bases de données et les rendons disponibles dans Hadoop pour le traitement et l'analyse.

  ### 8. La meilleure application pour transférer des données entre des bases de données relationnelles et Hadoop

**Rating:** 4.5/5.0 stars

**Reviewed by:** Saurav M. | Big Data Developer, Entreprise (> 1000 employés)

**Reviewed Date:** July 16, 2020

**Qu'aimez-vous le plus à propos de Apache Sqoop?**

La simplicité et l'efficacité de l'application me séduisent. De plus, le design centré sur l'utilisateur est génial. J'utilise Sqoop pour importer des données de magasins de données externes dans le système de fichiers distribué Hadoop ou des écosystèmes Hadoop connexes comme Hive et HBase. Le meilleur avantage est sa facilité d'utilisation et sa rapidité. Sqoop peut facilement s'intégrer à Hadoop et déverser des données structurées de bases de données relationnelles sur HDFS, complétant ainsi la puissance de Hadoop. C'est pourquoi la certification Big Data et Hadoop exige une bonne connaissance d'Apache Sqoop et Flume.

**Que n’aimez-vous pas à propos de Apache Sqoop?**

Je n'ai pas vraiment trouvé quelque chose que je n'aimais pas, mais si à l'avenir je le faisais, j'aimerais le partager. Il y a quelques problèmes avec l'utilisation de Sqoop qui m'ont dérangé au début mais qui sont faciles à gérer :

Connecteur Sqoop :

Problème : 
Utilisation d'un connecteur incorrect pour la base de données à connecter lors de l'exportation ou de l'importation avec Sqoop.

Pilote manquant ou utilisation du nom correct du pilote de la classe jdbc respective pour la commande Sqoop.

Nom du gestionnaire de connexion manquant dans certains cas de commande Sqoop.

Approche incorrecte pour donner le mot de passe ou le nom d'utilisateur de la base de données à connecter.

Le format des données stockées dans les tables HDFS/Hive peut créer des problèmes. Il y a quelques formats comme les fichiers ORC qui ne permettent pas le transfert direct de données avec Sqoop.

Noms non correspondants ou incorrects des colonnes des tables source et destination où HCatalog est utilisé dans la commande Sqoop peuvent montrer un travail Sqoop réussi sans que les données soient transférées.

**Recommandations à d’autres personnes envisageant Apache Sqoop:**

Apache Sqoop est conçu pour transférer efficacement d'énormes volumes de données entre Apache Hadoop et des magasins de données structurés tels que les bases de données relationnelles. Il aide à décharger certaines tâches, telles que le traitement ETL, d'un entrepôt de données d'entreprise vers Hadoop, pour une exécution efficace à un coût beaucoup plus bas. Sqoop facilite également l'extraction de données de Hadoop et leur exportation vers des magasins de données structurés externes.

**Quels sont les problèmes que Apache Sqoop résout, et en quoi cela vous est-il bénéfique?**

Je suis en train d'utiliser Sqoop pour importer des données depuis des magasins de données externes dans le système de fichiers distribué Hadoop ou des écosystèmes Hadoop connexes comme Hive et HBase. Le meilleur avantage est sa facilité d'utilisation et sa rapidité.

  ### 9. Faciliter les importations de la base de données relationnelle vers HDFS

**Rating:** 3.5/5.0 stars

**Reviewed by:** Utilisateur vérifié à Télécommunications | Entreprise (> 1000 employés)

**Reviewed Date:** March 31, 2021

**Qu'aimez-vous le plus à propos de Apache Sqoop?**

Réplication de la base de données relationnelle sur HDFS pour les travaux MapReduce

**Que n’aimez-vous pas à propos de Apache Sqoop?**

Les données devaient être réimportées à chaque fois que les données étaient modifiées.

**Quels sont les problèmes que Apache Sqoop résout, et en quoi cela vous est-il bénéfique?**

Nous avions un énorme volume de données dans une base de données relationnelle. Pour obtenir l'indicateur clé de performance agrégé, j'ai dû exécuter des requêtes SQL. En utilisant Sqoop, la même requête SQL de la base de données relationnelle a été exécutée sur Sqoop.

  ### 10. Sqoop comme un outil clé dans notre pipeline ETL

**Rating:** 5.0/5.0 stars

**Reviewed by:** Vijay A. | Engineer, Entreprise (> 1000 employés)

**Reviewed Date:** October 23, 2020

**Qu'aimez-vous le plus à propos de Apache Sqoop?**

Mieux adapté à notre pipeline où nous chargeons/déchargeons des données de postgreSQL. 
Adapté à notre format de données en AVRO. 
Dans des circonstances normales, l'exécution est rapide et rentable.

**Que n’aimez-vous pas à propos de Apache Sqoop?**

Lors du chargement de grandes quantités de données, cela devient un goulot d'étranglement de performance pour les autres applications travaillant avec le même magasin de données. Il n'y a pas de fonction de pause et de reprise. Nous devons recommencer le travail.

**Recommandations à d’autres personnes envisageant Apache Sqoop:**

Acquérir des compétences en Sqoop est assez facile et amusant.

**Quels sont les problèmes que Apache Sqoop résout, et en quoi cela vous est-il bénéfique?**

Dans notre pipeline ETL, nous devons charger des données de PostgreSQL vers HDFS et traiter les données et les charger. C'est très rapide dans l'exécution.


## Apache Sqoop Discussions
  - [À quoi sert Apache Sqoop ?](https://www.g2.com/fr/discussions/what-is-apache-sqoop-used-for)
  - [There is no pause &amp; resume feature , is this going to  be in upcoming versions ?](https://www.g2.com/fr/discussions/33409-there-is-no-pause-resume-feature-is-this-going-to-be-in-upcoming-versions) - 1 upvote
  - [Is there any plan to present Sqoop in a user friendly format?](https://www.g2.com/fr/discussions/32734-is-there-any-plan-to-present-sqoop-in-a-user-friendly-format) - 1 upvote

- [View Apache Sqoop pricing details and edition comparison](https://www.g2.com/fr/products/apache-sqoop/reviews/apache-sqoop-review-4451138?section=pricing&secure%5Bexpires_at%5D=2026-05-14+03%3A00%3A17+-0500&secure%5Bsession_id%5D=6e4ef81e-9176-4e31-86d4-946c644a35c8&secure%5Btoken%5D=de58e805b9f68da45ac28d5347ce337eb27bf9cdb1938f648408bfe15d7f968c&format=llm_user)


## Top Apache Sqoop Alternatives
  - [Azure Data Factory](https://www.g2.com/fr/products/azure-data-factory/reviews) - 4.6/5.0 (94 reviews)
  - [AWS Glue](https://www.g2.com/fr/products/aws-glue/reviews) - 4.3/5.0 (191 reviews)
  - [SnapLogic Intelligent Integration Platform (IIP)](https://www.g2.com/fr/products/snaplogic-intelligent-integration-platform-iip/reviews) - 4.4/5.0 (370 reviews)

