Table des matières:

Comment planifier un travail de ruche dans oozie?
Comment planifier un travail de ruche dans oozie?

Vidéo: Comment planifier un travail de ruche dans oozie?

Vidéo: Comment planifier un travail de ruche dans oozie?
Vidéo: Apache Hive Tutorial For Beginners | Big Data Training | Edureka | Big Data Rewind - 4 2024, Peut
Anonim

À planifier le travail de la ruche à l'aide de Oozie , vous devez rédiger un Ruche -action.

hql) dedans.

  1. Créez un répertoire dans HDFS en lançant la commande ci-dessous.
  2. hadoop fs -mkdir -p /utilisateur/ suintant /workflows/
  3. Mettez le flux de travail. xml, Ruche script (create_table. hql) et ruche -placer. xml dans le répertoire créé à l'étape 2. Vous pouvez utiliser la commande ci-dessous.

Juste alors, comment exécuter le script Hive dans oozie?

Exécuter des tâches Hive avec Oozie

  1. Spécifiez le site de la ruche. xml dans le paramètre job-xml.
  2. Spécifiez le nom du script (par exemple, script.q) qui contient la requête ruche dans le paramètre de script.
  3. Ajoutez éventuellement les propriétés utilisées par le travail du lanceur Oozie. Ajoutez le préfixe oozie. lanceur aux noms de propriété.

De plus, comment exécuter le workflow oozie ? Exécution du workflow Oozie à partir de la ligne de commande

  1. Connectez-vous à la console Web.
  2. Copiez les exemples oozie dans votre répertoire personnel dans la console Web: cp /usr/hdp/current/oozie-client/doc/oozie-examples. le goudron. gz.
  3. Extrayez les fichiers de tar tar -zxvf oozie-examples.tar.gz.
  4. Copiez le répertoire des exemples dans les exemples HDFS hadoop fs -copyFromLocal.

À cet égard, comment planifier une tâche Hadoop ?

Comment planifier des tâches dans hadoop - Quora. Le moyen le plus simple est d'encapsuler votre code dans un script shell et calendrier il comme un cron travail sur le nœud périphérique (le nœud où vous soumettez habituellement votre travaux ). Mais généralement, emballant le code dans un script et l'exécutant en tant que travail est difficile à déboguer. tester et entretenir.

Qu'est-ce que le workflow oozie ?

Oozie est un flux de travail système de planification pour gérer les tâches Apache Hadoop. Flux de travail Oozie les travaux sont des graphes acycliques dirigés (DAG) d'actions. Oozie Les emplois de coordinateur sont récurrents Flux de travail Oozie tâches déclenchées par le temps (fréquence) et la disponibilité des données. Oozie est un système évolutif, fiable et extensible.

Conseillé: