DAG. W Airflow DAG – lub a Skierowany wykres acykliczny – to zbiór wszystkich zadań, które chcesz uruchomić, zorganizowanych w sposób odzwierciedlający ich relacje i zależności.
Jak tworzyć DAG-y w Airflow?
Aby utworzyć DAG w Airflow, zawsze musisz zaimportować klasę DAG Po klasie DAG następuje import operatorów. Zasadniczo, dla każdego operatora, którego chcesz użyć, musisz dokonać odpowiedniego importu. Na przykład, jeśli chcesz wykonać funkcję Pythona, musisz zaimportować PythonOperator.
Gdzie Airflow szuka DAG-ów?
Airflow wyszukuje w Twój DAGS_FOLDER moduły, które zawierają obiekty DAG w swojej globalnej przestrzeni nazw i dodaje znalezione obiekty w DagBag.
Jak Airflow przechowuje DAG-y?
Baza danych metadanych Apache Airflow:
Baza danych metadanych przechowuje konfiguracje, takie jak zmienne i połączenia Przechowuje również informacje o użytkownikach, role i zasady. Na koniec Scheduler analizuje wszystkie DAG i przechowuje odpowiednie metadane, takie jak interwały harmonogramu, statystyki z każdego uruchomienia i ich zadania.
Czy Airflow jest narzędziem ETL?
Airflow nie jest samo w sobie narzędziem ETL. Ale zarządza, strukturyzuje i organizuje potoki ETL przy użyciu czegoś, co nazywa się Directed Acyclic Graphs (DAGs). … Baza danych metadanych przechowuje przepływy pracy/zadania (DAG).