• Apache Airflow (十二) :PythonOperator


    🏡 个人主页IT贫道_大数据OLAP体系技术栈,Apache Doris,Clickhouse 技术-CSDN博客

     🚩 私聊博主:加入大数据技术讨论群聊,获取更多大数据资料。

     🔔 博主个人B栈地址:豹哥教你大数据的个人空间-豹哥教你大数据个人主页-哔哩哔哩视频


    PythonOperator可以调用Python函数,由于Python基本可以调用任何类型的任务,如果实在找不到合适的Operator,将任务转为Python函数,使用PythonOperator即可。

    关于PythonOperator常用参数如下,更多参数可以查看官网:airflow.operators.python — Airflow Documentation

    1. python_callable(python callable):调用的python函数
    2. op_kwargs(dict):调用python函数对应的 **args 参数,dict格式,使用参照案例。
    3. op_args(list):调用python函数对应的 *args 参数,多个封装到一个tuple中,list格式,使用参照案例。

    PythonOperator调度案例

    1. import random
    2. from datetime import datetime, timedelta
    3. from airflow import DAG
    4. from airflow.operators.python import PythonOperator
    5. # python中 *  关键字参数允许你传入0个或任意个参数,这些可变参数在函数调用时自动组装为一个tuple。
    6. # python中 ** 关键字参数允许你传入0个或任意个含参数名的参数,这些关键字参数在函数内部自动组装为一个dict。
    7. def print__hello1(*a,**b):
    8.     print(a)
    9.     print(b)
    10.     print("hello airflow1")
    11. # 返回的值只会打印到日志中
    12.     return{"sss1":"xxx1"}
    13. def print__hello2(random_base):
    14.     print(random_base)
    15.     print("hello airflow2")
    16. # 返回的值只会打印到日志中
    17.     return{"sss2":"xxx2"}
    18. default_args = {
    19.     'owner':'maliu',
    20.     'start_date':datetime(2021, 10, 1),
    21.     'retries': 1,  # 失败重试次数
    22.     'retry_delay': timedelta(minutes=5) # 失败重试间隔
    23. }
    24. dag = DAG(
    25.     dag_id = 'execute_pythoncode',
    26.     default_args=default_args,
    27.     schedule_interval=timedelta(minutes=1)
    28. )
    29. first=PythonOperator(
    30.     task_id='first',
    31.     #填写  print__hello1 方法时,不要加上“()”
    32.     python_callable=print__hello1,
    33.     # op_args 对应 print_hello1 方法中的a参数
    34.     op_args=[1,2,3,"hello","world"],
    35.     # op_kwargs 对应 print__hello1 方法中的b参数
    36.     op_kwargs={"id":"1","name":"zs","age":18},
    37.     dag = dag
    38. )
    39. second=PythonOperator(
    40.     task_id='second',
    41.     #填写  print__hello2 方法时,不要加上“()”
    42.     python_callable=print__hello2,
    43.     # random_base 参数对应 print_hello2 方法中参数“random_base”
    44.     op_kwargs={"random_base":random.randint(0,9)},
    45.     dag=dag
    46. )
    47. first >> second

  • 相关阅读:
    ChatGPT降温背后:大模型发展迎来真正转折点?
    TCP四次挥手过程
    Windows提权
    L1-003 个位数统计
    动态链接库--导出类(二)
    算法竞赛入门【码蹄集进阶塔335题】(MT2271-2275)
    Vue组件通信方式
    Fabric升级智能合约
    港联证券:上市公司三季报反映经济回暖向好态势
    注册中心-选型
  • 原文地址:https://blog.csdn.net/qq_32020645/article/details/134504482