DAG使用指南¶

1. 说明¶

本文档主要说明FATE-v2.0以后，如何使用DAG去定义一个联邦学习建模任务

2. DAG定义¶

该章节主要介绍DAG文件的字段定义，在fate-v2.0，使用yaml文件格式去描述DAG

DAG例子

dag:
  parties:
  - party_id: ['9999']
    role: guest
  - party_id: ['10000']
    role: host
  party_tasks:
    guest_9999:
      parties:
      - party_id: ['9999']
        role: guest
      tasks:
        reader_0:
          parameters: {name: breast_hetero_guest, namespace: experiment}
    host_10000:
      parties:
      - party_id: ['10000']
        role: host
      tasks:
        reader_0:
          parameters: {name: breast_hetero_host, namespace: experiment}
  stage: train
  tasks:
    eval_0:
      component_ref: evaluation
      dependent_tasks: [sbt_0]
      inputs:
        data:
          input_datas:
            task_output_artifact:
            - output_artifact_key: train_output_data
              parties:
              - party_id: ['9999']
                role: guest
              producer_task: sbt_0
      parameters:
        label_column_name: null
        metrics: [auc]
        predict_column_name: null
      parties:
      - party_id: ['9999']
        role: guest
      stage: default
    psi_0:
      component_ref: psi
      dependent_tasks: [reader_0]
      inputs:
        data:
          input_data:
            task_output_artifact:
              output_artifact_key: output_data
              parties:
              - party_id: ['9999']
                role: guest
              - party_id: ['10000']
                role: host
              producer_task: reader_0
      parameters: {}
      stage: default
    reader_0:
      component_ref: reader
      parameters: {}
      stage: default
    sbt_0:
      component_ref: hetero_secureboost
      dependent_tasks: [psi_0]
      inputs:
        data:
          train_data:
            task_output_artifact:
              output_artifact_key: output_data
              parties:
              - party_id: ['9999']
                role: guest
              - party_id: ['10000']
                role: host
              producer_task: psi_0
        model: {}
      parameters:
        max_depth: 3
        num_trees: 2
        ...
schema_version: 2.1.1
kind: fate

2.1 一级字段¶

2.1.1 dag¶

表示的是整个dag的描述文件

2.1.2 schema_version¶

保留字段，为对应的版本号

2.1.3 kind¶

协议类型，fate-v2.0的dag为通用联邦学习任务工作流描述文件，支持多种协议，默认为fate-v2.0协议，即"fate"，如果需要使用fate-v2.0的dag来表示其他协议，修改该字段即可

2.2 dag下二级字段¶

二级字段由五个组件：分别是parties，conf, stage, tasks, party_tasks.

2.2.1 parties¶

parties代表参与方，是一个列表，其中列表的每个元素为一个party描述对象，单个party对象由role和party_id组成

- party_id: ['9999']
  role: guest

role role表示联邦建模中的角色，常用的是"guest", "host", "arbiter"
party_id 是一个列表，代表该角色下有哪些party_id组成

2.2.3 conf¶

job级别的任务参数，具体可以参考文档

2.2.4 stage¶

表示job运行的阶段，可能值为"default","train","predict","cross_validation"之一。
- default: 适用于一些无需区分运行阶段的组件，如psi,union,evaluation等 - train: 适用于特征工程、训练算法等，表示该组件是运行的训练过程 - predict: 使用于特征工程、训练算法等，表示该组件是运行的预测流程 - cross_validation: 用于训练算法，表示需要做交叉验证

注意的是，stage为job级别的状态，当具体任务运行阶段不指定时，会继承job级别的状态，否则，以任务内部指定的为准

2.2.5 tasks¶

通用任务配置，是一个字典格式，key为任务名称，value为该任务的通用描述，下级字段为component_ref、dependent_task、parameters、inputs、outputs、parties、conf、stage组成。

2.2.5.1 component_ref¶

该任务需要调用的组件引用名称，为一个字符串，组件说明可以参考组件描述文档

2.2.5.2 dependent_tasks¶

该任务的上游依赖任务，为一个列表

dependent_tasks: [psi_0]

2.2.5.3 parameters¶

该任务的通用参数配置

parameters:
  max_depth: 3
  num_trees: 2
  ...

2.2.5.4 inputs¶

该任务的输入，包括上游任务输出作为输入、模型仓库直接输入、数据仓库直接输入(备用字段)。 inputs: 类型为字典，字典的key为data或者model，value为端口连线关系。端口连线关系：类型为字典，字典的key为该任务对应的组件的输入key，如train_data、validate_data、input_data等，value是一个输入描述对象。输入描述对象上游任务输出作为输入、模型仓库直接输入、数据仓库直接输入

[check] 上游任务输出作为输入使用task_output_artifact代表上游任务输出作为输入
producer_tasks: 上游任务的名称
output_artifact_key: 上游任务的具体哪个输出口作为输入
parties: 选填，表示该参与方使用该输入，默认不指定，如果不指定，任务的每一方输入一致，否则，以指定的为准，用户可以通过parties来控制多方不对称输入

eval_0:
      component_ref: evaluation
      dependent_tasks: [sbt_0]
      inputs:
        data:
          input_datas:
            task_output_artifact:
            - output_artifact_key: train_output_data
              parties:
              - party_id: ['9999']
                role: guest
              producer_task: sbt_0

[check] 模型仓库直接输入使用model_warehouse代表从模型仓库直接输入，当前主要用于预测阶段的模型输入
model_id: 模型id
model_version: 模型版本
producer_task: (model_id, model_version) 对应的训练任务的名称
output_artifact_key: (model_id, model_version) 对应的训练任务的模型输出名
parties: 选填，表示该参与方使用该输入，默认不指定，如果不指定，任务的每一方输入一致，否则，以指定的为准，用户可以通过parties来控制多方不对称输入

2.2.5.5 outputs¶

选填，表示组件的输出，fate-v2.0协议调度时不需要填写，当前仅用于互联互通协议的配置

当前输出的类型为字典，字典的key包括data、model、metric输出，value格式包含三个字段output_artifact_key_alias，output_artifact_key_alias,parties。

parties 该任务参与方，格式和job级别的parties配置一致，如果用户填写，则该任务运行时的参与方为用户填写值，否则，继承job级别的
conf 任务级别的配置，为一个字典
stage 任务运行的阶段，如果填写则以填写为准，不填则继承job级别的

2.2.6 party_tasks¶

party_tasks表示各方的个性化配置，为一个字典，字典的key为别称，表示哪些站点会使用该个性化设置，value为parties、tasks、conf。

guest_9999:
  parties:
  - party_id: ['9999']
    role: guest
  tasks:
    reader_0:
      parameters: {name: breast_hetero_guest, namespace: experiment}

- parties: 表示有哪些参与方

conf: 字典类型，表示对应的parties运行时tasks对应任务时的个性化任务配置
tasks: 字典类型，key为有哪些任务，value为具体任务对应的配置，配置由conf和parameters构成，其中conf是一个字典，表示的是parties对应的参与方运行这个具体任务的配置，parameters是这些参与方运行这个具体任务时的算法参数

3. 预测任务DAG¶

该章节是给用户介绍纯预测任务的dag, 与训练任务相比，预测DAG需要修改的地方较少，下面介绍如何在训练DAG基础上进行修改

预测DAG示例

dag:
  conf:
    model_warehouse: {model_id: ${训练任务model_id}, model_version: ${训练任务model_version}}
  parties:
  - party_id: ['9999']
    role: guest
  - party_id: ['10000']
    role: host
  party_tasks:
    guest_9999:
      parties:
      - party_id: ['9999']
        role: guest
      tasks:
        reader_1:
          parameters: {name: breast_hetero_guest, namespace: experiment}
    host_10000:
      parties:
      - party_id: ['10000']
        role: host
      tasks:
        reader_1:
          parameters: {name: breast_hetero_host, namespace: experiment}
  stage: predict
  tasks:
    psi_0:
      component_ref: psi
      dependent_tasks: [reader_1]
      inputs:
        data:
          input_data:
            task_output_artifact:
              output_artifact_key: output_data
              parties:
              - party_id: ['9999']
                role: guest
              - party_id: ['10000']
                role: host
              producer_task: reader_1
      parameters: {}
      stage: default
    reader_1:
      component_ref: reader
      parameters: {}
      stage: default
    sbt_0:
      component_ref: hetero_secureboost
      dependent_tasks: [psi_0]
      inputs:
        data:
          test_data:
            task_output_artifact:
            - output_artifact_key: output_data
              parties:
              - party_id: ['9999']
                role: guest
              - party_id: ['10000']
                role: host
              producer_task: psi_0
        model:
          input_model:
            model_warehouse:
              output_artifact_key: output_model
              parties:
              - party_id: ['9999']
                role: guest
              - party_id: ['10000']
                role: host
              producer_task: sbt_0
      parameters:
        max_depth: 3
        num_trees: 2
        ...
schema_version: 2.1.1

- Step1: 将dag下的全局job阶段的stage改成predict - Step2: 将用不到的组件从dag下的tasks，以及party_tasks进行删除，同时需要注意的是，删除组件可能会导致部分下游组件的dependent，以及输入发生改变，也需要对应修改。如示例中的eval_0组件，以及reader_0组件 - Step3: 在dag下的tasks，以及party_tasks，新增需要的组件，以及修改下游依赖它的组件的dependent以及inputs等可能字段。

tasks:
  psi_0:
    component_ref: psi
    dependent_tasks: [reader_1]
  reader_1:
    component_ref: reader
    parameters: {}
    stage: default

- Step4: 对于预测任务，如果需要使用训练阶段生成的模型，则需要在dag下的全局job的conf里面配置model_warehouse字段，填写训练任务的model_id和model_version，并执行Step5

conf:
  model_warehouse: {model_id: ${训练任务model_id}, model_version: ${训练任务model_version}}

- Step5: 在需要使用训练时候生成模型的任务中，增加model输入，同时，producer_task为该任务名, output_artifact_key为该任务对应组件的模型输出字段，parties字段则根据需要填（因为部分三方组件，可能预测阶段只有guest\host有模型输入)

inputs:
  model:
    input_model:
      model_warehouse:
        output_artifact_key: output_model
        parties:
        - party_id: ['9999']
          role: guest
        - party_id: ['10000']
          role: host
        producer_task: sbt_0

修改完成后，该配置可以直接适用于预测