组件名称

  拆分 [版本号:1] [更新时间:2018-05-08]

简介

  将样本集按照比例拆分为两份。如比例设置0.8,则拆分成4:1的两个样本集。可以设置不同的种子数,使样本集按照种子数随机拆分。

输入和输出

  输入端口个数:1

  输出端口个数:2

参数配置

参数名称 参数说明 参数默认值 是否必填
右端口数据表名 右端口全量数据表名,可以是中文 可选 必填
左端口全量数据保存 节点输出的左端口全量数据是否保存至数据库;若保存,会增加时间及存储资源开销 可选 No 必填
右端口全量数据保存 节点输出的右端口全量数据是否保存至数据库;若保存,会增加时间及存储资源开销 可选 No 必填
种子数 数据每次拆分的随机种子数,保证数据拆分的随机性 123 必填
左端口数据表名 左端口全量数据表名,可以是中文 可选 必填
切分比例 拆分后左输出端口表占原始数据的比例(请填入浮点数,比如0.0,1.0,0.8),范围[0.0~1.0] 0.8 必填

字段配置

  

输出节点的字段配置说明

  运行后不生成新字段。后续节点可以直接选择字段。

results matching ""

    No results matching ""