组件名称

  分层加权采样 [版本号:1] [更新时间:2018-05-08]

简介

  分层加权采样:根据数据集某字段所有可能值分布,分别指定对应各值的抽样比例。可以有针对性对某字段对应的某值的样本进行加权抽样,从而侧重于学习数据的对应某字段的对应的某值的分布。

输入和输出

  输入端口个数:1

  输出端口个数:1

参数配置

参数名称 参数说明 参数默认值 是否必填
全量数据表名 全量数据表名,表名可以是中文 可选 -
种子数 数据每次抽样的随机种子数,保证数据抽样的随机性 -
全量数据保存 节点输出的全量数据是否保存至数据库;若保存,会增加时间及存储资源开销 可选 No -

字段配置

字段名称 字段说明 字段默认值 是否必配
填入目标采样列,各值的比例,比例在[0,1]之内 以字典的形式传入,如{“Iris-versicolor“:0.5,“Iris-setosa“:0.7},字典的键是目标列中的不同类别值,如果类别值是字符串格式,请加上引号,如果是数值,不要加引号,键对应的值是每个类别对应的比例 -
目标抽样列名 可选 -

输出节点的字段配置说明

  运行后不生成新字段。后续节点可以直接选择字段。

results matching ""

    No results matching ""