组件名称

  长句拆分 [版本号:1] [更新时间:2018-05-08]

简介

  该组件属于文本分析下的文本处理组件,主要是对长文本根据用户自定义的符号(比如标点符号)来将句子拆分成各个短句。

输入和输出

  输入端口个数:1

  输出端口个数:1

参数配置

参数名称 参数说明 参数默认值 是否必填
全量数据表名 全量数据表名,表名可以是中文 可选 -
全量数据保存 节点输出的全量数据是否保存至数据库;若保存,会增加时间及存储资源开销 可选 No -
句子的间隔字符集合 默认有两种分割字符句号和逗号,输入格式为["。",","] 可改 -

字段配置

字段名称 字段说明 字段默认值 是否必配
选择标识文本内容的列名 -
选择标识文本id的列名 -

输出节点的字段配置说明

  运行后不生成新字段。后续节点可以直接选择字段。

results matching ""

    No results matching ""