组件名称

  文本摘要 [版本号:1] [更新时间:2018-05-08]

简介

  该组件属于文本分析下的文本处理组件,主要是对文本进行关键的摘要提炼。将每个句子看成图中的一个节点,若两个句子之间有相似性,认为对应的两个节点之间有一个无向有权边,权值是相似度。通过pagerank算法计算得到的重要性最高的若干句子可以当作摘要。

输入和输出

  输入端口个数:1

  输出端口个数:1

参数配置

参数名称 参数说明 参数默认值 是否必填
句子的最小长度 6 -
文档生成摘要的句子数量 6 -
全量数据表名 全量摘要语句及权重的数据表名,表名可以是中文 可选 -
全量数据保存 节点输出的全量摘要语句及权重数据是否保存至数据库;若保存,会增加时间及存储资源开销 可选 No -

字段配置

字段名称 字段说明 字段默认值 是否必配
选择字段列 需要生成摘要的字段 -
原样输出列 推荐添加id列,方便评估 -

输出节点的字段配置说明

  运行后不生成新字段。后续节点可以直接选择字段。

results matching ""

    No results matching ""