数据超市名词含义

组件

组件是用户可以在大数据科研学习平台上调用执行的最小操作单元, 例如数据导入导出、数据处理、数据分析、算法训练或者预测等,按照处理流程和功能,组件可以分为源/目标、数据预处理、文本分析、统计分析、网络分析、机器学习、特征工程。 :bowtie: :smile: :laughing: :blush: :smiley: :relaxed:

模型

模型是特指一种数据挖据或者机器学习算法,是一类特殊的组件,它的输出只能为预测。

节点

一次节点是一个组件下面的算法的具体实施流程,唯一指定了一个组件和一个算法,是项目流程中具体的一个节点。一个核心的问题:用面向对象的思维来理解,一个组件是一个封装好的类,一个节点是组件类的实例化。组件类的参数变量就是组件表的那些重要的字段。前端程序通过这些配置构建一个节点。在components里面配置的是基类,但是有些在基类无法实现的,也就是配置中无法实现的,还需要特殊处理。配置毕竟无法包罗万象。所有还需要对一些特定的节点做特定的处理。

项目

用户一次连续多个节点操作节点保存为一个项目,一个项目包含了多个节点及节点的先后顺序组成。

节点和组件的关系

一个组件就是一个对象,字段和参数就是对象的变量。一个节点是一个组件对象的实例化,拥有了组件的初始化参数和结构。

results matching ""

    No results matching ""