词汇表#
- 子 dataframe#
通过关系引用另一个 dataframe 的 dataframe。多对一关系中的“多”。
- ColumnSchema#
Woodwork 列的所有类型信息,包括逻辑类型和任何语义标签。
- 截止时间#
计算特征时允许使用数据的最后时间点
- EntitySet#
dataframe 及其相互关系的集合。由
EntitySet
类表示。- 特征#
用于机器学习的数据转换。Featuretools 有一种自定义语言来定义特征,如此处所述。所有特征都由
FeatureBase
的子类表示。- 特征工程#
将数据转换为更适合机器学习的表示形式的过程。
- 实例#
等同于关系数据库中的一行。每个 dataframe 有许多实例,每个实例对于 dataframe 上定义的每个列和特征都有一个值。
- 逻辑类型#
关于如何解释或解析列的附加信息,超出了数据在磁盘或内存中的存储方式。用于确定哪些原语可以应用于列以生成特征。
- 父 dataframe#
通过关系被另一个 dataframe 引用的 dataframe。多对一关系中的“一”。
- 关系#
父 dataframe 和子 dataframe 之间的映射。子 dataframe 必须包含一个引用父 dataframe 上索引列的列。由
Relationship
类表示。- 语义标签#
列上的可选附加信息,说明数据的含义或潜在用途。用于确定哪些原语可以应用于列以生成特征。
- 目标 dataframe#
我们将为其生成特征的 dataframe