词汇表#

子 dataframe#

通过关系引用另一个 dataframe 的 dataframe。多对一关系中的“多”。

ColumnSchema#

Woodwork 列的所有类型信息,包括逻辑类型和任何语义标签。

截止时间#

计算特征时允许使用数据的最后时间点

EntitySet#

dataframe 及其相互关系的集合。由 EntitySet 类表示。

特征#

用于机器学习的数据转换。Featuretools 有一种自定义语言来定义特征,如此处所述。所有特征都由 FeatureBase 的子类表示。

特征工程#

将数据转换为更适合机器学习的表示形式的过程。

实例#

等同于关系数据库中的一行。每个 dataframe 有许多实例,每个实例对于 dataframe 上定义的每个列和特征都有一个值。

逻辑类型#

关于如何解释或解析列的附加信息,超出了数据在磁盘或内存中的存储方式。用于确定哪些原语可以应用于列以生成特征。

父 dataframe#

通过关系被另一个 dataframe 引用的 dataframe。多对一关系中的“一”。

关系#

父 dataframe 和子 dataframe 之间的映射。子 dataframe 必须包含一个引用父 dataframe 上索引列的列。由 Relationship 类表示。

语义标签#

列上的可选附加信息,说明数据的含义或潜在用途。用于确定哪些原语可以应用于列以生成特征。

目标 dataframe#

我们将为其生成特征的 dataframe