featuretools.EntitySet.normalize_dataframe#
- EntitySet.normalize_dataframe(base_dataframe_name, new_dataframe_name, index, additional_columns=None, copy_columns=None, make_time_index=None, make_secondary_time_index=None, new_dataframe_time_index=None, new_dataframe_secondary_time_index=None)[source]#
从现有列的唯一值创建新的数据框和关系。
- 参数:
base_dataframe_name (str) – 要拆分的数据框名称。
new_dataframe_name (str) – 新数据框的名称。
index (str) – 旧数据框中将成为新数据框索引的列。关系将通过此列创建。
additional_columns (list[str]) – 要从 base_dataframe 中移除并移动到新数据框的列名列表。
copy_columns (list[str]) – 要从旧数据框复制并移动到新数据框的列名列表。
make_time_index (bool 或 str, 可选) – 根据 base_dataframe 中的时间索引为新数据框创建时间索引,可选择指定 base_dataframe 中用于 time_index 的列。如果指定为 True 但未指定特定列名,则使用主要时间索引。如果 base_dataframe 具有时间索引,则默认为 True。
make_secondary_time_index (dict[str -> list[str]], 可选) – 从键创建次要时间索引。字典的值是要与次要时间索引关联的列。只允许有一个次要时间索引。如果为 None,则只关联时间索引。
new_dataframe_time_index (str, 可选) – 重命名新数据框的时间索引。
new_dataframe_secondary_time_index (str, 可选) – 重命名新数据框的次要时间索引。