featuretools.selection.remove_highly_null_features#

featuretools.selection.remove_highly_null_features(feature_matrix, features=None, pct_null_threshold=0.95)[source]#

删除特征矩阵中空值百分比高于设定阈值的列。

参数:
  • feature_matrix (pd.DataFrame) – 列为特征名称、行为实例的 DataFrame。

  • features (list[featuretools.FeatureBase] or list[str], 可选) – 要选择的特征列表。

  • pct_null_threshold (float) – 如果输入特征中 NaN 值的百分比超过此数量,则该特征将被视为高度空值。默认为 0.95。

返回:

特征矩阵和生成的特征定义列表。与 dfs 输出匹配。如果未提供特征列表作为输入,则不会返回特征列表。

返回类型:

pd.DataFrame, 列表[FeatureBase]