featuretools.primitives.SameAsPrevious#

class featuretools.primitives.SameAsPrevious(fill_method='pad', limit=None)[source]#

确定列表中一个值是否等于前一个值。

描述

比较列表中一个值与前一个值,如果相等则返回 True,否则返回 False。输出的第一个元素始终为 False,因为第一个元素没有可供比较的前一个元素。

输入中的任何 NaN 值将使用 forward-fill 或 backward-fill 方法填充,由 fill_method 参数指定。可以使用 limit 参数限制填充的连续 NaN 值的数量。填充后剩余的任何 NaN 值将导致涉及 NaN 值的任何比较返回 False。

参数:
  • fill_method (str) – 填充序列中空隙的方法。有效

  • backfill (选项包括) –

  • bfill (backfill /) –

  • pad

  • ffill.

  • ffill (pad /) – 使用最后一个有效观测值填充空隙。

  • bfill – 使用下一个有效观测值填充空隙。

  • pad. (默认值为) –

  • limit (int) – 可填充的连续 NaN 值空隙的最大数量。默认为 None。

示例

>>> same_as_previous = SameAsPrevious()
>>> same_as_previous([1, 2, 2, 4]).tolist()
[False, False, True, False]

可以指定 NaN 值的填充方法

>>> same_as_previous_fillna = SameAsPrevious(fill_method="bfill")
>>> same_as_previous_fillna([1, None, 2, 4]).tolist()
[False, False, True, False]

可以限制填充的 NaN 值的数量

>>> same_as_previous_limitfill = SameAsPrevious(limit=2)
>>> same_as_previous_limitfill([1, None, None, None, 2, 3]).tolist()
[False, True, True, False, False, False]
__init__(fill_method='pad', limit=None)[source]#

方法

__init__([fill_method, limit])

flatten_nested_input_types(input_types)

将嵌套的列 schema 输入展平为单个列表。

generate_name(base_feature_names)

generate_names(base_feature_names)

get_args_string()

get_arguments()

get_description(input_column_descriptions[, ...])

get_filepath(filename)

get_function()

属性

base_of

base_of_exclude

commutative

default_value

未找到数据时此特征返回的默认值。

description_template

input_types

woodwork.ColumnSchema 输入类型

max_stack_depth

name

图元的名称

number_output_features

与此特征关联的特征矩阵中的列数

return_type

返回值的 ColumnSchema 类型

stack_on

stack_on_exclude

stack_on_self

uses_calc_time

uses_full_dataframe