featuretools.primitives.AbsoluteDiff#

class featuretools.primitives.AbsoluteDiff(method='ffill', limit=None)[source]#
计算一组数字列表中与前一个元素的绝对差值。

在数字列表中。

说明

对输入中的所有元素计算与前一个元素的绝对差值。输出中的第一个元素始终为 nan,因为第一个元素没有前一个元素。输入中包含 nan 的元素将使用正向填充或反向填充方法进行填充,具体方法由 method 参数指定。

参数:
  • method (str) –

    用于在重新索引的 Series 中填充 nan 值的方法。可能的值包括 ['pad', 'ffill', 'backfill', 'bfill']。默认为 'ffill'。

    pad / ffill:将最后一个有效观测值向前传播

    以填充空白

    backfill / bfill:将下一个有效观测值向后传播

    以填充空白

  • limit (int) – 可以填充的间隙中连续 NaN 值的最大数量。默认为 None。

示例

>>> absolute_diff = AbsoluteDiff()
>>> absolute_diff([2, 5, 15, 3]).tolist()
[nan, 3.0, 10.0, 12.0]

使用 'ffill' 参数对输入元素进行正向填充

>>> absolute_diff_ffill = AbsoluteDiff(method="ffill")
>>> absolute_diff_ffill([None, 5, 10, 20, None, 10, None]).tolist()
[nan, nan, 5.0, 10.0, 0.0, 10.0, 0.0]

使用 'bfill' 参数对输入元素进行反向填充

>>> absolute_diff_bfill = AbsoluteDiff(method="bfill")
>>> absolute_diff_bfill([None, 5, 10, 20, None, 10, None]).tolist()
[nan, 0.0, 5.0, 10.0, 10.0, 0.0, nan]

可以限制填充的 nan 值数量

>>> absolute_diff_limitfill = AbsoluteDiff(limit=2)
>>> absolute_diff_limitfill([2, None, None, None, 3, 1]).tolist()
[nan, 0.0, 0.0, nan, nan, 2.0]
__init__(method='ffill', limit=None)[source]#

方法

__init__([method, limit])

flatten_nested_input_types(input_types)

将嵌套的列模式输入展平为单个列表。

generate_name(base_feature_names)

generate_names(base_feature_names)

get_args_string()

get_arguments()

get_description(input_column_descriptions[, ...])

get_filepath(filename)

get_function()

属性

base_of

base_of_exclude

commutative

default_value

如果找不到数据,此特征返回的默认值。

description_template

input_types

woodwork.ColumnSchema 输入类型

max_stack_depth

name

原语的名称

number_output_features

与此特征关联的特征矩阵中的列数

return_type

ColumnSchema 返回类型

stack_on

stack_on_exclude

stack_on_self

uses_calc_time

uses_full_dataframe