featuretools.primitives.AbsoluteDiff#
- class featuretools.primitives.AbsoluteDiff(method='ffill', limit=None)[source]#
- 计算一组数字列表中与前一个元素的绝对差值。
在数字列表中。
- 说明
对输入中的所有元素计算与前一个元素的绝对差值。输出中的第一个元素始终为 nan,因为第一个元素没有前一个元素。输入中包含 nan 的元素将使用正向填充或反向填充方法进行填充,具体方法由 method 参数指定。
- 参数:
method (str) –
用于在重新索引的 Series 中填充 nan 值的方法。可能的值包括 ['pad', 'ffill', 'backfill', 'bfill']。默认为 'ffill'。
- pad / ffill:将最后一个有效观测值向前传播
以填充空白
- backfill / bfill:将下一个有效观测值向后传播
以填充空白
limit (int) – 可以填充的间隙中连续 NaN 值的最大数量。默认为 None。
示例
>>> absolute_diff = AbsoluteDiff() >>> absolute_diff([2, 5, 15, 3]).tolist() [nan, 3.0, 10.0, 12.0]
使用 'ffill' 参数对输入元素进行正向填充
>>> absolute_diff_ffill = AbsoluteDiff(method="ffill") >>> absolute_diff_ffill([None, 5, 10, 20, None, 10, None]).tolist() [nan, nan, 5.0, 10.0, 0.0, 10.0, 0.0]
使用 'bfill' 参数对输入元素进行反向填充
>>> absolute_diff_bfill = AbsoluteDiff(method="bfill") >>> absolute_diff_bfill([None, 5, 10, 20, None, 10, None]).tolist() [nan, 0.0, 5.0, 10.0, 10.0, 0.0, nan]
可以限制填充的 nan 值数量
>>> absolute_diff_limitfill = AbsoluteDiff(limit=2) >>> absolute_diff_limitfill([2, None, None, None, 3, 1]).tolist() [nan, 0.0, 0.0, nan, nan, 2.0]
方法
__init__
([method, limit])flatten_nested_input_types
(input_types)将嵌套的列模式输入展平为单个列表。
generate_name
(base_feature_names)generate_names
(base_feature_names)get_args_string
()get_arguments
()get_description
(input_column_descriptions[, ...])get_filepath
(filename)get_function
()属性
base_of
base_of_exclude
commutative
default_value
如果找不到数据,此特征返回的默认值。
description_template
input_types
woodwork.ColumnSchema 输入类型
max_stack_depth
name
原语的名称
number_output_features
与此特征关联的特征矩阵中的列数
return_type
ColumnSchema 返回类型
stack_on
stack_on_exclude
stack_on_self
uses_calc_time
uses_full_dataframe