featuretools.primitives.DiffDatetime#

class featuretools.primitives.DiffDatetime(periods=0)[source]#

计算列表中某个日期时间与列表中前一个日期时间之间的时间差。

参数:

periods (int) – 索引行偏移的周期数。默认为 0。周期对应于行。

描述

给定一个日期时间列表,计算列表中当前项与前一项之间的差值。列表的第一个元素的计算结果始终为 NaT

示例

>>> from datetime import datetime
>>> dt_values = [datetime(2019, 3, 1), datetime(2019, 6, 30), datetime(2019, 11, 17), datetime(2020, 1, 30), datetime(2020, 3, 11)]
>>> diff_dt = DiffDatetime()
>>> diff_dt(dt_values).tolist()
[NaT, Timedelta('121 days 00:00:00'), Timedelta('140 days 00:00:00'), Timedelta('74 days 00:00:00'), Timedelta('41 days 00:00:00')]

您可以指定偏移值的周期数

>>> diff_dt_periods = DiffDatetime(periods = 1)
>>> diff_dt_periods(dt_values).tolist()
[NaT, NaT, Timedelta('121 days 00:00:00'), Timedelta('140 days 00:00:00'), Timedelta('74 days 00:00:00')]
__init__(periods=0)[source]#

方法

__init__([periods])

flatten_nested_input_types(input_types)

将嵌套的列 schema 输入展平为一个列表。

generate_name(base_feature_names)

generate_names(base_feature_names)

get_args_string()

get_arguments()

get_description(input_column_descriptions[, ...])

get_filepath(filename)

get_function()

属性

base_of

base_of_exclude

commutative

default_value

如果未找到数据,此特征返回的默认值。

description_template

input_types

woodwork.ColumnSchema 输入类型

max_stack_depth

name

基本操作的名称

number_output_features

与此特征相关的特征矩阵中的列数

return_type

返回值的 ColumnSchema 类型

stack_on

stack_on_exclude

stack_on_self

uses_calc_time

uses_full_dataframe