featuretools.primitives.RollingCount#

类 featuretools.primitives.RollingCount(window_length=3, gap=1, min_periods=0)[源代码]#

确定给定窗口内的滚动事件计数。

描述

给定一个日期时间列表，返回一个滚动计数，该计数从距离当前行 gap 行的位置开始，并向后查看指定的时间窗口（由 window_length 和 gap 确定）。

输入日期时间应该是单调的。

参数：

window_length (int, string, optional) – 指定每个窗口包含的数据量。如果提供整数，则对应于行数。对于采样频率均匀的数据，例如一天一次，window_length 为 7 将对应于 7 天的时间段。如果提供字符串，它必须是 pandas 的偏移别名字符串之一（'1D'、'1H' 等），表示每个窗口应跨越的时间长度。可用偏移别名列表可在 https://pandas.ac.cn/pandas-docs/stable/user_guide/timeseries.html#offset-aliases 找到。默认为 3。
gap (int, string, optional) – 指定每个实例向后计算可用数据窗口开始之前的间隔。如果提供整数，则对应于行数。如果提供字符串，它必须是 pandas 的偏移别名字符串之一（'1D'、'1H' 等），表示目标实例与其窗口开始之间的时间长度。默认为 1。
min_periods (int, optional) – 执行窗口计算所需的最小观测数量。当 window_length 为整数时，它不能大于 window_length。当 window_length 为偏移别名字符串时，不存在此限制，但应注意不要选择一个始终大于窗口中观测数量的 min_periods。默认为 1。

注意

定义 gap 和 h 时，只能使用具有固定频率的偏移别名。这意味着不能使用诸如 M 或 W 的别名，因为它们可以表示不同数量的天数。（'M' 因为不同月份的天数不同；'W' 因为星期会指示一周中的某一天，例如 W-Wed，因此会根据锚定日期指示不同数量的天数。）

注意

使用偏移别名定义 gap 时，也必须使用偏移别名定义 window_length。当使用偏移别名定义 window_length 时，不存在此限制。实际上，如果数据具有均匀的采样频率，则更推荐使用数值 gap，因为它更高效。

示例

>>> import pandas as pd
>>> rolling_count = RollingCount(window_length=3)
>>> times = pd.date_range(start='2019-01-01', freq='1min', periods=5)
>>> rolling_count(times).tolist()
[nan, 1.0, 2.0, 3.0, 3.0]

我们也可以控制滚动计算之前的间隔。

>>> import pandas as pd
>>> rolling_count = RollingCount(window_length=3, gap=0)
>>> times = pd.date_range(start='2019-01-01', freq='1min', periods=5)
>>> rolling_count(times).tolist()
[1.0, 2.0, 3.0, 3.0, 3.0]

我们也可以控制滚动计算所需的最小周期数。

>>> import pandas as pd
>>> rolling_count = RollingCount(window_length=3, min_periods=3, gap=0)
>>> times = pd.date_range(start='2019-01-01', freq='1min', periods=5)
>>> rolling_count(times).tolist()
[nan, nan, 3.0, 3.0, 3.0]

我们还可以使用偏移别名字符串设置 window_length 和 gap。 >>> import pandas as pd >>> rolling_count = RollingCount(window_length=’3min’, gap=’1min’) >>> times = pd.date_range(start=’2019-01-01’, freq=’1min’, periods=5) >>> rolling_count(times).tolist() [nan, 1.0, 2.0, 3.0, 3.0]

__init__(window_length=3, gap=1, min_periods=0)[源代码]#

方法

`__init__`([window_length, gap, min_periods])
`flatten_nested_input_types`(input_types)	将嵌套的列模式输入展平为单个列表。
`generate_name`(base_feature_names)
`generate_names`(base_feature_names)
`get_args_string`()
`get_arguments`()
`get_description`(input_column_descriptions[, ...])
`get_filepath`(filename)
`get_function`()

属性

`base_of`
`排除依据`
`commutative`
`default_value`	如果找不到数据，此特征返回的默认值。
`description_template`
`input_types`	输入的 woodwork.ColumnSchema 类型
`max_stack_depth`
`name`	原始特征的名称
`number_output_features`	与此特征相关的特征矩阵中的列数
`return_type`	返回的 ColumnSchema 类型
`stack_on`
`stack_on_exclude`
`stack_on_self`
`uses_calc_time`
`uses_full_dataframe`

目录

上一主题

下一主题

本页

featuretools.primitives.RollingCount#

目录

上一主题

下一主题

本页

快速搜索

featuretools.primitives.RollingCount#