featuretools.demo.load_retail#

featuretools.demo.load_retail(id='demo_retail_data', nrows=None, return_single_table=False)[源码]#

返回零售实体集示例。原始数据集可以在这里找到。

我们还对数据进行了一些修改。我们更改了列名,将 customer_id 转换为唯一的虚假 customer_name,去除了重复项,添加了 totalcancelled 列,并将金额从英镑转换为美元。您可以在 gz 压缩 (7 MB)未压缩 (43 MB) 格式下载修改后的 CSV。

参数:
  • id (str) – 分配给 EntitySet 的 ID。

  • nrows (int) – 要加载的基础 CSV 的行数。如果为 None,则加载所有行。

  • return_single_table (bool) – 如果为 True,则返回一个 CSV 而不是 EntitySet。默认为 False。

示例

In [1]: import featuretools as ft

In [2]: es = ft.demo.load_retail()

In [3]: es
Out[3]: 
Entityset: demo_retail_data
  DataFrames:
    orders (shape = [22190, 3])
    products (shape = [3684, 3])
    customers (shape = [4372, 2])
    order_products (shape = [401704, 7])

加载数据子集

In [4]: es = ft.demo.load_retail(nrows=1000)

In [5]: es
Out[5]: 
Entityset: demo_retail_data
  DataFrames:
    orders (shape = [67, 5])
    products (shape = [606, 3])
    customers (shape = [50, 2])
    order_products (shape = [1000, 7])