featuretools.demo.load_retail#
- featuretools.demo.load_retail(id='demo_retail_data', nrows=None, return_single_table=False)[源码]#
返回零售实体集示例。原始数据集可以在这里找到。
我们还对数据进行了一些修改。我们更改了列名,将
customer_id
转换为唯一的虚假customer_name
,去除了重复项,添加了total
和cancelled
列,并将金额从英镑转换为美元。您可以在 gz 压缩 (7 MB) 或 未压缩 (43 MB) 格式下载修改后的 CSV。- 参数:
id (str) – 分配给 EntitySet 的 ID。
nrows (int) – 要加载的基础 CSV 的行数。如果为 None,则加载所有行。
return_single_table (bool) – 如果为 True,则返回一个 CSV 而不是 EntitySet。默认为 False。
示例
In [1]: import featuretools as ft In [2]: es = ft.demo.load_retail() In [3]: es Out[3]: Entityset: demo_retail_data DataFrames: orders (shape = [22190, 3]) products (shape = [3684, 3]) customers (shape = [4372, 2]) order_products (shape = [401704, 7])
加载数据子集
In [4]: es = ft.demo.load_retail(nrows=1000) In [5]: es Out[5]: Entityset: demo_retail_data DataFrames: orders (shape = [67, 5]) products (shape = [606, 3]) customers (shape = [50, 2]) order_products (shape = [1000, 7])