Featuretools 外部生态系统#
基于 Featuretools 的新项目正在不断涌现,这突显了自动化特征工程的重要性。本页列出了利用 Featuretools 的库、用例/演示和教程。如果您想添加项目,请联系我们或在 GitHub 上提交 pull request。
注意
我们很自豪和高兴分享使用 Featuretools 的人的工作,但我们无法认可或为本页上的工具提供支持。
库#
MLBlocks#
MLBlocks 是一个简单的框架,通过将任何 Python 库中的工具与简单、通用且统一的接口无缝结合,构建端到端可调的机器学习管道。MLBlocks 包含一个使用 Featuretools 的 primitive。
Cardea#
Cardea 是一个基于 FHIR 数据模式构建的机器学习库。它使用了许多 automl 工具,包括 Featuretools。
演示与用例#
预测客户生命周期价值#
预测客户生命周期价值是机器学习的常见用例。本文通过 Featuretools 阐述了这一预测问题的重要性。
预测 NHL 季后赛比赛#
许多 Kaggle 用户都渴望使用 Featuretools 来提高他们的模型性能。在这篇博文中,一位 Kaggle 用户使用了国家冰球联盟比赛的比赛数据集,并创建了一个模型来预测比赛是否是季后赛。
预测哥斯达黎加家庭贫困#
社会项目很难确定正确的援助对象。这个 Kaggle kernel 使用哥斯达黎加家庭特征数据集来预测家庭贫困状况。
预测功能阈值功率 (FTP)#
本 notebook 和附带的报告评估了使用机器学习预测骑自行车运动员 FTP 的方法,数据来自先前的训练会话。Featuretools 用于生成一组独立变量,这些变量捕获了性能随时间的变化。
注意
更多由 Feature Labs 编写的演示,请参见 featuretools.com/demos
教程#
使用 Python 进行自动化特征工程#
本文提供了如何使用零售数据集与 DFS 的详细说明。
自动化特征工程实操指南#
一个深入的教程,通过 Featuretools 预测“BigMart”未来的产品销售。
DFS 自动化特征工程简介#
本文演示了 Featuretools 如何帮助自动化处理房屋贷款数据集上的手动特征工程过程。
自动化特征工程工作坊#
在 2017 年数据夏季会议上举办的 Featuretools 自动化特征工程工作坊。
日语教程#
使用 Featuretools 构建客户流失预测模型#
一个视频教程,演示了如何使用 Featuretools 以及 Spark、XGBoost 和 Google Cloud Platform 构建客户流失预测模型。
俄语自动化特征工程工作坊#
一个视频教程,演示了如何使用 Featuretools 预测申请人是否能够偿还贷款。