Featuretools 外部生态系统#

基于 Featuretools 的新项目正在不断涌现,这突显了自动化特征工程的重要性。本页列出了利用 Featuretools 的库、用例/演示和教程。如果您想添加项目,请联系我们或在 GitHub 上提交 pull request。

注意

我们很自豪和高兴分享使用 Featuretools 的人的工作,但我们无法认可或为本页上的工具提供支持。

#

MLBlocks#

  • MLBlocks 是一个简单的框架,通过将任何 Python 库中的工具与简单、通用且统一的接口无缝结合,构建端到端可调的机器学习管道。MLBlocks 包含一个使用 Featuretools 的 primitive。

Cardea#

  • Cardea 是一个基于 FHIR 数据模式构建的机器学习库。它使用了许多 automl 工具,包括 Featuretools。

演示与用例#

预测客户生命周期价值#

  • 预测客户生命周期价值是机器学习的常见用例。本文通过 Featuretools 阐述了这一预测问题的重要性。

预测 NHL 季后赛比赛#

  • 许多 Kaggle 用户都渴望使用 Featuretools 来提高他们的模型性能。在这篇博文中,一位 Kaggle 用户使用了国家冰球联盟比赛的比赛数据集,并创建了一个模型来预测比赛是否是季后赛。

预测哥斯达黎加家庭贫困#

  • 社会项目很难确定正确的援助对象。这个 Kaggle kernel 使用哥斯达黎加家庭特征数据集来预测家庭贫困状况。

预测功能阈值功率 (FTP)#

  • 本 notebook 和附带的报告评估了使用机器学习预测骑自行车运动员 FTP 的方法,数据来自先前的训练会话。Featuretools 用于生成一组独立变量,这些变量捕获了性能随时间的变化。

注意

更多由 Feature Labs 编写的演示,请参见 featuretools.com/demos

教程#

使用 Python 进行自动化特征工程#

  • 本文提供了如何使用零售数据集与 DFS 的详细说明。

自动化特征工程实操指南#

  • 一个深入的教程,通过 Featuretools 预测“BigMart”未来的产品销售。

DFS 自动化特征工程简介#

  • 本文演示了 Featuretools 如何帮助自动化处理房屋贷款数据集上的手动特征工程过程。

自动化特征工程工作坊#

  • 在 2017 年数据夏季会议上举办的 Featuretools 自动化特征工程工作坊。

日语教程#

  • 一个 Featuretools 教程,演示了如何与特征选择库 Boruta 和超参数调优库 Optuna 集成。

使用 Featuretools 构建客户流失预测模型#

俄语自动化特征工程工作坊#

  • 一个视频教程,演示了如何使用 Featuretools 预测申请人是否能够偿还贷款。