原文:https://azuremlsimpleds.azurewebsites.net/simpleds/预测值实例场景:估计产品需求预测销售数据决定设备服务优先级算法选择:序数回归:类别是有序的泊松回归:预测事件次数快速森林分位数回归:预测一种分布线性回归:快速训练,针对线性模型贝叶斯线性回归:针对线性模型,小数据集神经网络回归:预测较精确,但训练时间长决策森林回归:较精确,训练快速,手工选择特征提升决策树回归:精确,训练快速,占用较大内存找出异常情况
实例场景:预测信用风险欺诈检测捕获异常设备读取算法选择:一元SVM:100个特征以内基于PCA的异常检测:训练快速聚类(结构挖掘)实例场景:客户分类预测客户口味决定哪种产品会以同样的原因失败算法选择:K-Means
两种类别中预测某类别实例场景:某观点是否乐观客户是否会续约哪种优惠券吸引更多客户算法选择:二元SVM:少于100个特征,线性模型二元平均感知器:快速训练,线性模型二元贝叶斯点机:快速训练,线性模型二元决策森林:精确,训练快速二元逻辑回归:训练快速,线性模型二元提升决策树:精确,训练快速,但占用较多内存
二元决策丛林:精确,使用内存较少(相比决策森林)
相对于决策树而言,解决了在训练数据非常大的情况下,节点指数增长的问题。
更多二元决策丛林的资料二元本地深度SVM:少于100个特征二元神经网络:精确,但训练时间长
多个类别中预测某类别实例场景:这条微博的心情是什么这个客户会选择哪种服务哪几种优惠会吸引更多客户算法选择:多元逻辑回归:快速训练,线性模型多元神经网络:精确,训练时间长多元决策森林:精确,训练时间短多元决策丛林:精确,占用内存少(相比决策森林)多元分类(One vs All):取决于二元分类器