IT博客汇
首页
精华
技术
设计
资讯
扯淡
权利声明
登录
注册
MLlib算法简介
zhoubl668
发表于
2016-02-19 19:47:44
love
0
之前Mahout或者自己写的MR来解决复杂的机器学习,导致效率低,spark特别适合迭代式的计算,这正是机器学习算法训练所需要的,MLlib是基于spark之上算法组件,基于spark平台来实现。主要的机器学习的算法目前在MLlib中都已经提供了,分类回归、聚类、关联规则、推荐、降维、优化、特征抽取筛选、用于特征预处理的数理统计方法、以及算法的评测。以上是目前spark1.3支持的算法包,相比较之