机器学习是一种人工智能(AI)的分支,它涉及开发一系列算法和技术,使计算机能够从数据中学习和提高性能,而无需明确编程。机器学习的目标是使计算机在面对新数据时能够做出准确的预测或决策。
分类 | 监督学习 | 无监督学习 |
---|---|---|
英文 | Supervised Learning | Unsupervised Learning |
数据标记 | 需要有标记的训练数据(输入-输出对) | 无需有标记的训练数据 |
目标 | 预测输出/目标变量(目标已知) | 发现数据内在结构/模式(目标未知) |
任务 | 分类、回归、序列预测等 | 聚类、降维、关联规则挖掘等 |
监督信息 | 通过与目标变量的比较进行学习 | 依赖于数据本身的特征和分布 |
示例 | 分类:垃圾邮件过滤、图像识别 | 聚类:用户分群、图像分割 |
应用领域 | 机器学习中的主要类型 | 数据挖掘、特征学习、无监督预训练等 |
例子 | 预测房价:给定房子特征,预测价格 | 聚类新闻:将新闻按相关主题分组 |
目标 | 最小化预测误差 | 最大化数据间的相似性/聚类紧凑性 |
优点 | 可以处理多类任务、有监督信息指导学习 | 发现隐藏模式、自动学习特征表示 |
缺点 | 需要标记数据,对数据依赖较强 | 无法直接获得精确目标,结果解释较困难 |
该表格由chatgpt生成