- Published on
机器学习基础概念
什么是机器学习?
从基本层面来说,机器学习是指训练一款称为“模型”的软件,以便根据数据做出有用的预测或生成内容(例如文本、图片、音频或视频)。
使用机器学习方法,我们会向机器学习模型提供大量天气数据,直到机器学习模型最终学会计算产生不同降雨量的天气模式之间的数学关系。 然后,我们会向该模型提供当前天气数据,它会预测降雨量。
模型是从数据派生出来的数学关系,机器学习系统会使用这些关系进行预测
机器学习系统类型
- 监督式学习
- 非监督式学习
- 强化学习
- 生成式 AI
监督式学习
使用特征及其对应的标签训练模型。监督式机器学习类似于通过研究一系列问题及其对应的答案来学习某个知识。掌握题目与答案之间的映射后,学生就可以回答同一主题的新问题(从未见过的问题)。
监督式学习的两种最常见用例是回归和分类。
- 回归 回归模型可预测数值。例如,用于预测降雨量(以英寸或毫米为单位)的天气模型是一种回归模型。
回归模型有两种常见类型:
- 线性回归,用于查找最能将标签值与特征相匹配的线。
- 逻辑回归,该方法会生成一个介于 0.0 到 1.0 之间的概率值,系统通常会将该值映射到类预测。
- 分类 分类模型可预测某个对象属于某个类别的可能性。分类模型分为两类:二元分类和多类分类。
非监督式学习
非监督式学习模型通过获得不含任何正确答案的数据来进行预测。非监督式学习模型的目标是找出数据中具有意义的模式。换句话说,模型没有关于如何对每项数据进行分类的提示,而是必须推断自己的规则。 一种常用的非监督式学习模型采用了一种称为聚类的技术。该模型会查找可划分自然分组的数据点。
强化学习
强化学习模型根据在环境中执行的操作获得奖励或惩罚,从而进行预测。强化学习系统会生成政策,定义用于获得最多奖励的最佳策略。
强化学习用于训练机器人执行任务(例如在房间内四处走动),以及训练 AlphaGo 等软件程序玩围棋。
生成式 AI
生成式 AI 是一类根据用户输入生成内容的模型。例如,生成式 AI 可以创作独特的图片、音乐作品和笑话;它可以总结文章、说明如何执行任务或编辑照片。
推理
对模型评估结果感到满意后,我们就可以使用该模型对无标签示例进行预测(称为推理)。
总结
Supervised learning uses labeled data to train models that predict outcomes for new, unseen data. The training process involves feeding the model labeled examples, allowing it to learn the relationship between features and labels. Models are evaluated by comparing their predictions on unseen data to the actual values, helping to refine their accuracy. Once trained and evaluated, models can be used for inference, making predictions on new, unlabeled data in real-world applications. The quality of the dataset, including its size and diversity, significantly impacts the model's performance and ability to generalize.
https://developers.google.com/machine-learning?hl=zh-cn
THE END