跳至主要內容

快速认识,什么是机器学习

DD编辑部原创技术科普技术科普大约 4 分钟

快速认识,什么是机器学习

随着ChatGPT的火热,越来越的人开始尝试学习AI相关的知识。其中,机器学习是无法逃开的一个概念,所以弄懂什么是机器学习很有必要。

今天就来一起学快速入门一下什么是机器学习!您可以通过以下的文字内容学习,也可以通过文末的视频学习,希望本文对您有所帮助。

该视频采用Chrome插件Youtube中文配音open in new window做了翻译+配音处理,如果您平时也有上油管看前沿视频的话,也可以装一个,可以有效的提高你的学习效率 ^_^。如果您不方便查看这些内容,也可以关注我的视频号「程序猿DD」和B站open in new window,我会分享日常看到的精华学习资料,感兴趣的小伙伴根据自己平时习惯选择订阅即可。

机器学习,计算机如何执行任务,而无需显式编程来执行该任务。

相反,将数据输入算法,通过经验逐渐改善结果,类似于有机生命的学习方式。

该术语由 IBM 的 Arthur Samuel 于 1959 年创造。他正在开发可以下跳棋的人工智能。半个世纪后,预测模型嵌入到我们每天使用的许多产品中,这些产品执行两项基本工作。

  • 一是对数据进行分类,比如路上是否有另一辆车,或者这个病人是否患有癌症?
  • 另一个是对未来的结果做出预测,比如股票会上涨,或者你接下来想看哪个 YouTube 视频?

该过程的第一步是获取和清理数据。很多很多的数据。数据越能代表问题,结果就越好。垃圾进垃圾出。数据需要具有某种信号才能对预测算法有价值。数据科学家执行一项称为特征工程的工作,将原始数据转换为更好地代表潜在问题的特征。

下一步是将数据分为训练集和测试集。

训练数据被输入算法来构建模型,然后测试数据用于验证模型的准确性或错误。

下一步是选择一种算法,它可能是简单的统计模型,如线性或逻辑回归,也可能是为数据中的特征分配不同权重的决策树。

或者您可能会喜欢卷积神经网络,它是一种算法,不仅可以为特征分配权重,而且还可以获取输入数据并自动创建附加特征。

这对于包含图像或自然语言等内容的数据集非常有用,在这些数据集中,手动特征工程几乎是不可能的。 这些算法中的每一种都通过将其预测与误差函数进行比较来学习变得更好。

如果是分类问题,例如该动物是猫还是狗,则误差函数可能是准确性。如果这是一个回归问题,比如明年一条面包的价格是多少,那么它可能是平均绝对误差。

Python 是数据科学家选择的语言,但 R 和 Julia 也是流行的选择,并且有许多支持框架可以使该过程变得平易近人。

机器学习过程的最终结果是一个模型,它只是一个文件,它采用与训练时相同形状的一些输入数据,然后输出一个预测,试图最小化其优化的错误。

然后可以将其嵌入到实际设备上或部署到云端以构建实际产品。

如果您想开拓眼界,了解和发现更多计算机领域的概念和知识,欢迎关注我在持续更新的开发者科普专栏open in new window,助你探索更多计算机领域的热门知识!

上次编辑于:
贡献者: 程序猿DD