浅谈机器学习之系列一

客户体验 2019年 01月 06日

机器学习的主要目的就是借助计算机自动化完成一般性工作。为实现这一目标,机器学习算法根据数学模型力求模仿人类学习。实际上,人类眼中诸如识别人脸和系鞋带等许多司空见惯的行为对于机器而言却是一项又一项极为复杂的任务。

机器学习背后的核心思想就是,过去频繁发生或重叠发生的事物未来也会同样发生或重叠发生。例如,如事件B总在事件A后发生,那么就可预测事件B在事件A发生后随即发生。

机器学习能超越人类思想吗?

当然,人类有许多优势是机器所不具备的,例如询问专家的看法、转移过往经历中所获得的知识、与环境互动收集更多信息等。但人类能力也是有天花板的:我们健忘、或是在做决定时夹带个人偏见等。为了模仿人类思维,机器学习必须借助人类专业知识,并在监管下实施,否则,机器学习模型获取的输入可能是完全随机的,从而造成模型什么也学不到。

大多数情况下,机器学习并非是为了超越人类,而是为了更好地且成规模地解决某个问题。也就是说,其实是为了让机器以更快的速度收集大量信息,从而解答问题,而速度有可能是人类的成千上万倍。这种体量反映的就是传统统计学(想想当初Excel软件里的线性回归)和现代机器学习之间的主要差异。正是数据的“长度”(观测的数量)和“宽度”(每个观测所用描述符的数量)改变了算法,而算法之所以存在也仅仅是因为人类如今已具备改变算法所必需的计算能力。

例如,某一机器学习算法可在几分之一秒以内根据外观将某一产品分类,而人类分类每件产品则需花费好几秒钟,而且还会因为潜在的分类标签数量太多而难以应对。深度学习专家兼特斯拉人工智能部门负责人Andrej Karpathy曾就此与机器学习展开过竞赛。整个过程前后耗时数月,起初针对每幅图像Karpathy需花费约一分钟来处理,出错率达到了5.1%,而他的机器学习解决方案对手GoogLeNet的出错率达到了6.67%,但机器学习却能就每幅图像及时给出答案。因此,机器学习解决方案更适合批量生产和后续的扩展。现在的机器学习解决方案出错率已降至3.46%,与人工相比,在速度和准确度上都有了长足的进步。

人工智能、机器学习和深度学习之间区别何在?

人工智能的目标就是自动化执行各种复杂的任务。要实现这一目标,可采用不同的方法,而机器学习就是其中之一。处理诸如文本文档、图像、音频等抽象输入时,机器学习可以根据一种名叫“深度学习”的算法来工作。

例如,一台配有抓图工具的智能真空吸尘器利用的就是运用了不带机器学习的人工智能。相比之下,一台基于过往打扫经历而学会了何时打扫以及何处需要频繁打扫的智能真空吸尘器则是运用了机器学习(但未运用深度学习)的人工智能。而一台配置了摄像头以便能探测小狗和宝宝的智能真空吸尘器则是运用了深度学习的人工智能。

想了解更多吗? 请继续关注浅谈机器学习系列!

还想再来一杯茶吗?