现在的热点是大语言模型,为什么我们还要了解机器学习?因为从机器学习到深度学习,再到如今的大语言模型,环环相扣。天底下没有新鲜事,并不是突然出现了一个划时代的技术。从历史、从论文都能按图索骥地找到大语言模型的源头——机器学习。

1.机器学习的目标是什么?

机器学习的目标就是从数据中发现规律。

这个过程本质是一种统计建模的过程,是统计学方法的一种具体应用。

下图引用自李宏毅老师的课件:

  • ChatGPT找到了回答问题的函数f,输入"什么是机器学习?",函数f就能生成答案。
  • Midjourney找到了生成图片的函数f,输入"一只可爱的猫”,函数f就能生成小猫的图片。
  • AlphaGo找到了下棋的函数f,输入"对手的一步棋”,函数f就能生成下一步应该怎么走。

image-20230720150809229

2.机器学习和人类学习的相似之处

人类学习和机器学习有很多相似之处,本质上:

  • 人类学习:从经验中总结规律——俗称经受社会的毒打。
  • 机器学习:从数据中总结模型——俗称经受数据的洗礼。

image-20230720152149924

3.机器学习打破了早期AI范式

人工智能的发展大致经历了四代,第一代AI以符号主义为主流,第二代至今以联结主义为主流(机器学习、深度学习就属于这个流派)。

后来还有三个法国神人,绘制了人工智能发展历史上的两个流派的竞争过程:

image-20230720153137135

早期的人工智能到底是怎样的呢?大致如下:

  • STEP1.人类某个领域的专家总结该领域的业务规则。
  • STEP2.人类程序员将业务规则以代码的形式实现,形成专家系统。
  • STEP3.最终用户输入问题后,专家系统匹配规则,进行答复。

早期的人工智能的本质就是人类总结规则、设定规则。这种范式的最大问题就是人类总结的规则不足,甚至人类本身总结不出来过于复杂的规则,导致早期的人工智能无法推广应用。

image-20230720154059662

而出自于联结主义的机器学习推崇的就是不用人类总结规则,给我数据我来总结规律

有一种言论说:神经网络的产生、海量数据的出现、算力的提升造就了机器学习的风靡。

这种言论应该不是机器学习风靡的根因,真正的根因应该是机器学习改变了早期AI的范式

本文部分内容由ChatGPT生成