现在的热点是大语言模型,为什么我们还要了解机器学习?因为从机器学习到深度学习,再到如今的大语言模型,环环相扣。天底下没有新鲜事,并不是突然出现了一个划时代的技术。从历史、从论文都能按图索骥地找到大语言模型的源头——机器学习。
1.机器学习的目标是什么?
机器学习的目标就是从数据中发现规律。
这个过程本质是一种统计建模的过程,是统计学方法的一种具体应用。
下图引用自李宏毅老师的课件:
- ChatGPT找到了回答问题的函数f,输入"什么是机器学习?",函数f就能生成答案。
- Midjourney找到了生成图片的函数f,输入"一只可爱的猫”,函数f就能生成小猫的图片。
- AlphaGo找到了下棋的函数f,输入"对手的一步棋”,函数f就能生成下一步应该怎么走。
2.机器学习和人类学习的相似之处
人类学习和机器学习有很多相似之处,本质上:
- 人类学习:从经验中总结规律——俗称经受社会的毒打。
- 机器学习:从数据中总结模型——俗称经受数据的洗礼。
3.机器学习打破了早期AI范式
人工智能的发展大致经历了四代,第一代AI以符号主义为主流,第二代至今以联结主义为主流(机器学习、深度学习就属于这个流派)。
后来还有三个法国神人,绘制了人工智能发展历史上的两个流派的竞争过程:
早期的人工智能到底是怎样的呢?大致如下:
- STEP1.人类某个领域的专家总结该领域的业务规则。
- STEP2.人类程序员将业务规则以代码的形式实现,形成专家系统。
- STEP3.最终用户输入问题后,专家系统匹配规则,进行答复。
早期的人工智能的本质就是人类总结规则、设定规则。这种范式的最大问题就是人类总结的规则不足,甚至人类本身总结不出来过于复杂的规则,导致早期的人工智能无法推广应用。
而出自于联结主义的机器学习推崇的就是不用人类总结规则,给我数据我来总结规律。
有一种言论说:神经网络的产生、海量数据的出现、算力的提升造就了机器学习的风靡。
这种言论应该不是机器学习风靡的根因,真正的根因应该是机器学习改变了早期AI的范式。
本文部分内容由ChatGPT生成