AI进阶术语全面解析
深入掌握进阶术语是真正理解AI技术的关键,它们不像基础概念那样直观,但每一项都在各自领域发挥着核心作用。下面从两个方向展开——机器学习和深度学习,将这些看似高深、但往往理解不深的概念讲清楚。
1. 机器学习(ML)进阶核心概念
首先来看贝叶斯推理。它本质上是利用贝叶斯定理计算后验概率,在处理不确定性时应用广泛——例如垃圾邮件过滤中,正是依靠它来判断一封邮件属于垃圾邮件的概率。而马尔可夫决策过程(MDP)则是强化学习的基础框架,几乎所有的强化学习问题都可以建模为MDP:状态、动作、奖励、转移概率,缺一不可。
变分推断是应对复杂后验分布计算难题的有效方法——当精确后验难以计算时,用一个简单的近似分布来替代,用优化代替积分,计算效率显著提升。核方法是支持向量机(SVM)的核心技术,通过核函数将低维数据映射到高维空间,使得原本线性不可分的问题变得可分离。流形学习专注于非线性降维,大家熟知的t-SNE和UMAP就是它的实际应用,能够将高维数据在二维或三维空间中漂亮地呈现出来。自监督学习近年来备受关注,其核心思路是不需要人工标注,模型直接从数据自身结构中学习特征——SimCLR、BERT等都是典型代表。多任务学习则让一个模型同时处理多个相关任务,例如一个网络既能检测目标又能分割语义,通过参数共享提高训练效率。元学习的口号是“学会如何学习”,目标是让模型面对新任务时能够快速泛化,而无需从头训练。最后是对比学习,在无监督场景下通过拉近相似样本、推远不相似样本来学习特征表示,目前在视觉和文本领域都已非常成熟。
2. 深度学习(DL)进阶核心概念
在深度学习方面,批归一化(Batch Normalization)几乎成为现代网络的标配。它通过对每一层的输入进行标准化,使数据分布保持稳定,不仅加速了训练收敛,还在一定程度上缓解了梯度消失或梯度爆炸的问题。而层归一化(Layer Normalization)则是针对RNN和Transformer这类序列模型设计的,它不依赖batch维度,而是沿特征维度进行归一化,因此不受batch size影响,特别适合变长输入的处理。两者各有优势,但都指向同一个目标:让深层网络训练得更稳定、更快速。
