游乐游手机版
首页/AI热点日报/热点详情

机器学习与深度学习基本概念及运算过程详解

类型:热点整理2026-07-03
人工智能、机器学习与深度学习呈层级包含关系。机器学习通过监督、非监督和强化学习等算法让机器自主求解;深度学习以类神经网络为基础,利用卷积操作自动提取特征,其中卷积神经网络由卷积层、池化层和全连接层构成。

人工智能、机器学习与深度学习——这三个术语如今频繁出现在各类场合,但字面上的表述常常模糊不清,也难怪不少人容易将它们混淆。实际上,三者之间存在着清晰的层级关系。本文将系统梳理各自的核心定义,并简要讲解机器学习与深度学习的基本概念及其运算过程。

一、人工智能(Artificial Intelligence)

所谓人工智能,本质上是为机器构建一套类似人类大脑的智能判断机制。通过编写程序,模拟人类大脑的决策流程,使机器具备模仿、理解、学习等能力,最终形成近似人类的“智慧”。这一过程需要大量硬件设备来接收信息——摄像头传输影像充当人眼,麦克风收集声音模拟人耳,从而建立对外部世界的感知。

人工智能是一个宏观框架,内部包含机器学习(Machine Learning),而机器学习之中又嵌套着深度学习(Deep Learning)。如下图所示,我们最关注的深度学习正是机器学习的一个分支。下文将围绕机器学习与深度学习的差异展开详细说明。

二、机器学习(Machine Learning)

机器学习的核心在于通过算法设计,让机器自主寻找最优解。它能够帮助我们处理各类复杂问题。例如,要从海量数据中判断哪张图片是猫、哪张是狗——过去需要依靠人工经验反复摸索规则,寻找一个“判断标准”;如今,机器学习提供了多种高效算法,如数据的聚类分布、回归模型等,直接将数据交给机器,由它自行演算出最佳答案或模型。

机器学习主要分为以下几种类别:

1. 监督式学习

需要为每笔数据打上明确的“标签”——例如“是/否”“狗/猫”“苹果/橘子”。利用大量已知标签的信息与数据进行训练,最终构建出一个分类器(Classifier),也称为模型(Model)。除了分类任务外,监督式学习还可用于回归分析(Regression)。代表性算法包括 Adaboost、SVM、神经网络(Neural Network)等。

非监督式学习

无需为每笔数据人工标注“标签”,而是依据数据自身的分布规律来构建分类器。常见应用包括聚类分类(Clustering),以及降维(Dimensionality Reduction)和关联规则(Association Rule)。代表性算法有 K-means、PCA 等。

强化式学习

这一类别最为特殊——完全不需要向机器提供任何预先标注的数据。机器直接从持续的交互中学习,通过奖惩机制与成效评估,不断尝试、修正,最终找到最优化的模型。代表性算法包括 Q-Learning、SARSA 等。

近年来深度学习的兴起,根基都建立在类神经网络(Neural Network)上。这里先简要介绍这一算法。

类神经网络(Neural Network)

类神经网络最早于1943年由沃伦·麦卡洛克和沃尔特·皮茨提出,是一种基于阈值逻辑的算法。由于它采用多个节点进行判断,结构与人类大脑的神经元相似,因此得名“神经网络”。然而,该算法的计算量极大,在当时硬件条件有限的情况下发展受到制约。再加上当时支持向量机(SVM)在学界备受关注,类神经网络并未得到足够重视。

时至今日,硬件设备已足够强大,类神经网络重新获得关注,并衍生出 RNN、LSTM、RBF 等多种变体。大家熟悉的卷积神经网络(CNN)也沿袭了其思路。最具代表性的机制是“反向传播”——通过不断迭代,对比预测值与实际值的误差,逐步修正模型中的权重,最终达到最优状态。下面简要了解类神经网络的算法流程。

首先需要理解感知器(Perceptron)。它如同人脑中的一个神经元——通过神经网络传递信号,帮助做出正确判断。如下图所示,输入数据 x1 到 xd,各自乘以权重后求和,得到一个评分数值 y。随后利用该数值判断“是/否”“狗/猫”等二元分类问题。

回到类神经网络本身,它本质上是一个多层感知器模型,相当于由多个神经元(感知器)构成的复杂网络。基础架构包括输入层、隐藏层、输出层,如下图所示:

通过大量数据训练和反向传播机制,不断调整每个感知器的权重,最终能够精准反映数据分布,逼近真实模型。训练时,通常采用多张相同尺寸、相同特征的图片进行训练与分类。但需要注意:虽然类神经网络能很好地逼近最优模型,但如果直接将原始图片丢入训练,效果并不理想——原因在于,要构建高质量的模型,前提是输入有效的特征数据,或具备良好的特征提取过程。

三、深度学习(Deep Learning)

特征数据的选择一直是机器学习中相当深奥的课题。近年来,深度学习的出现大大简化了这一问题——它直接打破了传统思维。深度学习与机器学习最大的区别,在于输入端的特征提取方式。深度学习通过卷积操作,直接替代了传统的特征提取环节。下图清晰地展示了这一关键差异:

卷积神经网络(Convolutional Neural Network, CNN)是深度学习中最具代表性的算法之一,它由类神经网络演化而来。如下图所示,CNN通过卷积(Convolution)方式对图片进行特征提取——卷积的遮罩系数是随机生成的。卷积滤波器提取出特征后,再送至分类器进行分类,从而构成完整的CNN架构。

(此图来源于参考文献)

卷积神经网络主要包含三个部分:

  • 卷积层(Convolution Layer):用随机生成的遮罩进行特征提取。
  • 池化层(Pooling Layer):对不同位置的特征进行统计,取平均值或最大值作为参考点,以此降低数据的特征维度。
  • 全连接层(Fully Connected Layer):将卷积和池化后的结果进行平坦化,接入基础的神经网络。

通过这三个层,即可完成一个典型的CNN架构,如下图所示:

正是通过这种深度学习方式,系统能够自动提取有效特征,逼近最优模型。近年来,众多学者围绕CNN架构展开研究并举办比赛。目前备受关注的CNN模型包括LeNet、VGG、ResNet等。一个普遍共识是:网络架构越深,模型的准确度往往越高——这也正是“深度学习”这一名称的由来。

来源:https://m.elecfans.com/article/1309708.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。