机器学习与深度学习基本概念及运算过程详解_AI热点日报

机器学习与深度学习基本概念及运算过程详解

类型：热点整理2026-07-03

人工智能、机器学习与深度学习呈层级包含关系。机器学习通过监督、非监督和强化学习等算法让机器自主求解；深度学习以类神经网络为基础，利用卷积操作自动提取特征，其中卷积神经网络由卷积层、池化层和全连接层构成。

人工智能、机器学习与深度学习——这三个术语如今频繁出现在各类场合，但字面上的表述常常模糊不清，也难怪不少人容易将它们混淆。实际上，三者之间存在着清晰的层级关系。本文将系统梳理各自的核心定义，并简要讲解机器学习与深度学习的基本概念及其运算过程。

一、人工智能（Artificial Intelligence）

所谓人工智能，本质上是为机器构建一套类似人类大脑的智能判断机制。通过编写程序，模拟人类大脑的决策流程，使机器具备模仿、理解、学习等能力，最终形成近似人类的“智慧”。这一过程需要大量硬件设备来接收信息——摄像头传输影像充当人眼，麦克风收集声音模拟人耳，从而建立对外部世界的感知。

人工智能是一个宏观框架，内部包含机器学习（Machine Learning），而机器学习之中又嵌套着深度学习（Deep Learning）。如下图所示，我们最关注的深度学习正是机器学习的一个分支。下文将围绕机器学习与深度学习的差异展开详细说明。

二、机器学习（Machine Learning）

机器学习的核心在于通过算法设计，让机器自主寻找最优解。它能够帮助我们处理各类复杂问题。例如，要从海量数据中判断哪张图片是猫、哪张是狗——过去需要依靠人工经验反复摸索规则，寻找一个“判断标准”；如今，机器学习提供了多种高效算法，如数据的聚类分布、回归模型等，直接将数据交给机器，由它自行演算出最佳答案或模型。

机器学习主要分为以下几种类别：

1. 监督式学习

需要为每笔数据打上明确的“标签”——例如“是/否”“狗/猫”“苹果/橘子”。利用大量已知标签的信息与数据进行训练，最终构建出一个分类器（Classifier），也称为模型（Model）。除了分类任务外，监督式学习还可用于回归分析（Regression）。代表性算法包括 Adaboost、SVM、神经网络（Neural Network）等。

非监督式学习

无需为每笔数据人工标注“标签”，而是依据数据自身的分布规律来构建分类器。常见应用包括聚类分类（Clustering），以及降维（Dimensionality Reduction）和关联规则（Association Rule）。代表性算法有 K-means、PCA 等。

强化式学习

这一类别最为特殊——完全不需要向机器提供任何预先标注的数据。机器直接从持续的交互中学习，通过奖惩机制与成效评估，不断尝试、修正，最终找到最优化的模型。代表性算法包括 Q-Learning、SARSA 等。

近年来深度学习的兴起，根基都建立在类神经网络（Neural Network）上。这里先简要介绍这一算法。

类神经网络（Neural Network）

类神经网络最早于1943年由沃伦·麦卡洛克和沃尔特·皮茨提出，是一种基于阈值逻辑的算法。由于它采用多个节点进行判断，结构与人类大脑的神经元相似，因此得名“神经网络”。然而，该算法的计算量极大，在当时硬件条件有限的情况下发展受到制约。再加上当时支持向量机（SVM）在学界备受关注，类神经网络并未得到足够重视。

时至今日，硬件设备已足够强大，类神经网络重新获得关注，并衍生出 RNN、LSTM、RBF 等多种变体。大家熟悉的卷积神经网络（CNN）也沿袭了其思路。最具代表性的机制是“反向传播”——通过不断迭代，对比预测值与实际值的误差，逐步修正模型中的权重，最终达到最优状态。下面简要了解类神经网络的算法流程。

首先需要理解感知器（Perceptron）。它如同人脑中的一个神经元——通过神经网络传递信号，帮助做出正确判断。如下图所示，输入数据 x1 到 xd，各自乘以权重后求和，得到一个评分数值 y。随后利用该数值判断“是/否”“狗/猫”等二元分类问题。

回到类神经网络本身，它本质上是一个多层感知器模型，相当于由多个神经元（感知器）构成的复杂网络。基础架构包括输入层、隐藏层、输出层，如下图所示：

通过大量数据训练和反向传播机制，不断调整每个感知器的权重，最终能够精准反映数据分布，逼近真实模型。训练时，通常采用多张相同尺寸、相同特征的图片进行训练与分类。但需要注意：虽然类神经网络能很好地逼近最优模型，但如果直接将原始图片丢入训练，效果并不理想——原因在于，要构建高质量的模型，前提是输入有效的特征数据，或具备良好的特征提取过程。

三、深度学习（Deep Learning）

特征数据的选择一直是机器学习中相当深奥的课题。近年来，深度学习的出现大大简化了这一问题——它直接打破了传统思维。深度学习与机器学习最大的区别，在于输入端的特征提取方式。深度学习通过卷积操作，直接替代了传统的特征提取环节。下图清晰地展示了这一关键差异：

卷积神经网络（Convolutional Neural Network, CNN）是深度学习中最具代表性的算法之一，它由类神经网络演化而来。如下图所示，CNN通过卷积（Convolution）方式对图片进行特征提取——卷积的遮罩系数是随机生成的。卷积滤波器提取出特征后，再送至分类器进行分类，从而构成完整的CNN架构。

（此图来源于参考文献）

卷积神经网络主要包含三个部分：

卷积层（Convolution Layer）：用随机生成的遮罩进行特征提取。
池化层（Pooling Layer）：对不同位置的特征进行统计，取平均值或最大值作为参考点，以此降低数据的特征维度。
全连接层（Fully Connected Layer）：将卷积和池化后的结果进行平坦化，接入基础的神经网络。

通过这三个层，即可完成一个典型的CNN架构，如下图所示：

正是通过这种深度学习方式，系统能够自动提取有效特征，逼近最优模型。近年来，众多学者围绕CNN架构展开研究并举办比赛。目前备受关注的CNN模型包括LeNet、VGG、ResNet等。一个普遍共识是：网络架构越深，模型的准确度往往越高——这也正是“深度学习”这一名称的由来。

来源：https://m.elecfans.com/article/1309708.html

机器学习

延伸阅读

补充最近整理过的热点入口。