游乐游手机版
首页/AI教程/文章详情

AI从零开始学习完整指南:基础知识和环境准备

时间:2026-06-14 14:42
人工智能基础知识涵盖大语言模型(LLM)、检索增强生成(RAG)和智能体(Agent)等核心术语。技术框架包括HuggingFace、LangChain和Ollama。环境准备需要安装Python(推荐Anaconda)、PyTorch、Transformers以及LangChain,以支持本地大模型的开发与部署。这些内容构成了AI应用开发的入门基础,是学习

AI 基础入门:核心概念与术语详解

学习任何技术都离不开专业术语,AI 领域更是如此——新概念层出不穷,容易让人眼花缭乱。不过,一旦掌握这些术语,后续的学习与实际应用就会顺利许多。

我们从一个具体的应用场景开始。有一篇关于使用 RAG-GPT 和 Ollama 搭建智能客服的文章,其中梳理了一个典型的问答流程。整个过程可以用一张流程图来展现:

智能文档在线检索的完整流程如下图所示,它清晰展示了一个问答的运转过程:

  • 用户发起 query(查询)
  • 根据 Bot 实际业务场景,判断是否需要对 query 进行 rewrite(重写)
  • Retrieval(检索)模块依据 query 从 Indexing(索引)中找出相关文档
  • 对召回的文档执行 Reranking(重排序)
  • 依据 relevance score(相关性分数)进行过滤,去除低质量文档
  • 组装成合适的 Prompt(提示词)输入到 LLM 大模型中,最终生成回答

这个流程看似简单,背后却牵出一系列关键概念。接下来我们将逐一解析,帮助你看懂它们究竟是什么。

关键术语解析

  • LLM 大模型: 指参数规模极其庞大的语言模型。例如 GPT-4 参数量达到 1750 亿,而 GPT-3 为 175 亿。参数越多,模型理论上能捕捉和处理的信息就越复杂。
  • GPT: 全称 Generative Pre-trained Transformer(生成式预训练 Transformer),是 OpenAI 开发的系列语言模型。它能执行文本生成、摘要、翻译、分类,甚至搭建问答系统等多种任务。
  • Transformer: 一种基于注意力机制的神经网络架构。注意力机制使模型在处理文本时能够“聚焦”关键部分,而非平均对待。它不仅用于 NLP,在语音识别、图像识别领域也有广泛应用。
  • RAG: 全称 Retrieval-Augmented Generation(检索增强生成)。“增强”是核心——它将信息检索与文本生成相结合,让模型在生成回答前先去外部知识库“查阅资料”,而非完全依赖自身记忆。尤其适用于问答和摘要场景。
  • 知识库: 相当于模型需要查阅的“字典”或“资料库”,存储了大量知识,用于支撑问答、文本生成等任务。
  • 召回: 从海量数据中找出与当前查询最相关的部分信息。例如用户问“如何退货”,系统需从客服知识库中精准提取退货相关条目。
  • Prompt: 输入给模型的文本或问题描述。你给出的指令直接决定生成的输出质量。Prompt 的写法对结果影响很大。
  • 重写: 对用户输入的问句进行适当调整。比如用户说“咋退东西”,系统可能需要先改写为“如何办理退货流程”,才能更好地匹配知识库。
  • 模型训练: 使用大量数据“喂养”模型,通过不断调整参数使其学会完成任务,是机器学习和深度学习的基础环节。
  • Agent: 智能体,可视为“通用问题解决器”。从软件工程角度看,它基于大语言模型,具备规划思考、记忆和调用外部工具的能力,能自主完成指定任务。
  • Function Calling: 一种让大语言模型连接外部工具的机制。调用模型 API 时,你可以描述一些函数(功能、参数、响应格式)。模型会根据用户输入自主决定调用哪个函数,并将用户的自然语言转换为结构化的函数调用参数返回给你。之后你可执行该函数,将结果回传给模型,让模型组织成自然语言回答用户。

主流技术框架

  • Hugging Face: 被誉为 AI 界的 GitHub——一个汇集海量预训练模型、数据集和应用的社区。其旗下核心开源库“Transformers”最初提供各类基于 Transformer 架构的预训练模型(如 BERT、GPT-2 等),后逐步发展为支持多种主流任务的完整机器学习工具库。官方网址:https://huggingface.com/
  • LangChain: 一个基于大语言模型开发应用的框架,旨在简化 LLM 应用的全生命周期——从原型到生产,逐步优化。官方网址:https://python.langchain.com/docs/introduction/
  • Ollama: 开源的本地大语言模型运行框架,专为在个人电脑上便捷部署和运行大模型而设计,无需依赖云端。官方网址:https://ollama.com/

开发环境准备

1. 安装 Python

Python 是一种高级编程语言,具备简单易学、易于扩展、丰富的库和工具包等优点,广泛应用于数据科学、机器学习、Web 开发、自动化测试等领域。

1.1 常规安装

Python 安装门槛很低。前往官网下载对应操作系统的安装包,按提示一路确认即可。最关键的一步:安装完成后打开命令行终端,输入 python --version,若能显示版本号,即表示安装成功。

  1. 打开 Python 官方网站:https://www.python.org/downloads/
  2. 点击“Downloads”按钮进入下载页面
  3. 选择适合你操作系统的 Python 版本,点击“Download”按钮
  4. 下载完成后双击安装包,按提示完成安装
  5. 安装完成后启动命令行终端,输入 python --version,若输出版本号则说明 Python 已成功安装

1.2 通过 Anaconda 安装

Anaconda 是一个开源 Python 发行版,预装了 Python 及大量常用科学计算库,能帮你省去不少环境配置的麻烦。

国内用户通常推荐使用清华镜像源(https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/),国外用户则用官方源。Mac 或 Linux 安装命令如下:

# 安装 Anaconda
wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2021.11-Linux-x86_64.sh
bash Anaconda3-2021.11-Linux-x86_64.sh

# 激活 Anaconda
source ~/.bashrc

# 查看 Anaconda 版本
conda --version

Windows 用户可参考相关教程。总的来说,日常开发强烈建议使用 Anaconda。它不仅自带环境管理功能,还能轻松切换和安装不同版本的 Python,非常顺手。

2. 安装 PyTorch

PyTorch 是深度学习领域的明星框架,也是当前本地部署大模型的主流选择。安装方式有 pip 和 conda 两种,这里推荐 conda,因为它会自动处理依赖关系,避免环境冲突。

安装命令如下:

# 安装 PyTorch
conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch

# 查看 PyTorch 版本
python -c "import torch; print(torch.__version__)"

关于 PyTorch 的详细教学,可参考后续学习资料。

3. 安装 Hugging Face Transformers

这是 Hugging Face 创建的开源框架,提供了 API 和工具,让你能轻松下载并使用最先进的预训练模型,还可进一步微调以提升性能。支持自然语言处理、计算机视觉、音频等多种任务。

安装命令如下:

# 安装 Hugging Face Transformers
pip install transformers

# 查看 Hugging Face Transformers 版本
python -c "import transformers; print(transformers.__version__)"

4. 安装 LangChain

LangChain 是一个用于构建 LLM 应用的框架,核心在于“集成”与“功能”。它封装了 API 调用、网页抓取、代码分析、文档摘要等工具,并支持接入 OpenAI、Anthropic、HuggingFace 等主流大模型以及多种数据源。

安装命令如下:

# 安装 LangChain
pip install langchain

# 查看 LangChain 版本
python -c "import langchain; print(langchain.__version__)"
来源:https://blog.csdn.net/2301_81940605/article/details/149277243
上一篇零基础AI入门启蒙教程实操落地无压力 下一篇Python实现人工智能AI抠图功能
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
Windows Docker Desktop RabbitMQ生产级部署完整指南
AI教程 · 2026-06-29

Windows Docker Desktop RabbitMQ生产级部署完整指南

前言 在 Windows 本地开发环境中,直接安装 RabbitMQ 确实颇为周折:需要单独配置 Erlang 运行环境、手动管理环境变量、服务启停全凭手工操作。更令人困扰的是,版本兼容冲突、端口占用、环境不一致等问题层出不穷。笔者见过不少开发者为搭建环境就得耗费整整半天时间。 相比之下,借助 Do

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践
AI教程 · 2026-06-29

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践

先分享一个切实感受。过去两年,我们与福建制造企业合作较为频繁,发现一个非常突出的现象:超过80%的企业官网,产品参数仍然存放在PDF或图片中。AI爬虫?根本无法抓取。这些企业技术实力不弱、资质证照齐全、应用案例也丰富,但在AI搜索这一全新战场上,它们几乎处于隐身状态。 一、一个正在发生的行业变化 A

阿里云Token Plan团队版功能价格与省钱购买指南
AI教程 · 2026-06-29

阿里云Token Plan团队版功能价格与省钱购买指南

阿里云百炼近期推出了名为“Token Plan 团队版”的全新服务,这一服务专为企业与开发者量身打造,定位为AI大模型订阅平台。通过引入Credits作为统一计量单位,将文本生成、图像生成等多模态AI能力纳入单一计费体系,同时无缝兼容主流AI编程工具及智能体(Agent)生态系统。其核心亮点包括:全

阿里云物联网.NET Core客户端位置信息上报
AI教程 · 2026-06-29

阿里云物联网.NET Core客户端位置信息上报

阿里云物联网平台的位置服务并非一个完全独立的功能模块。位置信息可包含二维坐标与三维坐标,而位置数据的来源本质上是借助设备属性进行上传。换言之,若要让设备上报位置,您需先将其视为一个普通属性进行处理。 1)添加二维位置数据 操作过程十分简洁。进入数据分析 → 空间数据可视化 → 二维数据,点击添加,将

年阿里云服务器选型配置与网站部署全攻略
AI教程 · 2026-06-29

年阿里云服务器选型配置与网站部署全攻略

2026年,阿里云服务器生态已高度成熟,形成了清晰的轻量应用服务器与ECS云服务器两大产品阵营。无论你是计划搭建个人博客、企业官网,还是运营电商平台、进行应用开发,基本都能找到理想的解决方案。本指南将从服务器选型、配置选择、部署流程到安全运维,系统梳理2026年最实用的操作要点,帮助你少走弯路,让网