前言
对于刚踏进AI门槛的朋友来说,最头疼的恐怕就是那一堆听起来玄乎其玄的术语了——人工智能、机器学习、深度学习、大模型、Prompt、Skill、Agent、RAG……每个字都认识,连在一起却像天书。别担心,这里就用最接地气的大白话,从零开始把这些核心概念一一捋清楚。
摘要:
一、AI到底是什么?先理清这4个层级
很多人把AI、机器学习、深度学习、大模型混着用,其实它们是层层嵌套的关系,就像俄罗斯套娃。
text
人工智能(AI)└── 机器学习(ML)└── 深度学习(DL)└── 大模型(LLM)
1. 人工智能(AI)- 最大的概念
人工智能,说白了就是让机器模仿人的智能:能看、能听、能说、能思考、能决策。目前市面上能见到的AI,基本都属于“弱人工智能”——只会干一件事,比如人脸识别、下围棋。真正的“强人工智能”像人一样全能,还没实现;至于“超人工智能”比人类聪明无数倍,目前只活在电影里。
2. 机器学习(ML)- AI的核心方法
传统编程是“你告诉机器规则,机器执行”——你写死逻辑,它照做。而机器学习是“你给数据和答案,机器自己找规律”。举个例子:你想让电脑识别猫,传统方式得写一堆规则(尖耳朵、胡须、尾巴),而机器学习只需要喂给它几千张标好“猫”或“不是猫”的图片,它自己就能总结出规律。
3. 深度学习(DL)- 用神经网络学习
深度学习是机器学习的一个子集,它的核心是模仿人脑神经元结构,搭建多层的“神经网络”。层数越多就越“深”,学习能力也越强。现在大多数突破性进展都来自深度学习。
4. 大模型(LLM)- 当前最火的方向
“大”体现在两方面:参数量巨大(几百亿甚至上万亿),训练数据巨多(几乎扫遍了整个互联网的文本)。ChatGPT、文心一言、通义千问都属于大模型。一句话串起来:AI是终极目标,机器学习是达成目标的方法,深度学习是方法的一次技术进化,而大模型是目前最强大的实现形式。
二、20个AI核心术语
基础篇
| 术语 | 大白话解释 |
|---|---|
| 训练 | 拿一大堆数据给模型学,就像学生做题学知识 |
| 推理 | 模型学完后,拿新问题去问它答案 |
| 参数 | 模型脑内的“知识开关”,越多脑子越复杂 |
| 标注 | 给数据打上正确答案标签,像做题时的标准答案 |
| 过拟合 | 背题背太死,换个新题就不会了 |
| 泛化 | 学了规律后能举一反三 |
当前热门篇
| 术语 | 大白话解释 |
|---|---|
| Prompt | 你问AI的那句话,问题质量决定答案质量 |
| 上下文窗口 | AI一次能记住多少字,像短期记忆力 |
| 多模态 | 不仅能看懂文字,还能看懂图片、听懂声音 |
| 推理能力 | 像做数学题那样一步步思考,不是瞎猜 |
| 幻觉 | AI胡说八道、编造事实,因为它在猜不是真知道 |
| 对齐 | 让AI的回答符合人类价值观,不说有害的话 |
| RAG | 回答前去查资料,不瞎编 |
| 微调 | 在大模型基础上拿专业数据再练一下 |
| Embedding | 把文字转成计算机能理解的数字向量 |
| Token | AI看文本的最小单位,不是按字是按“词块” |
| 温度 | 控制AI回答的随机程度,低温度更保守,高温度更有创意 |
| SFT | 拿人工写的高质量问答去微调模型 |
| RLHF | 让人类给AI多个回答打分,用分数训练AI |
三、Skill(技能)—— 让AI干活的具体能力
什么是Skill?
Skill就是AI能完成的一个具体任务。比如写诗、翻译、写代码、总结文章。这些能力有些是大模型自带的,有些需要你“教”它或者给它工具才能解锁。
大模型自带的基础Skill
- 文本生成:写文章、写邮件
- 理解分析:情感判断、提取关键信息
- 代码能力:写Python、SQL、调试
- 翻译能力:上百种语言互译
- 数学计算:做小学到高中数学题
如何扩展Skill
- Prompt Engineering:写好提示词解锁特定能力
- Function Calling:让AI调用外部工具,如算汇率、查天气
- Plugin/插件:AI调用第三方服务,如订机票、发邮件
- 自定义指令:在设置里写“你是个财务专家”,永久改变回答风格
关键就一句话:Skill = AI本身就会 + 你教它 + 你给它工具。
四、Agent(智能体)—— 自己动脑干活的AI
什么是Agent
普通对话AI是你问一句它答一句,而Agent是那种能自主思考、做计划、执行任务、自我纠错的AI。你给它一个目标,它自己想办法完成,全程不需要你一步步指挥。
Agent的核心组成
- 规划能力:把大任务拆成小步骤
- 记忆能力:短期记忆(当前任务上下文) + 长期记忆(存数据库)
- 工具使用:能调用搜索、计算器、API、写代码等
- 反思能力:做一步检查一步,错了主动改
Agent是怎么工作的
假设你给Agent一个目标:“帮我订周五北京到上海最便宜的高铁票”。它的思考过程大致是这样的:先拆任务(查高铁班次 → 比价格 → 选最便宜的 → 订票),然后调用搜索工具查班次,调用计算器比价格,最后执行订票操作,反馈结果:“已帮你订好G11次列车,票价553元”。整个过程全自动。
简单Agent vs 复杂Agent
| 类型 | 特点 | 例子 |
|---|---|---|
| 单Agent | 一个AI干所有事 | 你问ChatGPT订票,它自己完成 |
| 多Agent | 多个Agent协作,各干各擅长的 | 一个负责查票,一个负责比价,一个负责下单 |
| AutoGPT | 自动循环执行任务,直到目标达成 | 自己上网查资料、写报告、存文件 |
你现在就能用的Agent
- AutoGPT:开源,全自主执行
- CrewAI:多Agent协作框架
- MetaGPT:模拟软件开发团队
- 很多国产大模型正在内测的“智能体模式”
五、RAG(检索增强生成)—— 让AI不乱编
为什么需要RAG
大模型的知识截止于训练时,你问最近发生的事它根本不知道。更麻烦的是它会“幻觉”——编造答案。RAG就是给AI配一个“外设知识库”,让它回答前先查资料,而不是凭空瞎猜。
RAG怎么做?
三步走:
- 你问一个问题
- 系统先去知识库搜索相关文档(像一个搜索步骤)
- 把搜到的文档 + 你的问题一起给大模型,让它基于资料回答
RAG vs 微调
| RAG | 微调 | |
|---|---|---|
| 成本 | 低 | 高 |
| 知识更新 | 实时 | 需要重新训练 |
| 适合场景 | 大量文档问答、客服 | 改变说话风格、学习特殊技能 |
六、一张图看懂它们之间的关系
text
你的目标│▼┌─────────────────────────┐│ Agent ││ (自己思考 + 干活)│└─────────────────────────┘│┌───────────────┼───────────────┐▼ ▼ ▼【规划能力】 【调用Skill】 【使用工具】拆解任务写文案、翻译 搜索、计算、API│▼┌─────────────────────────┐│ 大模型(大脑) │└─────────────────────────┘│┌───────────────┼───────────────┐▼ ▼ ▼Prompt工程微调(SFT)RAG(搜资料)写好提示词专精某个领域实时查外部知识
七、给零基础的学习路线
如果你完全从零开始,建议按这个顺序来:
第1步:先玩起来(0基础)
- 注册:ChatGPT、文心一言、Kimi(免费优先)
- 练习写Prompt:从写周报、写邮件开始
第2步:理解原理(1-2个月)
- 搞懂:Token、Embedding、注意力机制
- 推荐资源:李宏毅机器学习课程
第3步:动手实践(3-6个月)
- 用Coze或Dify搭建简单Agent
- 学习LangChain基础
- 尝试本地跑开源模型(Ollama)
第4步:深入学习
- RAG优化、模型微调、多模态应用
结语
AI技术发展太快,没有人能跟上所有更新。最重要的是理解核心概念——大模型是大脑,Skill是能力,Agent是让AI自己动起来的智能体,RAG是防止乱编的保险。记住这些,你在任何AI讨论中都不会掉队。
