首页 游戏 软件 资讯 排行榜 专题
首页
AI
“Token”中文翻译如何定?理解其技术定义才是关键

“Token”中文翻译如何定?理解其技术定义才是关键

热心网友
58
转载
2026-03-27

Token 是大模型”读"和“写”数据的最小单位,当我们发给大模型一段话时,大模型不是直接理解整句话,而是先把单词或者汉字“拆解”成一个个的最小的处理单元,也就是我们所说的Token,而这个过程叫做Tokenization。

一、Token 是什么?

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

图片图片

Token 是大模型”读"和“写”数据的最小单位,当我们发给大模型一段话时,大模型不是直接理解整句话,而是先把单词或者汉字“拆解”成一个个的最小的处理单元,也就是我们所说的Token,而这个过程叫做Tokenization。打个比方来说,Token就好比我们搭建乐高模型的积木块或者盖房子的每一个砖块。

所以,总结来说,Token就是大模型通过计算机与人类打交道进而理解人类世界的基本单位。

二、Token 有什么用?

图片图片

1. Token把各种语言的文本翻译成计算机能识别的数字,也就是我们熟知的编码过程,便于计算机做各种处理和计算。

2.大模型生成的内容也是按照Token为单位一个一个“吐”出来,然后经过逆向过程,也就是Detokenization,把内容再转为人类便于理解的语言形式。

三、Token的数量是如何计算的?

图片图片

首先更正一个误区,好多人认为一个Token就是一个汉字或者一个英文单词,但其实这种说法并不准确。

Token的计算与使用的分词也就是句子切割方式有很大的关系,不同的模型使用的分词方式不同所对应的Token量也是不一样的。比如这句话[“人工智能很有趣”],可能得分割方式就有三种,[“人工智能” “很” “有趣”],[“人工” “智能” “很” “有趣” ],或者["人" “工” “智” "能" “很” “有” “趣”],依次对应的Token数量为3,4,7。

英文分词有时也并非按照每个单词切分的,再比如["unhappines"]一个单词可能会被切分成["un" "happi" "ness"]。一般来说,1个汉字≈1个Token,1个Token≈0.75个单词。

四、Token为什么如此重要?

图片图片

1. 不同的Token切分方式会影响大模型对语义的理解,比如前面提到的如果把“人工智能”作为一个Token可能会比分成“人工”和“智能”2个Token对大模型训练的的效果更好一些。

2. Token决定了模型对于上下文的记忆能力。我们经常听到的大模型的上下文窗口是10K,100K等,就是代表大模型一次能处理的最多的Token数量,如果超过了这个数量,大模型就会丢失一部分内容,从而影响模型的输出质量。

3. Token决定了使用成本。现在各家大模型基础厂商提供的套餐基本都是按照Token数量收费的,从这个角度来说Token就是我们于大模型打交道所使用的货币单位。

五、Token 翻译什么比较合适?

图片图片

在大模型出现之前,其实Token就已经出现了,最常用的地方就是你登录 是服务器会给你一段字符串来证明“你就是你”,那个时候被翻译成中文“令牌”、“标记”等。但大模型中的Token跟这里的Token完全不是一个意思,所以再沿用之前的翻译就不合适了。这也是最近网络上发起了对Token这个单词翻译成中文的讨论的一个原因吧。好多大V给出了他们在大模型语境中对Token的翻译,这些翻译有“词元”,“模元”,“新智元”等。那么你认为Token应该被翻译成什么呢?请在评论区打出你的答案!

来源:https://www.51cto.com/article/838884.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

龙虾、Token是什么?6位AI大咖为你深度解析
科技数码
龙虾、Token是什么?6位AI大咖为你深度解析

来源:人民日报客户端走红的“龙虾”(OpenClaw)打开了智能体的想象空间;巨量的词元(Token)反映着AI产业规模快速扩张……3月27日,在2026中关村论坛人工智能主题日,月之暗面创始人杨植

热心网友
03.28
三大运营商横盘高营收,Token模式破局成关键
科技数码
三大运营商横盘高营收,Token模式破局成关键

据证券时报,近日,三大电信运营商2025年年报陆续出炉。总的来看,运营商主要业绩指标高位运行,但就总量而言,增长乏力的状况并没有显著改善,算力服务、创新业务、国际业务等结构性收入增长仍是主要亮点。2

热心网友
03.28
Token成本优势:中国AI模型以极致性价比挑战美国巨头
科技数码
Token成本优势:中国AI模型以极致性价比挑战美国巨头

越来越多海外开发者及“龙虾”(OpenClaw)用户,对中国大模型愈发青睐,从而引发中国“Token出海”现象。一名新加坡开发者,曾用美国模型公司Anthropic的旗舰模型Claude Opus

热心网友
03.28
趋境科技ATaaS发布:全球领先的AI Token高效生产平台
AI
趋境科技ATaaS发布:全球领先的AI Token高效生产平台

当前,人工智能产业正从模型能力竞争逐步转向规模化应用竞争。应用形态也从单一问答扩展到多智能体协作、长链路推理和复合任务执行,这使得 Token 需求快速增长。与此同时,算力采购、部署和运行过程中的设

热心网友
03.28
发展AI的关键变量:透过“龙虾对话”洞见未来趋势
科技数码
发展AI的关键变量:透过“龙虾对话”洞见未来趋势

证券时报记者 韩忠楠“其实我最开始使用OpenClaw(俗称‘龙虾’)的时候,并不太适应。”无问芯穹联合创始人兼CEO夏立雪的回答,让2026中关村论坛年会AI开源前沿论坛的现场响起会心笑声。3月2

热心网友
03.28

最新APP

你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26
儿童画画
儿童画画
休闲益智 03-25
疯狂猜词
疯狂猜词
休闲益智 03-25
诸神皇冠
诸神皇冠
棋牌策略 03-25

热门推荐

洛克王国圣羽翼王攻略:属性技能全解析
游戏攻略
洛克王国圣羽翼王攻略:属性技能全解析

洛克王国世界圣羽翼王怎么样?大家在洛克王国世界里到处跑的时候,肯定都想找个又能打、跑得又快的精灵。圣羽翼王就是那种,能在天上飞着就把对面打懵的角色。今天小编就带来洛克王国世界圣羽翼

热心网友
03.28
《40集谍战大作》张嘉益、程琤、咏梅、宋佳实力领衔主演
娱乐
《40集谍战大作》张嘉益、程琤、咏梅、宋佳实力领衔主演

如果把谍战剧当成一场比赛,《悬崖》绝对不是那种节奏飞快、比分拉锯的对攻战,它更像一场在冰面上踢的“慢速决赛”——每一步都滑,每一次失误都可能直接出局。它没有那么多枪火轰鸣,却用一寸一寸逼近的危机,把

热心网友
03.28
PPT打字机音效设置:动画效果中轻松添加声音
电脑教程
PPT打字机音效设置:动画效果中轻松添加声音

可在PPT中通过三种方式实现打字机音效:一、用“出现”动画设“按字母”播放并选内置“打字机”声;二、插入自定义WAV音效,同步逐字动画时长;三、分段文本框+触发器,为每句绑定独立音

热心网友
03.28
钉钉显示天气信息的设置方法与实用技巧
手机教程
钉钉显示天气信息的设置方法与实用技巧

在日常使用钉钉的过程中,不少用户希望能便捷地获取天气信息。其实,钉钉是可以显示天气的,以下为您详细介绍具体方法。首先,打开手机中的钉钉应用程序。进入钉钉主界面后,点击界面左上角您所

热心网友
03.28
埃尔南德城堡进入攻略:三种方法带你穿越红色荒漠
游戏攻略
埃尔南德城堡进入攻略:三种方法带你穿越红色荒漠

在红色沙漠中,想要进入埃尔南德城堡。需先获得埃尔南德宴会服,可通过完成主线“善意的考验-二话不说地伸出援手”由阿兰赠送,或在铁匠铺旁服装店购买,穿上该礼服即可进入城堡,未穿则会被门卫阻拦。红色沙漠进

热心网友
03.28