大厂Token不再“管够”：腾讯开始限额，字节可

互联网 0 8

经济观察报 互联网资讯 发布于 2小时前

本条新闻为单纯事实消息的时事新闻，转载自经济观察报，版权归源站所有，如有侵权，烦请联系我们。

大厂Token不再“管够”（资料图）

记者刘思璇

从6月开始，一名腾讯员工发现：在内部管理看板上，自己分到的Token（词元）额度变少了。“之前一个月有2000美元（约1.35万元人民币）额度，这个月只有1400元人民币，两天就用没了。”

据经济观察报不完全统计，目前腾讯不同部门员工人均月Token额度差异较大，从1000元到7000元人民币不等。Token额度分配到组后，由组内管理者再分给员工个人。额度不足时，员工可向管理者“举手申请”提高额度。

对于员工Token，目前国内各家大厂主要有两种分配方式：一是额度分配到员工个人，如有超额需求，员工自费后可部分报销；二是额度分配到部门，作为部门预算的一部分，由管理者在部门内分配。

无论分给谁、怎么分，归根结底，分的都是用来买Token的钱。Agent（智能体）介入工作，带来Token消耗指数级增长，算力成本也在挤压大厂的利润。到了2026年中，包括微软、Meta等在内的国内外全球顶级科技大厂都开始踩下内部AI无限使用的“刹车”，对员工的AI Token用量进行监控、限制和动态调配。

额度收缩后，一些员工对自己将回归“古法编程”表示担忧，员工面临着由奢入俭的阵痛：回归手搓，还是自费加额、花钱打工？

“大锅饭”结束了

腾讯是国内率先对员工Token控额的互联网大厂之一。据经济观察报了解，6月起，腾讯多个业务员工的Token额度均有下降，且部门之间差异较大：在AI需求较大的混元大模型团队，员工月Token额度约7000元；在聚焦计算机视觉领域的优图实验室，额度约5250元；另有腾讯娱乐外包员工透露，自己月Token额度仅1000元。

“组内共用一个额度池，组长来分配。”前述腾讯员工称，“这是这个月的暂行办法，下个月可能还要改。”

今年3月，脉脉社区上有消息称，腾讯给员工配置了“每人年均22万元Token资源”，每月包含700美元Cursor额度、700美元Claude额度、1000美元CodeBuddy额度等，以此激励员工使用AI提效。该消息得到多位腾讯员工证实。

AI狂欢的同时，关于“Token用量是否会关联工作投入度”的猜测愈演愈烈。3月底，有腾讯员工在脉脉同事圈发帖称，部分业务在统计各部门、团队的Token用量并排名。一些员工担心Token消耗不够充分，在工作时间搭建无实际意义的工作流、让Agent重复完成任务，处理个人需求，甚至“接私活”，以确保Token用量不落后。

此次腾讯调整员工Token额度，有意改变此前以Token消耗量作为单一衡量标准的“大锅饭”模式。经济观察报了解到：2026年，腾讯将持续加码Token投入，但不再按统一标准分配到员工；部门管理者结合工作情况，动态分配资源，如有需求，员工可申请加量；内部反对Token使用量排名，不单纯以Token消耗衡量员工产出。

Token超了怎么办？

腾讯之外，其他互联网大厂的Token额度配置逻辑不一。

在产研等AI使用程度较高的岗位，阿里员工每月额度约为8000元，不限制模型，员工称处理日常需求“基本够用”；京东员工可不限量调用自家模型，调用外部模型所产生的费用分摊到部门；美团有员工称，还没听说明确的Token额度标准，但在使用内部AI产品时，经常遇到“模型变笨”的情况，怀疑是因调用量过多而被“降级到质量更低的模型”。

而在字节，员工可不限量调用TRAE（字节自研AI IDE产品）内模型，其中包含GPT、Gemini、Grok等；如有工作需要调用其他模型，产生的费用可部分报销，有部门报销标准为实际支出的50%，产研岗位年度报销上限为1000美元，其他岗位报销上限为300美元。

关于员工Token额度的配置，大厂们正在释放相同的信号：AI要用，Token得管，否则成本可能失控。

5月20日，2026阿里云峰会现场，米哈游《崩坏》系列AI NPC & Gameplay技术团队负责人郑银河分享团队在探索AI过程中的经历：有员工搭建几十个Agent共同协作，一晚上烧掉约200万元人民币的Token。

一家AI初创企业的研发人员向经济观察报介绍，他所在团队约50人，过去一个月团队Token成本约20万美元，人均成本达到4000美元，“主要用于编码，编码质量高的模型价格都高。老板让节省一些，后续考虑换便宜点的模型。”

6月初，OpenAI CEO Sam Altman在一场直播中表示，AI支出已经成为企业的大问题，而 “在年初时，人们还对自己的花费非常满意”。

换低价模型，或自费补额度

“看板上写了，如果Token不够，可以找负责人去加额度。”一名腾讯员工说，他的月Token额度约3000美元，6月看板更新后，额度仅有5000元人民币，“发下来三天就用没了，Agent、Subagent（子智能体）跑起来，额度用得很快”。于是他向上级主管申请提额，得到的反馈是部门预算有限，提额被拒绝。“各部门上限不一样，要看业务情况。”

腾讯此次Token额度调整范围主要针对外部模型，员工依旧可以不限量使用腾讯自研的混元大模型，这也导致混元调用量有所增长。有员工称，换回混元后，工作效率下降，使用体验变差，“幻觉很严重，也不是专用于编码的模型，不如手搓”。

苦于公司配额不够用，有腾讯员工选择自掏腰包，订阅每月200美元的Codex Pro 20x。他算了一笔账：“用混元的话，基础需求都要跑很久，失败了还得重跑，耽误时间。虽然不想自费打工，但是总比没额度用要好，这个价格也还好。”

在额度配置相对充裕的字节，模型调用也并非随心所欲。“我自己和身边大部分同事都用GPT-5.5，公司内的模型接口天天排长队。”一名字节研发人员透露，即便该模型在公司付费范围内，仍有员工用个人账号自费订阅，避免模型排队导致工作进度耽搁。

额度受限后，员工很难回到AI介入前的纯人工模式。“工作量已经涨上去了，没有因为Token减了就降下来。而且用AI以后，我很难再回归古法编程了。”一名腾讯员工正因Token不足而困扰。

当Token关联起成本和产能，企业应当如何划定和分配额度？大厂们仍在寻找答案。

点赞 0 收藏(0)

0个评论

消灭零评论