大厂Token不再“管够”:腾讯开始限额,字节可

互联网资讯
本条新闻为单纯事实消息的时事新闻,转载自经济观察报,版权归源站所有,如有侵权,烦请联系我们



大厂Token不再“管够”(资料图)

记者 刘思璇

从6月开始,一名腾讯员工发现:在内部管理看板上,自己分到的Token(词元)额度变少了。“之前一个月有2000美元(约1.35万元人民币)额度,这个月只有1400元人民币,两天就用没了。”

据经济观察报不完全统计,目前腾讯不同部门员工人均月Token额度差异较大,从1000元到7000元人民币不等。Token额度分配到组后,由组内管理者再分给员工个人。额度不足时,员工可向管理者“举手申请”提高额度。

对于员工Token,目前国内各家大厂主要有两种分配方式:一是额度分配到员工个人,如有超额需求,员工自费后可部分报销;二是额度分配到部门,作为部门预算的一部分,由管理者在部门内分配。

无论分给谁、怎么分,归根结底,分的都是用来买Token的钱。Agent(智能体)介入工作,带来Token消耗指数级增长,算力成本也在挤压大厂的利润。到了2026年中,包括微软、Meta等在内的国内外全球顶级科技大厂都开始踩下内部AI无限使用的“刹车”,对员工的AI Token用量进行监控、限制和动态调配。

额度收缩后,一些员工对自己将回归“古法编程”表示担忧,员工面临着由奢入俭的阵痛:回归手搓,还是自费加额、花钱打工?

“大锅饭”结束了

腾讯是国内率先对员工Token控额的互联网大厂之一。据经济观察报了解,6月起,腾讯多个业务员工的Token额度均有下降,且部门之间差异较大:在AI需求较大的混元大模型团队,员工月Token额度约7000元;在聚焦计算机视觉领域的优图实验室,额度约5250元;另有腾讯娱乐外包员工透露,自己月Token额度仅1000元。

“组内共用一个额度池,组长来分配。”前述腾讯员工称,“这是这个月的暂行办法,下个月可能还要改。”

今年3月,脉脉社区上有消息称,腾讯给员工配置了“每人年均22万元Token资源”,每月包含700美元Cursor额度、700美元Claude额度、1000美元CodeBuddy额度等,以此激励员工使用AI提效。该消息得到多位腾讯员工证实。

AI狂欢的同时,关于“Token用量是否会关联工作投入度”的猜测愈演愈烈。3月底,有腾讯员工在脉脉同事圈发帖称,部分业务在统计各部门、团队的Token用量并排名。一些员工担心Token消耗不够充分,在工作时间搭建无实际意义的工作流、让Agent重复完成任务,处理个人需求,甚至“接私活”,以确保Token用量不落后。

此次腾讯调整员工Token额度,有意改变此前以Token消耗量作为单一衡量标准的“大锅饭”模式。经济观察报了解到:2026年,腾讯将持续加码Token投入,但不再按统一标准分配到员工;部门管理者结合工作情况,动态分配资源,如有需求,员工可申请加量;内部反对Token使用量排名,不单纯以Token消耗衡量员工产出。

Token超了怎么办?

腾讯之外,其他互联网大厂的Token额度配置逻辑不一。

在产研等AI使用程度较高的岗位,阿里员工每月额度约为8000元,不限制模型,员工称处理日常需求“基本够用”;京东员工可不限量调用自家模型,调用外部模型所产生的费用分摊到部门;美团有员工称,还没听说明确的Token额度标准,但在使用内部AI产品时,经常遇到“模型变笨”的情况,怀疑是因调用量过多而被“降级到质量更低的模型”。

而在字节,员工可不限量调用TRAE(字节自研AI IDE产品)内模型,其中包含GPT、Gemini、Grok等;如有工作需要调用其他模型,产生的费用可部分报销,有部门报销标准为实际支出的50%,产研岗位年度报销上限为1000美元,其他岗位报销上限为300美元。

关于员工Token额度的配置,大厂们正在释放相同的信号:AI要用,Token得管,否则成本可能失控。

5月20日,2026阿里云峰会现场,米哈游《崩坏》系列AI NPC & Gameplay技术团队负责人郑银河分享团队在探索AI过程中的经历:有员工搭建几十个Agent共同协作,一晚上烧掉约200万元人民币的Token。

一家AI初创企业的研发人员向经济观察报介绍,他所在团队约50人,过去一个月团队Token成本约20万美元,人均成本达到4000美元,“主要用于编码,编码质量高的模型价格都高。老板让节省一些,后续考虑换便宜点的模型。”

6月初,OpenAI CEO Sam Altman在一场直播中表示,AI支出已经成为企业的大问题,而 “在年初时,人们还对自己的花费非常满意”。

换低价模型,或自费补额度

“看板上写了,如果Token不够,可以找负责人去加额度。”一名腾讯员工说, 他的月Token额度约3000美元,6月看板更新后,额度仅有5000元人民币,“发下来三天就用没了,Agent、Subagent(子智能体)跑起来,额度用得很快”。于是他向上级主管申请提额,得到的反馈是部门预算有限,提额被拒绝。“各部门上限不一样,要看业务情况。”

腾讯此次Token额度调整范围主要针对外部模型,员工依旧可以不限量使用腾讯自研的混元大模型,这也导致混元调用量有所增长。有员工称,换回混元后,工作效率下降,使用体验变差,“幻觉很严重,也不是专用于编码的模型,不如手搓”。

苦于公司配额不够用,有腾讯员工选择自掏腰包,订阅每月200美元的Codex Pro 20x。他算了一笔账:“用混元的话,基础需求都要跑很久,失败了还得重跑,耽误时间。虽然不想自费打工,但是总比没额度用要好,这个价格也还好。”

在额度配置相对充裕的字节,模型调用也并非随心所欲。“我自己和身边大部分同事都用GPT-5.5,公司内的模型接口天天排长队。”一名字节研发人员透露,即便该模型在公司付费范围内,仍有员工用个人账号自费订阅,避免模型排队导致工作进度耽搁。

额度受限后,员工很难回到AI介入前的纯人工模式。“工作量已经涨上去了,没有因为Token减了就降下来。而且用AI以后,我很难再回归古法编程了。”一名腾讯员工正因Token不足而困扰。

当Token关联起成本和产能,企业应当如何划定和分配额度?大厂们仍在寻找答案。

点赞 0 收藏(0)  分享
0个评论
  • 消灭零评论