速度 2.6 倍提升,TencentOS 支持满血版 DeepSeek

数码 0 51
数码资讯
IT之家 数码资讯 发布于 3月17日 13:30
本条新闻为单纯事实消息的时事新闻,转载自IT之家,版权归源站所有,如有侵权,烦请联系我们

TencentOS Server AI 全面支持满血版 DeepSeek R1,在双机 16 卡的硬件环境上,分别在短输入场景(如知识问答)以及长输入场景(如企业私有信息的检索增强生成)均获得超过 2.6 倍的推理性能提升!

本性能评估采用 2 台 8 卡服务器,显存总量共 1536GB,部署 TencentOS Server AI 版,2 台服务器采用 RDMA 高速网络互联,测试样本采用通用的数据集。分别测试输入 200tokens / 输出 500tokens 以及输入 6144tokens / 输出 1024tokens 下的吞吐能力,测试结果如下:

TencentOS Server AI 是腾讯云发布的一款针对 AI 场景的操作系统,提供了从基础架构到 AI 框架以及模型的全栈式 AI 环境,一方面简化部署,另一方面通过高性能的 AI 框架,实现大模型如 DeepSeek 推理效率成倍的增加。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

点赞 0 收藏(0)  分享
0个评论
  • 消灭零评论