超越“纳米香蕉”的国产文生图工具来了,特别懂

互联网资讯
文汇报 互联网资讯 发布于 昨天 22:15
本条新闻为单纯事实消息的时事新闻,转载自文汇报,版权归源站所有,如有侵权,烦请联系我们


“香蕉”刚火,“种子”又来。国际知名评测机构Artificial Analysis刚发布消息称,字节跳动Seedream 4.0已登顶文生图及图像编辑排行榜榜首,在两个领域都超越了谷歌的Gemini 2.5 Flash(Nano-Banana)。

Seedream 4.0是字节跳动最新发布的豆包图像创作模型。该模型集成了文生图、图像编辑、多图融合、组图生成等多种能力,最高支持4K分辨率图像生成,已在豆包App、即梦AI、扣子等产品上线,并通过火山引擎开放给企业客户。

Seedream 4.0具备多图输出输出、超强主体一致性和直出4K高清图。其中,它是全球首个支持4K高清直出的多模态生图工具。Nano banana出圈的3D手办功能,Seedream4.0的表现也非常好。

在对中文、日文的识别方面,Seedream 4.0的使用体感大幅度领先于Nano banana。比如一位日本用户用它生成了一个茄子的手绘风格料理食图谱,画风非常细腻可爱。


日本用户用Seedream4.0生成图。

上海温哥华电影学院3D动画与视觉特效专业系主任徐一然马上跟进使用了Seedream 4.0,给出的评价是超越Nano banana。“理解力和还原度都大大增强了,能够比较准确地还原原画细节,在想象力上也有针对性地提高。”他说。他认为这这是实用性非常强的工具,对于是否会对自己产生威胁,他说有担心,但其实它对美术特别是设计的重要性没有减少。


徐一然将自己设计的图画转化为手办。

除了多图输入创作,即将几张图有逻辑地合并在一张图上,Seedream 4.0还支持多图连续输出。B站UP主檀东东Tango给AI两个角色形象图,要求它一次性生成8个分镜图,然后再基于分镜直接图生视频。结果显示,视频的一致性非常好。那么,以后只要有人写文本,用AI配音+AI动画,AI短剧将会大量涌现。


一张线稿可以转化为一段视频。徐一然提供

你想和自己的偶像来一段视频也不在话下,只要输入你和偶像的照片,一键即可搞定。

檀东东Tango又让AI生成一张图一的刘亦菲打着图二的伞给图三的美国队长遮雨的图,结果显示,Seedream的效果显著好于Nano banana。具体表现为衣服色彩上,Seedream更还原,场景表现上,Seedream无论是雨滴打在伞上还是在盾牌上的细节都惟妙惟肖。


B站UP主檀东东Tango视频截图。

据悉,4.0相较于3.0计算效率提升了10倍以上,4.0支持秒级生成2K图片,也就是说用几毛钱就能搞定一张高清商用图。目前看来,图像、视频、音频领域的红利才刚开始激活。

点赞 0 收藏(0)  分享
0个评论
  • 消灭零评论