国内模型首度超越 GPT-4o!零一万物新旗舰模型 Yi-Lightning 排名世界第六、中国第一,致力以顶尖模型赋能千行百业

最后更新于:2024-10-16 16:40:44

10月16日,继上半年千亿参数模型 Yi-Large 之后,零一万物正式对外发布最新旗舰模型 Yi-Lightning。在国际权威盲测榜单 LMSYS 上,Yi-Lightning 超越 GPT-4o-2024-05-13、Claude 3.5 Sonnet,排名世界第六,中国第一。

这是在 LMSYS 这一全球大模型必争的公开擂台上,中国大模型首度实现超越 OpenAI GPT-4o ”的最佳成绩!

在一众国内模型中,Yi-Lightning 成功拔得头筹,成为含金量最高的“中国大模型第一”。零一万物紧随 OpenAI、 Google 之后,与xAI 打平,进击全球前三大模型企业,稳居世界第一梯队大模型公司之列。

国内模型首度超越 GPT-4o!零一万物新旗舰模型 Yi-Lightning 排名世界第六、中国第一,致力以顶尖模型赋能千行百业

作为模型落地的典型场景之一,翻译场景十分全面地考验了模型语言理解和生成、跨语言能力、上下文感知能力,通过 Yi-Lightning 与Qwen2.5-72b-Instruct、DeepSeek-V2.5、Doubao-pro 的对比,Yi-Lightning 优异的模型性能也得到了最直观的展现:

Yi-Lightning翻译对比视频

Yi-Lightning 不仅模型性能优异,在推理速度和推理成本方面同样有所突破——较上一代旗舰模型 Yi-Large ,Yi-Lightning 的最高生成速度提速近四成。在与 GPT-4o 的对比中,Yi-Lightning 的生成速度堪称“极速”:

Yi-Lightning速度对比视频

仰赖于国际领先的自研 AI Infra (AI基础设施) 能力,零一万物成功将最新旗舰模型 Yi-Lightning 的 API 价格降至极低水平,每百万 token 仅收费 0.99 元,直逼行业最低价,助力开发者与企业客户轻松实现优质性价比的 “SOTA 大模型自由”,真正做到又快、又好、又便宜。

国内模型首度超越 GPT-4o!零一万物新旗舰模型 Yi-Lightning 排名世界第六、中国第一,致力以顶尖模型赋能千行百业

Yi 大模型开放平台:https://platform.lingyiwanwu.com/

经过一年多的沉淀,零一万物的“模应一体”战略在 ToB 领域内有了更直观的体现。目前,零一万物已推出了 AI 2.0 数字人解决方案、全行业解决方案、AI Infra 等产品及服务,面向 B/G 端客户构建起了从定制模型到专有应用搭建的一整套解决方案。

以模型性能更强、推理速度更快、训推成本更低的 Yi-Lightning 为基础,以 SFT(监督式微调)和 AI infra 能力为辅助,相信零一万物的 ToB 业务的产品质量与性价比将进一步提升,为各行各业提供切中痛点的全行业 To B 解决方案,加速实现以 AI 智赋千行百业。

AI 2.0 数字人解决方案:部署成本更低,互动全天候,有客户 GMV 增幅达 170%

10月16日,零一万物也首度对媒体公布了全新 ToB 战略下的首发行业应用产品 AI 2.0 数字人,聚焦零售和电商等场景,将最新版旗舰模型 Yi Lightning 实践于具体行业解决方案。基于以 Yi Lightning 模型为代表的 Yi 模型,零一万物搭建起了包含角色大模型、直播声音大模型、电商话术大模型在内的一整套专用模型基座,形成了与 AI 1.0 时代完全不同的数字人解决方案。

其中,角色大模型为零一万物 AI 2.0 数字人提供了动作训练、表情生成等能力,直播声音大模型使得数字人迈过了多国语言和情感表达的门槛,电商话术大模型则成为了数字人主播的“AI 大脑”,负责链接知识库,完成智能对话。

国内模型首度超越 GPT-4o!零一万物新旗舰模型 Yi-Lightning 排名世界第六、中国第一,致力以顶尖模型赋能千行百业

得益于零一万物在文本理解、多模态方面的模型能力,搭载角色大模型与直播声音大模型的零一万物 AI 2.0 数字人在形象更为逼真、声音也更贴合垂直场景的需求。

但与AI 1.0 时代的数字人相比最为本质的不同点在于,零一万物为 AI 2.0 数字人配备了“AI 大脑”——在电商话术大模型加持下,数字人能够基于模型自有知识库与外接数据库,自主生成直播话术,也能够快速、精准地识别直播弹幕的互动意图,给出对应解答。

Yi-Lightning 模型接入后,零一万物 AI 2.0 数字人对弹幕意图的识别更加精准、生成话术更自然、能够一步到位完成促单。随着与客户合作进程的不断深入,基于模型本身强大的函数调用能力,零一万物 AI 2.0 数字人还能够丝滑地与客户原有营销、物流系统互动,实现从引流到下单的全流程陪护。

Yi-Lightning数字人对比视频

除直播外,零一万物也为数字人客户准备了 AI 2.0 门店短视频解决方案。客户可通过极简流程,随时生成、超低成本和高品质营销视频视频,解决了传统真人短视频的成本和制作周期问题。短视频与直播内容相互配合,为商品提供持续曝光,提升转化率。

目前,零一万物的 AI 2.0 数字人解决方案涵盖了AI伴侣、IP形象、电商直播、办公会议等多个应用场景,合作案例包括全国某著名餐饮连锁、某头部酒旅类客户、全国某知名水果连锁店等,均取得了显著的GMV提升。其中某头部酒旅企业在接入 Yi-Lightning 全新加持的数字人直播后,GMV 较此前上升 170%

值得一提的是,由于 Yi-Lightning 本身的推理成本已逼近行业“地板价”,接入 Yi-Lightning 后的 AI 2.0 数字人解决方案的价格自然也极具性价比。一面开源、一面降本,两方结合之下为客户带来实际可见的、有毛利的GMV增长。这也证明了,以大模型为代表的 AI 2.0 技术浪潮开始落地,走进千行百业,为各个领域带来了新的增长可能性。

从电商、物流到全行业,打造赋能各行各业的专家大模型

在过去,模型性能与推理成本之间的投入产出比一直是企业客户在选择大模型时必然要考虑的因素。然而,随着Yi-Lightning的推出,其定价策略无疑是一剂强心针——在 Yi 大模型开放平台(https://platform.lingyiwanwu.com/)上,Yi-Lightning 已上线 每百万 token 仅需 0.99 元,直逼行业最低价,以极致性价比助力支持开发者与企业客户轻松实现 SOTA 大模型自由。

但在当前的市场需求下,仅仅为企业客户提供标准化模型还远远不够。审视各垂直行业的核心业务流程就会发现,尽管基座模型具备一定的能力,但其在帮助核心业务提效方面仍显不足。这一现状制约了模型在客户核心业务场景中的深度融合,也限制了大模型的商业价值。

因此,基于企业不同的业务场景,零一万物的全行业解决方案,除基座模型外还会搭配有 RAG、Function Calling 等等一系列能力过硬、实用性经过检验的工具 。在8月份的伯克利权威评测榜单 Berkeley Function-Calling Leaderboard (BFCL) 总榜上,搭载函数调用功能的 Yi-Large(FC) 排名世界第六、中国第一(2024年8月5日数据)。另一方面,零一万物也会精心挑选愿意拥抱生成式 AI 的企业客户,双方深度共建私有化定制模型。

Yi-Lightning 正式发布前,零一万物已经基于性能优异的视觉模型 Yi-Vision,与飞书合力为线下零售场景打造了成熟的智能巡检产品;同时还基于千亿参数语言模型 Yi-Large,与某头部医疗机构合作搭建了在线问诊平台;Yi 系列模型,也接入了包含 360 AI助手、沉浸式翻译在内的知名应用。

截止目前,零一万物 ToB 解决方案已在零售、医疗、教育、物流等领域内完成落地,涉及 AI 搜索、AI 生产力工具、AI 智能巡检等应用场景。自今年6月开始,零一万物相继宣布与阿里云、360、顺丰科技、飞书、钉钉、钛动科技等头部企业达成合作,已积累起了一批包含世界 500 强企业在内的付费企业客户。

Yi-Lightning 正式接入后,无论是标准化的全行业解决方案,还是更聚焦垂直领域的私有化定制业务,都迎来了更多可能性。

新旗舰模型 Yi-Lightning 采用了 MoE 混合专家模型架构,由多个专家模型(Experts)构成。这一模型结构本身在模型交付方面就存在着效率优势——基于垂直领域的特殊需求,可以快速完成对 专家模型(Experts)的重新训练,快速完成交付。

同时, Yi-Lightning 在训练过程中还在模型训练过程中做了新的尝试。这些尝试使得零一万物能够为客户提供更高起点的标准化基座模型,也能够根据客户场景需求,更快速、更高效、也更低成本地完成定制模型训练。

1.独特的混合注意力机制(Hybrid Attention)使得模型在保证了在处理长序列数据的高性能表现的同时,大大降低了推理成本;

2.采用了动态 Top-P 路由机制,这意味着 Yi-Lightning 能够根据任务的难度动态自动选择最合适的专家网络组合,更好地平衡推理成本和模型性能。

3.在模型预训练阶段,零一万物团队还积累了丰富的多阶段训练方法论。相较于传统的单阶段训练,这样的训练方法可以保证,后续对模型进行专有化时能够进行快速、低成本的重新训练。

模型+AI 基础设施+应用缺一不可,以大模型为引擎打造新质生产力

进入 2024 年来,中国大模型行业从狂奔进入到了“长跑阶段”。从技术侧和产业侧都引发了行业的进一步思考。

从技术发展上看,在算力受限的情况下,中国基座模型的研发能力处在世界什么身位,如何追赶国外顶尖大模型等问题引发外界关注。甚至一度传出“中国可以不用再研发预训练基座模型”的说法。

从产业落地上看,如何让大模型技术走出实验室赋能千行百业,成为驱动实体经济增长的新质生产力,加速AI落地走入实业助力新一波经济增长,也成为各方关注点。

零一万物此次推出的 Yi-Lightning 模型一经亮相,就在世界权威的盲测榜单 LMSYS 中击败了 OpenAI 今年五月发布的 GPT-4o。中国大模型首度超越性能极佳的 GPT-4o 对于我国人工智能发展是个里程碑事件,彰显了中国团队所孕育的强大技术实力。

零一万物同时推出的面向企业客户的两款解决方案,不仅又快又好,而且能把世界顶尖模型的价格做到白菜价,在实践案例上有效提升了企业用户的营收。

这些都彰显了中国大模型公司“模型+AI 基础设施+应用”“三位一体”全栈式布局的必要性和重要性,这不仅构筑大模型企业自身的技术护城河,确保自身模型核心技术的安全性,也是把创新技术产业化,赋能实体经济的有益的探索。未来,零一万物将继续夯实“三位一体”的布局,为推动中国大模型成为驱动千行百业的新质生产力贡献自己的力量。

零一万物 CEO 李开复博士表示,Yi-Lightning 的出色表现是零一万物“模基共建”战略落地的又一里程碑。作为兼具性能与性价比的新旗舰模型,Yi-Lightning 也将成为零一万物探索“模应一体”的重要基石。中国大模型产业进入到了“耐力赛”阶段,如何让大模型赋能千行百业,提升企业新质生产力是一个重要的命题。这不仅将牵涉到“大模型+行业”的未来发展方向,甚至会影响世界的创新版图。在这一阶段,零一万物会坚持“模型+AI 基础设施+应用”三位一体的全栈式布局,以国际 SOTA 的基座模型为基础,积极在 ToB 企业级解决方案上探索 TC-PMF,助力中国打造以大模型为引擎的新质生产力。