在AI大模型应用突发增加,但算力成本高昂、模型商业化路径不畅已变成产业广泛挑战的背景下,一家上海初创公司提出了新的办理方案。在2025世界人工智能大会(WAIC)上,上海胜算速惠云科技有限公司(简称“胜算云”)宣布,其旨在聚合全球算力与AI模型的“超市”云业务系统正式上线试用,试图从根本上办理AI研发者与创业公司面对的核心难题。 在2025世界人工智能大会暨人工智能全球治理高级别会议的现场,胜算云创始人兼CEO周政军正式发布了其核心产品——一个集算力调度与模型业务于一体的聚合系统。该系统旨在应对当前AI产业广泛现存的几大痛点:GPU算力成本居高不下、多种大模型接口不统一致使研发复杂,另有垂直领域模型难以达成商业化变现。 胜算云领域表示,公司致力于变成“AI创业者的送水人”,其办理方案围绕四大核心功能构建,期望借此让AI革新速率加倍、模型算力成本减半。 统一API与智能路由:简化模型调用,减少研发门槛 针对研发者需求适配不同大模型接口的繁琐工作,胜算云推出了“大模型智能路由网关”。该网关给予一个统一的API密钥(Key),即可调用包含DeepSeek、Llama、豆包、通义千问、智谱清言等在内的全球逾百种主流大模型,并支撑多模态实力。 据介绍,其核心的自研“Prompt智能路由引擎”能依据顾客输入的需求、成本和任务类型,自动挑选最优性价比或最快响应的模型。胜算云称,该技术有望为研发者节省高达30%的Token消耗成本,并经过全球分布式互联网保证业务的高可用性。 “拎模入驻”:为中小型模型研发者打通商业化路径 除了调用主流大模型,怎样让自研的垂直领域模型引发价值,是大量研发者的难题。为此,胜算云推出了“拎模入驻”形式,许可模型研发者免费、迅速地将自身的模型部署到系统上。系统会自动为其生成API接口和应用页面,并采用按实际请求量计费的形式,免去了研发者预先承担高昂算力租赁成本的负担。收益可达成自动结算,旨在协助研发者将精力聚焦于模型优化本身,而非基本设施和商业化运作。 跨云弹性调度:聚合闲置算力,提升资产运用率 为从根源上办理算力成本难题,胜算云构建了一个跨云弹性算力调度互联网。该互联网聚合了来自亚马逊AWS、华为云、腾讯云、谷歌云、阿里云等多家主流云业务商的闲置GPU算力,构成一个高性能的Serverless AI弹性计算资产池。 其核心长处在于能达成秒级弹性伸缩和跨云故障自动转移,确保业务持久性。胜算云首席运作官(COO)张远遥在会上表示:“咱们的目的是让研发者专注于模型革新,而非算力焦虑。经过智能调度,咱们能将算力资产运用率提升至85%以上,综合成本可显著减少。” 构建全球算力互联网与生态联盟 胜算云透露,已与亚马逊AWS、火山引擎、谷歌云、我国移动及我国联通智算中心等国内外首要云厂商和算力中心设立了深度战略协作,以保证算力资产的稳定供应和成本长处。 “咱们就像是算力的‘交通指挥官’,将碎片化的资产疏通为标准化的业务。”公司联合创始人周雪着重,“变废为宝、降本增效是咱们的使命。” 依据规划,胜算云将来还将上线“模型买卖行当”和“协同训练社区”,进一步打通AI研发、部署至商业化的全链路。鉴于当前增加势头,公司预计在2026年,其系统的模型与算力总买卖额有望突破2亿元人民币。公司表示,将持久拓展全球算力供应互联网,并计划以算力赞助等形式,扶持更多优秀的开源模型研发者,一同构建一个开放共赢的AI生态。 |