大模型应用进入深水区，模型服务从“可用”阶段迈向精细化运营阶段

拉菲娱乐2客户端

新闻动态: 拉菲娱乐2客户端介绍; 产品展示; 新闻动态

你的位置：拉菲娱乐2客户端 > 新闻动态 > 大模型应用进入深水区，模型服务从“可用”阶段迈向精细化运营阶段

发布日期：2026-02-10 22:38 点击次数：96

深圳商报·读创客户端首席记者王海荣

1 月 29 日，清程极智科技有限公司联合20余家大模型API服务商共同启动《智能、可持续大模型 API 服务生态计划》，将围绕模型服务能力评估、评测方法论建设、行业交流与成果发布等方向持续推进，推动模型 API 服务从“可用”向“好用、易用、高性价比”演进。

随着大模型应用不断深化，模型服务正从“可用”阶段迈向精细化运营阶段，评测体系、服务路由与统一管理能力被视为支撑下一阶段规模化应用的重要基础设施能力。清华大学教授郑纬民在发布会上指出，当前人工智能基础设施的核心任务正在发生变化。过去，人工智能基础设施（AI Infra）主要服务于大模型的训练与推理，解决“如何生产智能”的问题；随着模型生态不断丰富和智能体广泛应用，行业正在进入以“智能流通”为核心的新阶段，更加关注模型能力如何在真实业务中高效、稳定地被使用。

他表示，实现智能流通的关键在于智能路由能力建设，其中既包括在多模型环境下为不同任务选择最合适模型的“模型路由”，也包括在同一模型的多种应用程序编程接口（API）服务提供者之间进行性能与成本优化调度的“服务路由”。两类路由能力协同发展，将形成完整的 AI 任务分发网络，决定人工智能系统的最终效率和使用成本。

清程极智 CEO 汤雄超表示，从大模型训练与微调，到推理部署的高性价比实现，再到应用阶段对服务稳定性和使用效率的更高要求，AI Infra 的关注重点正在不断演进。他介绍，清程极智长期围绕大模型训练、推理和应用三类核心场景开展技术实践，先后推出八卦炉训练系统和赤兔推理引擎，支撑模型在多种算力环境下的高效训练与部署。针对开发者面临的模型和服务商选择难、API 碎片化、调用成本高的痛点，清程极智推出一站式大模型服务评测与 API 调用平台——AI Ping，完善大模型应用阶段的基础设施能力。

在随后举行的嘉宾分享环节，来自阿里云、中国电子信息产业发展研究院软件与集成电路评测中心的专家分享了大模型服务规模化过程中对资源统一管理与调度、工程体系化建设的关键关注点，并对人工智能产业发展及趋势进行了分析。面壁智能、知潜、HSRIM 次元陪伴项目的负责人则结合创新实践，展现了模型 API 服务在新型应用形态中的实际价值。

随着大模型 API 服务在政务、金融、工业与消费等多元场景中加速落地，行业内涌现出一批具有代表性的实践案例。人工智能工委会智算集群工作组在活动现场发布了《2025 大模型 API 服务能力》实践案例，来自阿里云百炼、百度智能云、华为云、火山方舟、腾讯云等多家平台与服务商的案例，系统展示了模型 API 服务在性能优化、成本控制与稳定运行方面的多样化探索，为行业提供了可参考的实践样本。

发布会当天，清程极智与华清普智AI孵化器（T-ONE Innovation Lab）联合发布了《2025 大模型 API 服务行业分析报告》。报告指出，在模型与服务商高度多样化的背景下，API 服务的核心竞争要素正从“价格差异”转向“交付质量”，包括响应时延、吞吐能力、稳定性与上下文支持等关键指标。同时，报告通过实证数据表明，在同一模型条件下，引入智能路由机制可在保障可用性的前提下，实现显著的性能提升与成本优化，为大模型 API 服务走向规模化、长期化使用提供了可验证的工程路径。

（备注：文章配图由受访单位提供）

举报/反馈

上一篇：豪掷290亿美元！沙特几乎“完全买下”EA

下一篇：从王者到王者荣耀世界十年情感的全新载体