评论 发表
ed”,其模型输出速度达到400tokens/s,刷新当前全球大模型厂商API的速度上限。GLM-5.1高速版适用于AI编程、实时交互、商业决策、实时语音等对响应延迟要求极高的场景,现已面向智谱MaaS平台部分企业客户开放。
当前文章:http://udfvay1.mubensai.cn/tkrl/20w.html
发布时间:01:59:55
文章观点支持