并发调用模型API时的问题与解决方案_安卓手游网

游戏攻略

并发调用模型API时的问题与解决方案

栏目：游戏攻略日期：2024-04-09 作者：游戏资讯

目前我们在公司内部的4台A10 GPU服务器上部署了ChatGLM3开源模型，并对官方默认的web_demo和api_demo进行重新设计，以支持H5和安卓两个客户端的调用。然而，我们发现了不能并发访问的问题。

在安卓与H5同时调用ChatGLM的API接口时，其中一个客户端的返回是正常的，而另一个客户端返回却是乱码（解码后是空数据），同时模型报错。报错内容与问题请看具体的 issue 。

官方回复显示了问题的根源：

我们尝试了在多卡上部署模型，比如3卡，发现可以支持3个以下的用户调用，但再多就不行了。

由于非AI相关科班出身也不是专门做这个的，因此一下子还有点棘手；后来在智谱AI开放平台的使用指南-速率限制指南一文中，发现其支持并发调用，只是说有并发数限制。因此我分析来说，应该是放出来的模型与开放平台上的模型有一定的区别，而这个区别就在于模型的并发能力。毕竟外部API调用时，最终还是调用模型内部的流式接口/非流式接口。也就是说，这个模型内部的接口并不支持并行计算。

从模型的内部来说，其是transformer神经网络结构，但其并发能力却没有这么简单，毕竟模型涉及到的计算量是巨大的。归根来说，还是transformer的并行计算能力。

LLaMA-Factory通过vllm实现了并发流式，暂时还没验证，简单看了下代码，理论上是冒得问题的。

LLaMA-Factory官方通过vllm实现了并发流式，暂时还没验证，简单看了下代码，理论上是冒得问题的。

更多详情，请见个人公众号

关键词：

上一篇：《风帆纪元》威廉斯塔德有什么交易品

下一篇：射雕手游锻炉使用方法介绍

相关资讯

射雕手游锻炉使用方法介绍

射雕手游中，想知道锻炉在哪里以及如何开启吗？在游戏中，你可以通过【匠作台】获得淬炼用的【锻炉】。接下来，让我们一起来详细了解锻...

2024-04-09
并发调用模型API时的问题与解决方案

目前我们在公司内部的4台A10 GPU服务器上部署了ChatGLM3开源模型，并对官方默认的web_demo和api_demo...

2024-04-09
《风帆纪元》威廉斯塔德有什么交易品

《风帆纪元》是一款航海经营冒险游戏，每一次航行都是“不止于航海”的探寻之旅！威廉斯塔德是游戏中的一个港口，位于欧洲北部的北欧地...

2024-04-09
《风帆纪元》不莱梅有什么交易品

《风帆纪元》是一款航海经营冒险游戏，玩家可以在游戏中进行探险和航海。游戏中有一个名为不莱梅的港口，位于德国北部，是一个重要的贸...

2024-04-09
《就我眼神好》低调上岸不要被舍友发现你在学习通关攻略

今天，我们为大家带来了《就我眼神好》中的一关攻略——低调上岸。在这一关中，你需要尽量不被舍友发现你正在学习。下面就让我们来看看...

2024-04-09
《无径之林》狩猎基础介绍

在无径之林中，狩猎基础就是在选择不同的类别武器对怪物进行最后一击，其最终多掉落的物品概率也会有所不同，主要划分了三大类别...

2024-04-08