OpenAI 怎么解决 429:“要求过量”毛病?

原创 admin  2023-04-14 21:05  阅读 37 次

速率限制毛病(“太多要求”、“到达速率限制”)是由于到达了您组织的速率限制,即每分钟可以提交的要求和令牌的最大数量。如果到达限制,组织将没法成功提交要求,直到重置速率限制。毛病消息以下所示:

Rate limit reached for default-code-davinci-002 in organization org-exampleorgid123 on tokens per min. Limit: 10000.000000 / min. Current: 10020.000000 / min. Contact support@openai.com if you continue to have issues.

我们建议使用指数退避来处理这些毛病。指数退避意味着当遇到速率限制毛病时履行短暂的休眠,然后重试不成功的要求。如果要求依然不成功,则增加睡眠时间并重复该进程。这一直延续到要求成功或到达最大重试次数为止。

由于不成功的要求会影响您的每分钟限制,因此连续重新发送要求将不起作用。可以在较短的时间内利用速率限制 - 例如,每秒 1 个要求以限制 60 RPM - 这意味着短时间的大量要求突发也可能致使速率限制毛病。指数退避通过将要求间隔开以最小化这些毛病的频率来很好地工作。

在 Python 中,指数退避解决方案可能以下所示:

from openai.error import RateLimitErrorimport backoff@backoff.on_exception(backoff.expo, RateLimitError)def completions_with_backoff(**kwargs):response = openai.Completion.create(**kwargs)return response

(请注意:退避库是第三方工具。我们鼓励所有客户在验证其项目的任何外部代码时进行尽职调查。)

如果实行指数退避依然致使此毛病,请填写Rate Limit Increase Request。我们依然会尽快回复您。

要了解有关每种引擎类型的默许速率限制的更多信息,请参阅此处。

ChatGPT中国体验版https://go.guigege.cn

来源:https://www.huanp.com/idc/140667.html
声明:欢迎分享本文,转载请保留出处!

发表评论


表情