- RPM: Anfragen pro Minute (Requests per minute)
- RPD: Anfragen pro Tag (Requests per day)
- Eine Anfrage wird durch einen Aufruf unserer API definiert
- Sie können entweder die RPM- oder RPD-Grenze erreichen, je nachdem, welche Sie zuerst erreichen
- Sie werden in jeder Antwort über den Status Ihrer Ratenbegrenzungen informiert (siehe Ratenbegrenzungs-Response-Header für weitere Informationen)
- Wenn Sie eine Ratenbegrenzung erreichen, erhalten Sie eine Fehlermeldung in Ihrer Antwort (siehe API-Fehlercodes)
Infercom Inference Service Ratenbegrenzungs-Stufen
Es gibt verschiedene Ratenbegrenzungs-Stufen, die wir anbieten:- Free Tier: Wird angewendet, wenn keine Zahlungsmethode mit Ihrem Konto verknüpft ist
- Developer Tier: Wird angewendet, wenn eine Zahlungsmethode mit Ihrem Konto verknüpft ist
- Enterprise Tier: Bitte kontaktieren Sie unser Vertriebsteam für unsere Enterprise-Tier-Ratenbegrenzungspläne
Besuchen Sie die Abrechnungsseite, um eine Zahlungsmethode mit Ihrem Konto zu verknüpfen.
Modell-Ratenbegrenzungen
- Developer Tier
- Free Tier
EU-gehostete Modelle (souverän)
Globale Modelle (nicht-souverän)
| Entwickler | Modell-ID | Region | Anfragen pro Minute (RPM) | Anfragen pro Tag (RPD) |
|---|---|---|---|---|
| DeepSeek | DeepSeek-V3.1 | EU | 30 | 15.000 |
| MiniMax | MiniMax-M2.5 | EU | 80 | 20.000 |
| OpenAI | gpt-oss-120b | EU | 150 | 50.000 |
| Entwickler | Modell-ID | Region | Anfragen pro Minute (RPM) | Anfragen pro Tag (RPD) |
|---|---|---|---|---|
| Alibaba | Qwen3-32B | Global | 30 | 6.000 |
| Alibaba | Qwen3-235B | Global | 30 | 6.000 |
| DeepSeek | DeepSeek-R1-0528 | Global | 60 | 12.000 |
| DeepSeek | DeepSeek-R1-Distill-Llama-70B | Global | 240 | 48.000 |
| DeepSeek | DeepSeek-V3-0324 | Global | 60 | 12.000 |
| DeepSeek | DeepSeek-V3.1-Terminus | Global | 60 | 12.000 |
| DeepSeek | DeepSeek-V3.2 | Global | 60 | 12.000 |
| Meta | Llama-4-Maverick-17B-128E-Instruct | Global | 60 | 12.000 |
| Meta | Meta-Llama-3.1-8B-Instruct | Global | 1.440 | 288.000 |
| Meta | Meta-Llama-3.3-70B-Instruct | Global | 120 | 30.000 |
Höhere Limits benötigt? Enterprise-Tarife mit erhöhten RPM- und RPD-Limits sind verfügbar. Kontaktieren Sie uns unter info@infercom.ai, um Ihre Anforderungen zu besprechen.
Ratenbegrenzungs-Response-Header
Diese Header sind in jeder Antwort enthalten und geben Informationen über den aktuellen Status der Ratenbegrenzungsnutzung. RPM (Anfragen pro Minute):x-ratelimit-limit-requests- Die maximale Anzahl an Anfragen, die pro Minute erlaubt sind.
x-ratelimit-remaining-requests- Die Anzahl der verbleibenden Anfragen in der aktuellen Minute, bevor die Ratenbegrenzung erreicht wird.
x-ratelimit-reset-requests- Zeit in Epoch-Zeit, bis das Minutenkontingent zurückgesetzt wird.
x-ratelimit-limit-requests-day- Die maximale Anzahl an Anfragen, die pro Tag erlaubt sind.
x-ratelimit-remaining-requests-day- Die Anzahl der verbleibenden Anfragen am aktuellen Tag, bevor die Ratenbegrenzung erreicht wird.
x-ratelimit-reset-requests-day- Zeit in Epoch-Zeit, bis das Tageskontingent zurückgesetzt wird.