Ratenbegrenzungsrichtlinie - Infercom Dokumentation

Ratenbegrenzungen sind ein Mechanismus zur Verwaltung der Infercom API-Nutzung, um stabile Leistung und zuverlässigen Service zu gewährleisten. Sie begrenzen, wie oft jeder Benutzer die Infercom API innerhalb eines bestimmten Zeitraums aufrufen kann. Ratenbegrenzungen werden gemessen in:

RPM: Anfragen pro Minute (Requests per minute)
RPD: Anfragen pro Tag (Requests per day)

Grundlagen

Eine Anfrage wird durch einen Aufruf unserer API definiert
Sie können entweder die RPM- oder RPD-Grenze erreichen, je nachdem, welche Sie zuerst erreichen
Sie werden in jeder Antwort über den Status Ihrer Ratenbegrenzungen informiert (siehe Ratenbegrenzungs-Response-Header für weitere Informationen)
Wenn Sie eine Ratenbegrenzung erreichen, erhalten Sie eine Fehlermeldung in Ihrer Antwort (siehe API-Fehlercodes)
Prüfen Sie die Infercom Status-Seite für Echtzeit-Plattform- und Modellverfügbarkeit

Infercom Inference Service Ratenbegrenzungs-Stufen

Es gibt verschiedene Ratenbegrenzungs-Stufen, die wir anbieten:

Free Tier: Wird angewendet, wenn keine Zahlungsmethode mit Ihrem Konto verknüpft ist
Developer Tier: Wird angewendet, wenn eine Zahlungsmethode mit Ihrem Konto verknüpft ist
Enterprise Tier: Bitte kontaktieren Sie unser Vertriebsteam für unsere Enterprise-Tier-Ratenbegrenzungspläne

Besuchen Sie die Abrechnungsseite, um eine Zahlungsmethode mit Ihrem Konto zu verknüpfen.

Nachfolgend finden Sie unsere Developer Tier und Free Tier Ratenbegrenzungen.

Modell-Ratenbegrenzungen

Developer Tier
Free Tier

EU-gehostete Modelle (souverän)

Entwickler	Modell-ID	Region	Anfragen pro Minute (RPM)	Anfragen pro Tag (RPD)
MiniMax	`MiniMax-M2.7`	EU	80	20.000
MiniMax	`MiniMax-M2.5`	EU	80	20.000
OpenAI	`gpt-oss-120b`	EU	150	50.000
Google	`gemma-4-31B-it`	EU	80	20.000
OpenAI	`Whisper-Large-v3`	EU	150	50.000
Mistral	`E5-Mistral-7B-Instruct`	EU	150	50.000

Global Model Catalog (nicht-souverän)

Entwickler	Modell-ID	Region	Anfragen pro Minute (RPM)	Anfragen pro Tag (RPD)
DeepSeek	`DeepSeek-V3.1`	US	30	15.000
DeepSeek	`DeepSeek-V3.2`	US	60	12.000
Meta	`Meta-Llama-3.3-70B-Instruct`	US	120	30.000

EU-gehostete Modelle (souverän)

Entwickler	Modell-ID	Region	Anfragen pro Minute (RPM)	Anfragen pro Tag (RPD)
MiniMax	`MiniMax-M2.7`	EU	20	20
MiniMax	`MiniMax-M2.5`	EU	20	20
OpenAI	`gpt-oss-120b`	EU	20	20
Google	`gemma-4-31B-it`	EU	20	20
OpenAI	`Whisper-Large-v3`	EU	20	20
Mistral	`E5-Mistral-7B-Instruct`	EU	20	20

Global Model Catalog (nicht-souverän)

Entwickler	Modell-ID	Region	Anfragen pro Minute (RPM)	Anfragen pro Tag (RPD)
DeepSeek	`DeepSeek-V3.1`	US	20	20
DeepSeek	`DeepSeek-V3.2`	US	20	20
Meta	`Meta-Llama-3.3-70B-Instruct`	US	20	20

Höhere Limits benötigt? Enterprise-Tarife mit erhöhten RPM- und RPD-Limits sind verfügbar. Kontaktieren Sie uns unter info@infercom.ai, um Ihre Anforderungen zu besprechen.

Ratenbegrenzungs-Response-Header

Diese Header sind in jeder Antwort enthalten und geben Informationen über den aktuellen Status der Ratenbegrenzungsnutzung. RPM (Anfragen pro Minute):

x-ratelimit-limit-requests
- Die maximale Anzahl an Anfragen, die pro Minute erlaubt sind.
x-ratelimit-remaining-requests
- Die Anzahl der verbleibenden Anfragen in der aktuellen Minute, bevor die Ratenbegrenzung erreicht wird.
x-ratelimit-reset-requests
- Zeit in Epoch-Zeit, bis das Minutenkontingent zurückgesetzt wird.

RPD (Anfragen pro Tag):

x-ratelimit-limit-requests-day
- Die maximale Anzahl an Anfragen, die pro Tag erlaubt sind.
x-ratelimit-remaining-requests-day
- Die Anzahl der verbleibenden Anfragen am aktuellen Tag, bevor die Ratenbegrenzung erreicht wird.
x-ratelimit-reset-requests-day
- Zeit in Epoch-Zeit, bis das Tageskontingent zurückgesetzt wird.

​Infercom Inference Service Ratenbegrenzungs-Stufen

​Modell-Ratenbegrenzungen

​Ratenbegrenzungs-Response-Header

Infercom Inference Service Ratenbegrenzungs-Stufen

Modell-Ratenbegrenzungen

Ratenbegrenzungs-Response-Header