Zum Hauptinhalt springen
Ratenbegrenzungen sind ein Mechanismus zur Verwaltung der Infercom API-Nutzung, um stabile Leistung und zuverlässigen Service zu gewährleisten. Sie begrenzen, wie oft jeder Benutzer die Infercom API innerhalb eines bestimmten Zeitraums aufrufen kann. Ratenbegrenzungen werden gemessen in:
  • RPM: Anfragen pro Minute (Requests per minute)
  • RPD: Anfragen pro Tag (Requests per day)
Grundlagen

Infercom Inference Service Ratenbegrenzungs-Stufen

Es gibt verschiedene Ratenbegrenzungs-Stufen, die wir anbieten:
  • Free Tier: Wird angewendet, wenn keine Zahlungsmethode mit Ihrem Konto verknüpft ist
  • Developer Tier: Wird angewendet, wenn eine Zahlungsmethode mit Ihrem Konto verknüpft ist
  • Enterprise Tier: Bitte kontaktieren Sie unser Vertriebsteam für unsere Enterprise-Tier-Ratenbegrenzungspläne
Besuchen Sie die Abrechnungsseite, um eine Zahlungsmethode mit Ihrem Konto zu verknüpfen.
Nachfolgend finden Sie unsere Developer Tier und Free Tier Ratenbegrenzungen.

Modell-Ratenbegrenzungen

EU-gehostete Modelle (souverän)
EntwicklerModell-IDRegionAnfragen pro Minute (RPM)Anfragen pro Tag (RPD)
DeepSeekDeepSeek-V3.1EU3015.000
MiniMaxMiniMax-M2.5EU8020.000
OpenAIgpt-oss-120bEU15050.000
Globale Modelle (nicht-souverän)
EntwicklerModell-IDRegionAnfragen pro Minute (RPM)Anfragen pro Tag (RPD)
AlibabaQwen3-32BGlobal306.000
AlibabaQwen3-235BGlobal306.000
DeepSeekDeepSeek-R1-0528Global6012.000
DeepSeekDeepSeek-R1-Distill-Llama-70BGlobal24048.000
DeepSeekDeepSeek-V3-0324Global6012.000
DeepSeekDeepSeek-V3.1-TerminusGlobal6012.000
DeepSeekDeepSeek-V3.2Global6012.000
MetaLlama-4-Maverick-17B-128E-InstructGlobal6012.000
MetaMeta-Llama-3.1-8B-InstructGlobal1.440288.000
MetaMeta-Llama-3.3-70B-InstructGlobal12030.000
Höhere Limits benötigt? Enterprise-Tarife mit erhöhten RPM- und RPD-Limits sind verfügbar. Kontaktieren Sie uns unter info@infercom.ai, um Ihre Anforderungen zu besprechen.

Ratenbegrenzungs-Response-Header

Diese Header sind in jeder Antwort enthalten und geben Informationen über den aktuellen Status der Ratenbegrenzungsnutzung. RPM (Anfragen pro Minute):
  • x-ratelimit-limit-requests
    • Die maximale Anzahl an Anfragen, die pro Minute erlaubt sind.
  • x-ratelimit-remaining-requests
    • Die Anzahl der verbleibenden Anfragen in der aktuellen Minute, bevor die Ratenbegrenzung erreicht wird.
  • x-ratelimit-reset-requests
    • Zeit in Epoch-Zeit, bis das Minutenkontingent zurückgesetzt wird.
RPD (Anfragen pro Tag):
  • x-ratelimit-limit-requests-day
    • Die maximale Anzahl an Anfragen, die pro Tag erlaubt sind.
  • x-ratelimit-remaining-requests-day
    • Die Anzahl der verbleibenden Anfragen am aktuellen Tag, bevor die Ratenbegrenzung erreicht wird.
  • x-ratelimit-reset-requests-day
    • Zeit in Epoch-Zeit, bis das Tageskontingent zurückgesetzt wird.