Zum Hauptinhalt springen

Documentation Index

Fetch the complete documentation index at: https://docs.infercom.ai/llms.txt

Use this file to discover all available pages before exploring further.

Ratenbegrenzungen sind ein Mechanismus zur Verwaltung der Infercom API-Nutzung, um stabile Leistung und zuverlässigen Service zu gewährleisten. Sie begrenzen, wie oft jeder Benutzer die Infercom API innerhalb eines bestimmten Zeitraums aufrufen kann. Ratenbegrenzungen werden gemessen in:
  • RPM: Anfragen pro Minute (Requests per minute)
  • RPD: Anfragen pro Tag (Requests per day)
Grundlagen

Infercom Inference Service Ratenbegrenzungs-Stufen

Es gibt verschiedene Ratenbegrenzungs-Stufen, die wir anbieten:
  • Free Tier: Wird angewendet, wenn keine Zahlungsmethode mit Ihrem Konto verknüpft ist
  • Developer Tier: Wird angewendet, wenn eine Zahlungsmethode mit Ihrem Konto verknüpft ist
  • Enterprise Tier: Bitte kontaktieren Sie unser Vertriebsteam für unsere Enterprise-Tier-Ratenbegrenzungspläne
Besuchen Sie die Abrechnungsseite, um eine Zahlungsmethode mit Ihrem Konto zu verknüpfen.
Nachfolgend finden Sie unsere Developer Tier und Free Tier Ratenbegrenzungen.

Modell-Ratenbegrenzungen

EU-gehostete Modelle (souverän)
EntwicklerModell-IDRegionAnfragen pro Minute (RPM)Anfragen pro Tag (RPD)
MiniMaxMiniMax-M2.5EU8020.000
OpenAIgpt-oss-120bEU15050.000
Global Model Catalog (nicht-souverän)
EntwicklerModell-IDRegionAnfragen pro Minute (RPM)Anfragen pro Tag (RPD)
DeepSeekDeepSeek-V3.1US3015.000
DeepSeekDeepSeek-V3.2US6012.000
Googlegemma-3-12b-itJP8020.000
MetaMeta-Llama-3.3-70B-InstructUS12030.000
Höhere Limits benötigt? Enterprise-Tarife mit erhöhten RPM- und RPD-Limits sind verfügbar. Kontaktieren Sie uns unter info@infercom.ai, um Ihre Anforderungen zu besprechen.

Ratenbegrenzungs-Response-Header

Diese Header sind in jeder Antwort enthalten und geben Informationen über den aktuellen Status der Ratenbegrenzungsnutzung. RPM (Anfragen pro Minute):
  • x-ratelimit-limit-requests
    • Die maximale Anzahl an Anfragen, die pro Minute erlaubt sind.
  • x-ratelimit-remaining-requests
    • Die Anzahl der verbleibenden Anfragen in der aktuellen Minute, bevor die Ratenbegrenzung erreicht wird.
  • x-ratelimit-reset-requests
    • Zeit in Epoch-Zeit, bis das Minutenkontingent zurückgesetzt wird.
RPD (Anfragen pro Tag):
  • x-ratelimit-limit-requests-day
    • Die maximale Anzahl an Anfragen, die pro Tag erlaubt sind.
  • x-ratelimit-remaining-requests-day
    • Die Anzahl der verbleibenden Anfragen am aktuellen Tag, bevor die Ratenbegrenzung erreicht wird.
  • x-ratelimit-reset-requests-day
    • Zeit in Epoch-Zeit, bis das Tageskontingent zurückgesetzt wird.