> ## Documentation Index
> Fetch the complete documentation index at: https://docs.infercom.ai/llms.txt
> Use this file to discover all available pages before exploring further.

# Infercom Modell-Ratenbegrenzungen

> Rate Limits nach Modell und Tarif für die Infercom API. Anfragen pro Minute, Token pro Minute und Umgang mit Rate-Limit-Fehlern.

Ratenbegrenzungen sind ein Mechanismus zur Verwaltung der Infercom API-Nutzung, um stabile Leistung und zuverlässigen Service zu gewährleisten. Sie begrenzen, wie oft jeder Benutzer die Infercom API innerhalb eines bestimmten Zeitraums aufrufen kann.

Ratenbegrenzungen werden gemessen in:

* RPM: Anfragen pro Minute (Requests per minute)
* RPD: Anfragen pro Tag (Requests per day)

Grundlagen

* Eine **Anfrage** wird durch einen Aufruf unserer API definiert
* Sie können entweder die RPM- oder RPD-Grenze erreichen, je nachdem, welche Sie zuerst erreichen
* Sie werden in jeder Antwort über den Status Ihrer Ratenbegrenzungen informiert ([siehe Ratenbegrenzungs-Response-Header für weitere Informationen](#ratenbegrenzungs-response-header))
* Wenn Sie eine Ratenbegrenzung erreichen, erhalten Sie eine Fehlermeldung in Ihrer Antwort ([siehe API-Fehlercodes](/de/api-reference/using-the-api/api-error-codes))
* Prüfen Sie die [Infercom Status-Seite](https://status.infercom.ai) für Echtzeit-Plattform- und Modellverfügbarkeit

## Infercom Inference Service Ratenbegrenzungs-Stufen

Es gibt verschiedene Ratenbegrenzungs-Stufen, die wir anbieten:

* **Free Tier**: Wird angewendet, wenn keine Zahlungsmethode mit Ihrem Konto verknüpft ist
* **Developer Tier**: Wird angewendet, wenn eine Zahlungsmethode mit Ihrem Konto verknüpft ist
* **Enterprise Tier**: Bitte [kontaktieren Sie unser Vertriebsteam](https://infercom.ai/contact) für unsere Enterprise-Tier-Ratenbegrenzungspläne

<Info>
  Besuchen Sie die [Abrechnungsseite](https://cloud.infercom.ai/plans/billing), um eine Zahlungsmethode mit Ihrem Konto zu verknüpfen.
</Info>

Nachfolgend finden Sie unsere Developer Tier und Free Tier Ratenbegrenzungen.

### Modell-Ratenbegrenzungen

<Tabs>
  <Tab title="Developer Tier">
    **EU-gehostete Modelle (souverän)**

    | **Entwickler** | **Modell-ID**            | **Region** | **Anfragen pro Minute** (RPM) | **Anfragen pro Tag** (RPD) |
    | :------------- | :----------------------- | :--------- | :---------------------------- | :------------------------- |
    | **MiniMax**    | `MiniMax-M2.7`           | EU         | 80                            | 20.000                     |
    | **MiniMax**    | `MiniMax-M2.5`           | EU         | 80                            | 20.000                     |
    | **OpenAI**     | `gpt-oss-120b`           | EU         | 150                           | 50.000                     |
    | **Google**     | `gemma-4-31B-it`         | EU         | 80                            | 20.000                     |
    | **OpenAI**     | `Whisper-Large-v3`       | EU         | 150                           | 50.000                     |
    | **Mistral**    | `E5-Mistral-7B-Instruct` | EU         | 150                           | 50.000                     |

    **Global Model Catalog (nicht-souverän)**

    | **Entwickler** | **Modell-ID**                 | **Region** | **Anfragen pro Minute** (RPM) | **Anfragen pro Tag** (RPD) |
    | :------------- | :---------------------------- | :--------- | :---------------------------- | :------------------------- |
    | **DeepSeek**   | `DeepSeek-V3.1`               | US         | 30                            | 15.000                     |
    | **DeepSeek**   | `DeepSeek-V3.2`               | US         | 60                            | 12.000                     |
    | **Meta**       | `Meta-Llama-3.3-70B-Instruct` | US         | 120                           | 30.000                     |
  </Tab>

  <Tab title="Free Tier">
    **EU-gehostete Modelle (souverän)**

    | **Entwickler** | **Modell-ID**            | **Region** | **Anfragen pro Minute** (RPM) | **Anfragen pro Tag** (RPD) |
    | :------------- | :----------------------- | :--------- | :---------------------------- | :------------------------- |
    | **MiniMax**    | `MiniMax-M2.7`           | EU         | 20                            | 20                         |
    | **MiniMax**    | `MiniMax-M2.5`           | EU         | 20                            | 20                         |
    | **OpenAI**     | `gpt-oss-120b`           | EU         | 20                            | 20                         |
    | **Google**     | `gemma-4-31B-it`         | EU         | 20                            | 20                         |
    | **OpenAI**     | `Whisper-Large-v3`       | EU         | 20                            | 20                         |
    | **Mistral**    | `E5-Mistral-7B-Instruct` | EU         | 20                            | 20                         |

    **Global Model Catalog (nicht-souverän)**

    | **Entwickler** | **Modell-ID**                 | **Region** | **Anfragen pro Minute** (RPM) | **Anfragen pro Tag** (RPD) |
    | :------------- | :---------------------------- | :--------- | :---------------------------- | :------------------------- |
    | **DeepSeek**   | `DeepSeek-V3.1`               | US         | 20                            | 20                         |
    | **DeepSeek**   | `DeepSeek-V3.2`               | US         | 20                            | 20                         |
    | **Meta**       | `Meta-Llama-3.3-70B-Instruct` | US         | 20                            | 20                         |
  </Tab>
</Tabs>

<Info>
  **Höhere Limits benötigt?** Enterprise-Tarife mit erhöhten RPM- und RPD-Limits sind verfügbar. Kontaktieren Sie uns unter [info@infercom.ai](mailto:info@infercom.ai), um Ihre Anforderungen zu besprechen.
</Info>

## Ratenbegrenzungs-Response-Header

Diese Header sind in jeder Antwort enthalten und geben Informationen über den aktuellen Status der Ratenbegrenzungsnutzung.

**RPM (Anfragen pro Minute):**

* `x-ratelimit-limit-requests`
  * Die maximale Anzahl an Anfragen, die pro Minute erlaubt sind.
* `x-ratelimit-remaining-requests`
  * Die Anzahl der verbleibenden Anfragen in der aktuellen Minute, bevor die Ratenbegrenzung erreicht wird.
* `x-ratelimit-reset-requests`
  * Zeit in Epoch-Zeit, bis das Minutenkontingent zurückgesetzt wird.

**RPD (Anfragen pro Tag):**

* `x-ratelimit-limit-requests-day`
  * Die maximale Anzahl an Anfragen, die pro Tag erlaubt sind.
* `x-ratelimit-remaining-requests-day`
  * Die Anzahl der verbleibenden Anfragen am aktuellen Tag, bevor die Ratenbegrenzung erreicht wird.
* `x-ratelimit-reset-requests-day`
  * Zeit in Epoch-Zeit, bis das Tageskontingent zurückgesetzt wird.