> ## Documentation Index
> Fetch the complete documentation index at: https://docs.infercom.ai/llms.txt
> Use this file to discover all available pages before exploring further.

# Infercom Inference Service Modelle Übersicht und Spezifikationen

> Alle verfügbaren Modelle auf Infercom. EU-gehostete und Global-Catalog-Modelle mit Kontextlängen, Funktionen und Rate Limits.

Der Infercom Inference Service bietet Zugang zu einer breiten Auswahl an KI-Modellen über den **Global Model Catalog**. Modelle sind in zwei Kategorien verfügbar: **EU-gehostete** Modelle, die auf Infercoms souveräner Infrastruktur in Deutschland laufen, sowie zusätzliche Modelle über globale Infrastruktur.

## EU-gehostete Modelle

Die folgenden Modelle laufen auf Infercoms EU-Infrastruktur in Deutschland. Für diese Modelle findet die gesamte Datenverarbeitung innerhalb der EU statt — keine Daten verlassen die EU-Gerichtsbarkeit, mit vollständiger DSGVO-Konformität und ohne Zugriff nach US CLOUD Act.

### Textgenerierungsmodelle

| **Entwickler** | **Modell-ID**    | **Kontextlänge** | **Fähigkeiten** | **Region** | **HF Link**                                                  |
| :------------- | :--------------- | :--------------- | :-------------- | :--------- | :----------------------------------------------------------- |
| **MiniMax**    | `MiniMax-M2.7`   | 192k Tokens      | Text, Reasoning | EU         | [Modellkarte](https://huggingface.co/MiniMaxAI/MiniMax-M2.7) |
| **MiniMax**    | `MiniMax-M2.5`   | 160k Tokens      | Text, Reasoning | EU         | [Modellkarte](https://huggingface.co/MiniMaxAI/MiniMax-M2.5) |
| **OpenAI**     | `gpt-oss-120b`   | 128k Tokens      | Text, Reasoning | EU         | [Modellkarte](https://huggingface.co/openai/gpt-oss-120b)    |
| **Google**     | `gemma-4-31B-it` | 128k Tokens      | Text, Vision    | EU         | [Modellkarte](https://huggingface.co/google/gemma-4-31b-it)  |

### Embedding-Modell

| **Entwickler** | **Modell-ID**            | **Kontextlänge** | **Fähigkeiten** | **Region** | **HF Link**                                                           |
| :------------- | :----------------------- | :--------------- | :-------------- | :--------- | :-------------------------------------------------------------------- |
| **Mistral**    | `E5-Mistral-7B-Instruct` | 4k Tokens        | Embeddings      | EU         | [Modellkarte](https://huggingface.co/intfloat/e5-mistral-7b-instruct) |

### Audio-Modell

| **Entwickler** | **Modell-ID**      | **Max. Audiolänge** | **Fähigkeiten**            | **Region** | **HF Link**                                                   |
| :------------- | :----------------- | :------------------ | :------------------------- | :--------- | :------------------------------------------------------------ |
| **OpenAI**     | `Whisper-Large-v3` | 25 MB               | Transkription, Übersetzung | EU         | [Modellkarte](https://huggingface.co/openai/whisper-large-v3) |

## Global Model Catalog

Zusätzlich zu den EU-gehosteten Modellen bietet der Infercom Inference Service über den Global Model Catalog Zugang zu einer breiteren Auswahl an Modellen. Modelle, die nicht in unseren EU-Rechenzentren gehostet sind, werden über globale Infrastruktur bereitgestellt. Die Hosting-Region jedes Modells können Sie jederzeit über die API oder den Playground prüfen.

<Note>
  Jedes Modell ist eindeutig mit seiner Hosting-Region gekennzeichnet — sowohl in der API-Antwort als auch im Playground. Sie wissen immer, wo Ihre Daten verarbeitet werden.
</Note>

| **Entwickler** | **Modell-ID**                 | **Kontextlänge** | **Region** | **Fähigkeiten** | **HF Link**                                                             |
| :------------- | :---------------------------- | :--------------- | :--------- | :-------------- | :---------------------------------------------------------------------- |
| **DeepSeek**   | `DeepSeek-V3.1`               | 128k Tokens      | US         | Text, Reasoning | [Modellkarte](https://huggingface.co/deepseek-ai/DeepSeek-V3.1)         |
| **DeepSeek**   | `DeepSeek-V3.2`               | 32k Tokens       | US         | Text, Reasoning | [Modellkarte](https://huggingface.co/deepseek-ai/DeepSeek-V3.2)         |
| **Meta**       | `Meta-Llama-3.3-70B-Instruct` | 128k Tokens      | US         | Text            | [Modellkarte](https://huggingface.co/meta-llama/Llama-3.3-70B-Instruct) |

Siehe [Modellregionen identifizieren](#modellregionen-identifizieren) unten, um zu prüfen, wo jedes Modell läuft.

## Modellregionen identifizieren

Sie können über die API oder den Playground feststellen, wo ein Modell gehostet wird.

### Über die API

Der `/v1/models`-Endpunkt enthält ein `sn_metadata`-Objekt für jedes Modell. Verwenden Sie das `region`-Feld, um festzustellen, wo ein Modell gehostet wird: `"EU"` für souveräne Modelle auf Infercoms EU-Infrastruktur, oder eine Nicht-EU-Region (z.B. `"US"`, `"JP"`) für Modelle auf globaler Infrastruktur.

Verwenden Sie den `?verbose=true`-Abfrageparameter, um detaillierte Modell-Metadaten einschließlich Souveränitätsinformationen abzurufen:

<CodeGroup>
  ```bash cURL theme={null}
  curl -s "https://api.infercom.ai/v1/models?verbose=true" \
    -H "Authorization: Bearer $INFERCOM_API_KEY" | \
    jq '.data[] | {id, region: .sn_metadata.region}'
  ```

  ```python Python theme={null}
  from openai import OpenAI
  import requests

  # Verwendung von requests für Metadaten-Inspektion
  headers = {"Authorization": f"Bearer {api_key}"}
  response = requests.get(
      "https://api.infercom.ai/v1/models?verbose=true",
      headers=headers
  )

  for model in response.json()["data"]:
      region = model.get("sn_metadata", {}).get("region", "Global")
      print(f"{model['id']}: {region}")
  ```
</CodeGroup>

**Beispielantwort für ein EU-gehostetes Modell:**

```json theme={null}
{
  "id": "MiniMax-M2.5",
  "object": "model",
  "sn_metadata": {
    "is_external": false,
    "region": "EU"
  }
}
```

**Beispielantwort für ein global geroutetes Modell:**

```json theme={null}
{
  "id": "DeepSeek-R1-0528",
  "object": "model",
  "sn_metadata": {
    "is_external": true,
    "region": "US"
  }
}
```

### Über den Playground

Im [Infercom Playground](https://cloud.infercom.ai) werden Regionsflaggen neben jedem Modellnamen angezeigt, sodass Sie auf einen Blick sehen können, wo jedes Modell läuft.

## Datensouveränität

<Warning>
  **EU-Souveränität gilt nur für EU-gehostete Modelle.** Bei der Nutzung von Modellen aus dem Global Model Catalog, die nicht auf EU-Infrastruktur gehostet sind, werden Anfragen auf globaler Infrastruktur außerhalb der EU verarbeitet. Prüfen Sie immer die Region des Modells, bevor Sie sensible oder regulierte Daten verarbeiten.
</Warning>

Für EU-gehostete Modelle bietet Infercom:

* **EU-Datenresidenz** — Inferenz läuft in unseren EU-Rechenzentren
* **DSGVO-Konformität** — vollständige Einhaltung der EU-Datenschutzverordnung
* **Kein US CLOUD Act-Zugriff** — Ihre Inferenzdaten unterliegen nicht der US-Gerichtsbarkeit
* **AI Act-Bereitschaft** — konzipiert für die Einhaltung des EU AI Act