Der Infercom Inference Service bietet Zugang zu einer breiten Auswahl an KI-Modellen über den Global Model Catalog. Modelle sind in zwei Kategorien verfügbar: EU-gehostete Modelle, die auf Infercoms souveräner Infrastruktur in Deutschland laufen, sowie zusätzliche Modelle über globale Infrastruktur.
EU-gehostete Modelle
Die folgenden Modelle laufen auf Infercoms EU-Infrastruktur in Deutschland. Für diese Modelle findet die gesamte Datenverarbeitung innerhalb der EU statt — keine Daten verlassen die EU-Gerichtsbarkeit, mit vollständiger DSGVO-Konformität und ohne Zugriff nach US CLOUD Act.
| Entwickler | Modell-ID | Kontextlänge | Region | Ansehen auf Hugging Face |
|---|
| DeepSeek | DeepSeek-V3.1 | 128k Tokens | EU | Modellkarte |
| MiniMax | MiniMax-M2.5 | 164k Tokens | EU | Modellkarte |
| OpenAI | gpt-oss-120b | 128k Tokens | EU | Modellkarte |
Global Model Catalog
Zusätzlich zu den EU-gehosteten Modellen bietet der Infercom Inference Service über den Global Model Catalog Zugang zu einer breiteren Auswahl an Modellen. Modelle, die nicht in unseren EU-Rechenzentren gehostet sind, werden über globale Infrastruktur bereitgestellt. Die Hosting-Region jedes Modells können Sie jederzeit über die API oder den Playground prüfen.
Jedes Modell ist eindeutig mit seiner Hosting-Region gekennzeichnet — sowohl in der API-Antwort als auch im Playground. Sie wissen immer, wo Ihre Daten verarbeitet werden.
| Entwickler | Modell-ID | Kontextlänge | Region | Ansehen auf Hugging Face |
|---|
| Alibaba | Qwen3-32B | 32k Tokens | Global | Modellkarte |
| Alibaba | Qwen3-235B | 64k Tokens | Global | Modellkarte |
| DeepSeek | DeepSeek-R1-0528 | 128k Tokens | Global | Modellkarte |
| DeepSeek | DeepSeek-R1-Distill-Llama-70B | 128k Tokens | Global | Modellkarte |
| DeepSeek | DeepSeek-V3-0324 | 128k Tokens | Global | Modellkarte |
| DeepSeek | DeepSeek-V3.1-Terminus | 128k Tokens | Global | Modellkarte |
| DeepSeek | DeepSeek-V3.2 | 8k Tokens | Global | Modellkarte |
| Meta | Llama-4-Maverick-17B-128E-Instruct | 128k Tokens | Global | Modellkarte |
| Meta | Meta-Llama-3.1-8B-Instruct | 16k Tokens | Global | Modellkarte |
| Meta | Meta-Llama-3.3-70B-Instruct | 128k Tokens | Global | Modellkarte |
Siehe Modellregionen identifizieren unten, um zu prüfen, wo jedes Modell läuft.
Modellregionen identifizieren
Sie können über die API oder den Playground feststellen, wo ein Modell gehostet wird.
Über die API
Der /v1/models-Endpunkt enthält ein sn_metadata-Objekt für jedes Modell. Verwenden Sie das region-Feld, um festzustellen, wo ein Modell gehostet wird: "EU" für souveräne Modelle auf Infercoms EU-Infrastruktur, oder eine Nicht-EU-Region (z.B. "US", "JP") für Modelle auf globaler Infrastruktur.
Verwenden Sie den ?verbose=true-Abfrageparameter, um detaillierte Modell-Metadaten einschließlich Souveränitätsinformationen abzurufen:
curl -s "https://api.infercom.ai/v1/models?verbose=true" \
-H "Authorization: Bearer $INFERCOM_API_KEY" | \
jq '.data[] | {id, region: .sn_metadata.region}'
Beispielantwort für ein EU-gehostetes Modell:
{
"id": "DeepSeek-V3.1",
"object": "model",
"sn_metadata": {
"is_external": false,
"region": "EU"
}
}
Beispielantwort für ein global geroutetes Modell:
{
"id": "DeepSeek-R1-0528",
"object": "model",
"sn_metadata": {
"is_external": true,
"region": "US"
}
}
Über den Playground
Im Infercom Playground werden Regionsflaggen neben jedem Modellnamen angezeigt, sodass Sie auf einen Blick sehen können, wo jedes Modell läuft.
Datensouveränität
EU-Souveränität gilt nur für EU-gehostete Modelle. Bei der Nutzung von Modellen aus dem Global Model Catalog, die nicht auf EU-Infrastruktur gehostet sind, werden Anfragen auf globaler Infrastruktur außerhalb der EU verarbeitet. Prüfen Sie immer die Region des Modells, bevor Sie sensible oder regulierte Daten verarbeiten.
Für EU-gehostete Modelle bietet Infercom:
- EU-Datenresidenz — Inferenz läuft in unseren EU-Rechenzentren
- DSGVO-Konformität — vollständige Einhaltung der EU-Datenschutzverordnung
- Kein US CLOUD Act-Zugriff — Ihre Inferenzdaten unterliegen nicht der US-Gerichtsbarkeit
- AI Act-Bereitschaft — konzipiert für die Einhaltung des EU AI Act