> ## Documentation Index
> Fetch the complete documentation index at: https://docs.infercom.ai/llms.txt
> Use this file to discover all available pages before exploring further.

# Infercom Versionshinweise und Produktaktualisierungen

> Aktuelle Infercom-Plattform-Updates, neue Modelle, API-Änderungen und Feature-Ankündigungen. Bleiben Sie auf dem Laufenden.

## **20. Juni 2026**

**Modell-Update: Gemma 4 ersetzt Gemma 3**

* `gemma-3-12b-it` wurde entfernt und in einem einzigen Wechsel durch [`gemma-4-31B-it`](/de/models/infercomcloud-models) ersetzt. Anfragen an `gemma-3-12b-it` werden nicht mehr bedient - aktualisieren Sie Ihre Integrationen auf die Modell-ID `gemma-4-31B-it`
* Gemma 4 ist EU-gehostet auf Infercoms souveräner Infrastruktur mit vollständiger Datensouveränität, bietet ein 128k-Kontextfenster und verbesserte Leistung bei gleichzeitiger Beibehaltung der Vision-Unterstützung
* [Vision-Leitfaden](/de/features/vision) mit `gemma-4-31B-it`-Beispielen aktualisiert
* [Ratenbegrenzungen](/de/models/rate-limits) und [Veraltungen](/de/models/deprecations) aktualisiert

## **5. Juni 2026**

**Neue Modelle: Whisper-Large-v3 und E5-Mistral-7B-Instruct**

* [Whisper-Large-v3](/de/features/audio) ist jetzt für Audio-Transkription und -Übersetzung verfügbar - OpenAIs hochmodernes ASR-Modell, EU-gehostet mit vollständiger Datensouveränität
* [E5-Mistral-7B-Instruct](/de/features/embeddings) ist jetzt für die Generierung von Embeddings verfügbar - hochwertige Vektordarstellungen für RAG-, Such- und Klassifizierungs-Workflows
* Beide Modelle laufen auf EU-souveräner Infrastruktur, keine Daten verlassen die EU-Gerichtsbarkeit
* [Ratenbegrenzungen](/de/models/rate-limits) für beide Modelle aktualisiert
* [Modellübersicht](/de/models/infercomcloud-models) mit neuen Embedding- und Audio-Modell-Abschnitten aktualisiert

## **24. Mai 2026**

**Anthropic SDK-Kompatibilität**

* Neuer `/v1/messages`-Endpunkt für Anthropic SDK-Kompatibilität
* Verwenden Sie das Anthropic Python SDK mit Infercom-Modellen - ändern Sie nur die Base-URL
* Unterstützt Streaming, System-Prompts, mehrteilige Konversationen und Tool-Verwendung
* [Dokumentation](/de/features/anthropic-compatibility)

## **15. Mai 2026**

**Responses API**

* Neuer `POST /v1/responses` Endpunkt für agentenbasierte Workflows - unterstützt Function Tools, Streaming und Reasoning-Effort-Steuerung
* Kompatibel mit OpenAI Responses API Standard
* Unterstützte Modelle: `MiniMax-M2.5`, `gpt-oss-120b`
* [Dokumentation](/de/features/responses-api)

**Modell-Update**

* `gemma-3-12b-it` auf EU-souveräne Infrastruktur verschoben - erstes vision-fähiges Modell mit vollständiger EU-Datensouveränität
* [Vision-Leitfaden](/de/features/vision)

**Neue Integration**

* [Codex CLI](/de/agentic-coding/codex) jetzt über Responses API unterstützt
* [Cline](/de/agentic-coding/cline) und [OpenCode](/de/agentic-coding/opencode) Anleitungen mit Plan/Execute-Konfigurationsmuster aktualisiert

## **24. April 2026**

**Modellkatalog-Updates**

* **DeepSeek-V3.1 in Global Model Catalog verschoben**: Wird jetzt via Proxy (US-Region) statt EU-gehosteter Infrastruktur bereitgestellt
* **gemma-3-12b-it hinzugefügt**: Googles Gemma 3 12B-Modell jetzt über den Global Model Catalog verfügbar (Japan). Dies ist das erste **vision-fähige** Modell auf Infercom — siehe [Vision-Leitfaden](/de/features/vision)
* **DeepSeek-V3.2 Kontextlänge korrigiert**: Von 8k auf 32k Tokens aktualisiert
* **EU-gehostete Modelle**: MiniMax-M2.5 und gpt-oss-120b bleiben als souveräne EU-Optionen

**Dokumentations-Updates**

* [Vision-Leitfaden](/de/features/vision) mit gemma-3-12b-it-Beispielen und Souveränitätshinweis aktualisiert
* Fähigkeiten-Spalte zu [Modellübersicht](/de/models/infercomcloud-models)-Tabellen hinzugefügt

## **6. April 2026**

**Neue Dokumentation: Agentic Coding**

* [Agentic Coding](/de/agentic-coding/overview)-Bereich mit Anleitungen für 9 KI-Coding-Tools hinzugefügt
* **Terminal-Tools:** [Aider](/de/agentic-coding/aider), [OpenCode](/de/agentic-coding/opencode), [Goose](/de/agentic-coding/goose), [Warp](/de/agentic-coding/warp)
* **IDE-Tools:** [Cursor](/de/agentic-coding/cursor), [Cline](/de/agentic-coding/cline), [Continue](/de/agentic-coding/continue), [Windsurf](/de/agentic-coding/windsurf)
* **Fortgeschritten:** [Claude Code via ccproxy](/de/agentic-coding/claude-code)
* [Tool-Vergleichsanleitung](/de/agentic-coding/choosing-a-tool) - Empfehlungen zur Tool-Auswahl

## **3. April 2026**

**Global Model Catalog optimiert**

* Global Model Catalog auf 2 Modelle reduziert: `Meta-Llama-3.3-70B-Instruct` (128k) und `DeepSeek-V3.2` (8k)
* 8 Modelle eingestellt: Qwen3-32B, Qwen3-235B, DeepSeek-R1-0528, DeepSeek-R1-Distill-Llama-70B, DeepSeek-V3-0324, DeepSeek-V3.1-Terminus, Llama-4-Maverick-17B-128E-Instruct, Meta-Llama-3.1-8B-Instruct
* Siehe [Veraltungen](/de/models/deprecations) für Migrationsinformationen
* MiniMax-M2.5 Kontextlänge auf 160k korrigiert (war fälschlicherweise als 164k gelistet)

## **12. März 2026**

**Modellaktualisierung: MiniMax M2.5 ersetzt Meta-Llama-3.3-70B-Instruct**

* [MiniMax M2.5](/de/models/infercomcloud-models) ist jetzt als EU-gehostetes Modell auf Infercoms souveräner Infrastruktur in Deutschland verfügbar
* Meta-Llama-3.3-70B-Instruct wurde eingestellt und von der Plattform entfernt. Siehe [Veraltungen](/de/models/deprecations) für Migrationsinformationen
* [Ratenbegrenzungen](/de/models/rate-limits) für MiniMax M2.5 aktualisiert

## **27. Februar 2026**

**Global Model Catalog Launch**

* 9 neue Modelle über den [Global Model Catalog](/de/models/infercomcloud-models#global-model-catalog) verfügbar, darunter DeepSeek-R1-0528, Qwen3-235B, Llama-4-Maverick und weitere
* EU-gehostete und global geroutete Modelle sind jetzt klar getrennt in der [Modellübersicht](/de/models/infercomcloud-models)
* [Ratenbegrenzungen](/de/models/rate-limits) für alle 12 Modelle über Free und Developer Tier aktualisiert
* API `sn_metadata` gibt jetzt `is_external`- und `region`-Felder für alle Modelle zurück

## **14. Februar 2026**

**Neue Dokumentation**

* [Performance & Latenz](/de/features/performance)-Leitfaden hinzugefügt mit Themen zu Connection Pooling, Performance-Metadaten in der API-Antwort, Streaming-Optimierung und Best Practices zur Latenzreduzierung

## **5. Februar 2026**

**Dokumentation für Global Model Catalog**

* Dokumentation für den [Global Model Catalog](/de/models/infercomcloud-models#global-model-catalog) hinzugefügt, mit EU-gehosteten und global gerouteten Modellen
* Dokumentiert wie man [Modellregionen identifiziert](/de/models/infercomcloud-models#modellregionen-identifizieren) über die API (`sn_metadata.region`) und den Playground
* [API-Referenz](/de/api-reference/overview#modell-souveränitäts-metadaten) mit `sn_metadata`-Schema und `?verbose=true`-Abfrageparameter aktualisiert
* Souveränitätsaussagen in der Dokumentation überprüft und für den Global Model Catalog präzisiert

## **23. Januar 2026**

**Modell-Update**

* DeepSeek-Modell von `DeepSeek-V3-0324-cb` auf `DeepSeek-V3.1` mit erweitertem 128k-Kontextfenster aktualisiert
* Das vorherige Modell wurde als veraltet markiert und ist auf der [Veraltungsseite](/de/models/deprecations) aufgeführt
* [Ratenbegrenzungen](/de/models/rate-limits) für alle Modelle aktualisiert

## **13. Januar 2026**

**Neu**

* [Hugging Face Spaces Chat-Demo](https://huggingface.co/spaces/infercomai/chat) - Interaktiver Chat mit Modellauswahl und Echtzeit-Performance-Metriken

**Verbesserungen**

* Dokumentationsbereinigung und Link-Korrekturen

## **30. Dezember 2025**

Aktualisierung des Modellkatalogs mit den aktuell verfügbaren Modellen auf Infercom Inference Service. Die [Modellliste](/de/models/infercomcloud-models) und die [Ratenbegrenzungen](/de/models/rate-limits) wurden entsprechend aktualisiert.

## **17. November 2025**

Wir freuen uns, die Einführung des Infercom-Dokumentationsportals bekannt zu geben. Diese umfassende Dokumentation wurde auf Basis der SambaNova-Dokumentation (Stand: 7. Oktober 2025) erstellt und für die EU-souveräne AI-Inferenz-Plattform von Infercom angepasst.

**Wichtigste Funktionen**

* Vollständige API-Referenzdokumentation mit OpenAI-kompatiblen Endpunkten.
* Entwicklerhandbücher für die Integration mit der Infercom-Inferenz-Plattform.
* Modellkatalog- und Konfigurationsdokumentation für alle unterstützten Modelle.
* Plattformarchitektur- und Bereitstellungsanleitungen.
* Anwendungsbeispiele in **Python** und **TypeScript**, unterstützt durch OpenAI-kompatible SDKs.

Die gesamte Dokumentation wird kontinuierlich aktualisiert, um Infercom-spezifische Funktionen, europäische Datensouveränitätsfähigkeiten und Plattformverbesserungen widerzuspiegeln, sobald diese verfügbar werden.