Infercom Cloud Modellveraltungsprozess
Benachrichtigungen
- Produktionsmodelle: Produktionsmodelle erhalten eine Veraltungsankündigung von mindestens zwei bis drei Wochen, abhängig von Nutzungsmustern und der Verfügbarkeit neuerer Versionen.
- Vorschaumodelle: Vorschaumodelle können basierend auf Popularität und Nutzung zu Produktion aufsteigen oder veraltet werden.
Kommunikationskanäle
Alle Benachrichtigungen werden über mindestens einen der unten aufgeführten Kommunikationskanäle übermittelt:- E-Mail: Benutzer von Modellen, die zur Veraltung vorgesehen sind, werden per E-Mail benachrichtigt. Die E-Mail enthält Details zum Veraltungszeitplan und verfügbaren alternativen Modellen, einschließlich empfohlener Ersatzmodelle.
- Dokumentation: Änderungen bei Modellveraltungen werden auf dieser Dokumentationsseite aufgezeichnet, einschließlich des Veraltungsdatums und empfohlener Ersatzmodelle.
- Infercom Cloud Playground: Modelle, die zur Veraltung vorgesehen sind, werden im Infercom Cloud Playground deutlich gekennzeichnet, um Benutzer über ihre bevorstehende Außerbetriebnahme zu informieren.
Optionen zur Modellmigration
Wenn ein Modell zur Veraltung vorgesehen ist, sollten Benutzer entweder das empfohlene Ersatzmodell oder eine andere Option aus unserem Cloud-Angebot evaluieren und auswählen, die am besten zu den Anforderungen Ihrer Anwendung passt.Schritte zur Modellmigration
Um einen reibungslosen Übergang von einem veralteten Modell zu einer unterstützten Alternative zu gewährleisten, befolgen Sie bitte die folgenden Schritte:1
Veraltungsankündigung
Achten Sie auf E-Mail-Benachrichtigungen und Benachrichtigungen der Infercom Cloud-Plattform bezüglich Modellveraltungen.
2
Alternativen evaluieren
Überprüfen Sie unsere Dokumentation, um ein geeignetes Ersatzmodell aus unserem Angebot zu identifizieren und auszuwählen.
3
Implementieren und testen
Integrieren Sie Ihr gewähltes Modell in Ihre Anwendung, führen Sie erforderliche Tests durch, um die Kompatibilität sicherzustellen, und stellen Sie Ihr Modell in der Produktion bereit. Beachten Sie bei der Migration zu neuen Modellen, dass Sie möglicherweise Ihre Prompts anpassen müssen, um die Leistung zu optimieren.
4
Migration abschließen
Um Dienstunterbrechungen zu vermeiden, schließen Sie den Übergang ab, indem Sie Ihre Arbeitslast und Anwendung vollständig zu Ihrem ausgewählten alternativen Modell migrieren, bevor das geplante Veraltungsdatum erreicht ist.
Infercom Cloud Modellveraltungsprotokoll
Alle Modellveraltungen sind unten nach Datum aufgelistet, mit den neuesten Ankündigungen oben.25. Juni 2025
Am 11. Juni 2025 haben wir Benutzer über die folgenden Modellveraltungen und Kategorieänderungen informiert, die von Produktion zu Vorschau verschoben wurden. Wir empfehlen, so bald wie möglich zu den vorgeschlagenen Ersatzmodellen zu wechseln, um Unterbrechungen zu vermeiden. Modelle, die von Produktion zu Vorschau wechseln:| Modell-ID | Änderungsdatum |
|---|---|
Llama-3.3-Swallow-70B-Instruct-v0.4 | 25.06.2025 |
E5-Mistral-7B-Instruct | 25.06.2025 |
| Modell-ID | Entfernungsdatum | Empfohlener Ersatz |
|---|---|---|
Meta-Llama-3.1-405B-Instruct | 25.06.2025 | DeepSeek-V3-0324,Meta-Llama-3.3-70B-Instruct |
Meta-Llama-3.2-1B-Instruct | 25.06.2025 | Meta-Llama-3.1-8B-Instruct |
Meta-Llama-3.2-3B-Instruct | 25.06.2025 | Meta-Llama-3.1-8B-Instruct |
Meta-Llama-Guard-3-8B | 25.06.2025 | N/A |
QwQ-32B | 25.06.2025 | DeepSeek-V3-0324,Llama-4-Maverick-17B-128E-Instruct |
Qwen2-Audio-7B-Instruct | 19.06.2025 | Whisper-Large-v3 |
Llama-4-Scout-17B-16E-Instruct | 19.06.2025 | Llama-4-Maverick-17B-128E-Instruct |
14. April 2025
Am 31. März 2025 haben wir Benutzer über die folgenden Modellveraltungen informiert. Wir empfehlen, so bald wie möglich zu den vorgeschlagenen Ersatzmodellen zu wechseln, um Unterbrechungen zu vermeiden. Modelle, die veraltet werden und nur noch auf Anfrage verfügbar sind:| Modell-ID | Entfernungsdatum | Empfohlener Ersatz |
|---|---|---|
Llama-3.1-Tulu-3-405B | 14.04.2025 | DeepSeek-V3-0324,Meta-Llama-3.1-405B-Instruct |
Llama-3.1-Swallow-70B-Instruct-v0.3 | 14.04.2025 | Llama-3.3-Swallow-70B-Instruct-v0.4 |
Meta-Llama-3.1-70B-Instruct | 14.04.2025 | Meta-Llama-3.3-70B-Instruct |
Qwen2.5-72B-Instruct | 14.04.2025 | Meta-Llama-3.3-70B-Instruct,DeepSeek-V3-0324 |
Qwen2.5-Coder-32B-Instruct | 14.04.2025 | DeepSeek-V3-0324,Llama-4-Maverick-17B-128E-Instruct |
Llama-3.2-90B-Vision-Instruct | 14.04.2025 | Llama-4-Maverick-17B-128E-Instruct |
Llama-3.2-11B-Vision-Instruct | 14.04.2025 | Llama-4-Maverick-17B-128E-Instruct |