Zum Hauptinhalt springen
Infercom Cloud unterstützt derzeit die folgenden Modelle für alle Entwickler- und Unternehmenskonten:

Produktionsmodelle

Produktionsmodelle sind für den Einsatz in Produktionsumgebungen vorgesehen und erfüllen unsere hohen Standards für Geschwindigkeit und Qualität.
EntwicklerModell-IDKontextlängeAnsehen auf Hugging FaceModellbewertungsbericht
DeepSeek
DeepSeek-R1-0528128k TokensModellkarteLatticeFlow AI-Bericht
DeepSeek-V3-0324128k TokensModellkarteLatticeFlow AI-Bericht
DeepSeek-V3.1128k TokensModellkarte
DeepSeek-R1-Distill-Llama-70B128k TokensModellkarte
Meta
Meta-Llama-3.3-70B-Instruct128k TokensModellkarteLatticeFlow AI-Bericht

Vorschaumodelle

Vorschaumodelle sind nur für Evaluierungszwecke und Entwicklerexperimente gedacht und sollten nicht in Produktionsumgebungen verwendet werden. Diese Modelle haben begrenzte Kapazität und können kurzfristig entfernt werden.
EntwicklerModell-IDKontextlängeMax. Dateigröße1Ansehen auf Hugging FaceModellbewertungsbericht
Meta
Llama-4-Maverick-17B-128E-Instruct128k TokensBis zu 5 Bilder, je ≤ 20 MBModellkarteLatticeFlow AI-Bericht
OpenAI
gpt-oss-120b128k TokensModellkarte
Whisper-Large-v3N/A25MBModellkarte
Qwen
Qwen3-32B8k TokensN/AModellkarteLatticeFlow AI-Bericht
Tokyotech-llm
Llama-3.3-Swallow-70B-Instruct-v0.416k TokensN/AModellkarte
Other
E5-Mistral-7B-Instruct4k TokensN/AModellkarte
1Nur für Audiomodelle.