API-Endpunkte
Textgenerierung
| Endpunkt | Beschreibung | Am besten für |
|---|---|---|
/v1/chat/completions | OpenAI-kompatible Chat-API | Konversationsanwendungen, OpenAI SDK-Nutzer |
/v1/messages | Anthropic-kompatible Messages-API | Claude Code, LangChain Anthropic, Anthropic SDK-Nutzer |
/v1/responses | Strukturierte Ausgabe-API für agentenbasierte Workflows | Coding-Agenten, Tool-Aufrufe, mehrstufiges Reasoning |
Embeddings
| Endpunkt | Beschreibung | Am besten für |
|---|---|---|
/v1/embeddings | Vektor-Embeddings generieren | RAG, semantische Suche, Klassifizierung |
Audio
| Endpunkt | Beschreibung | Am besten für |
|---|---|---|
/v1/audio/transcriptions | Audio zu Text transkribieren | Spracherkennung, Meeting-Transkription |
/v1/audio/translations | Audio ins Englische übersetzen | Mehrsprachige Audioverarbeitung |
Infercom Inference Service
Die Code-Beispiele in dieser API-Referenz enthalten die spezifischen URLs für die Entwicklung mit Infercom Inference Service.Modell-Souveränitäts-Metadaten
Der/v1/models-Endpunkt unterstützt einen ?verbose=true-Abfrageparameter, der detaillierte Metadaten für jedes Modell zurückgibt, einschließlich Souveränitätsinformationen. Verwenden Sie das Feld sn_metadata.region, um festzustellen, wo ein Modell gehostet wird:
"EU"— das Modell läuft auf Infercoms EU-Infrastruktur in Deutschland mit vollständiger Datensouveränität- Leer oder nicht vorhanden — das Modell ist über SambaNovas globale Infrastruktur verfügbar