Zum Hauptinhalt springen

Documentation Index

Fetch the complete documentation index at: https://docs.infercom.ai/llms.txt

Use this file to discover all available pages before exploring further.

Die Infercom API unterstützt das Anthropic Messages API-Format (/v1/messages), sodass Sie das Anthropic Python SDK und kompatible Tools mit Infercom-Modellen verwenden können. Dies ist nützlich für Anwendungen und Frameworks, die auf der Anthropic API aufbauen, wie Claude Code, LangChains Anthropic-Provider oder eigene agentenbasierte Workflows.
Das Anthropic SDK wurde für Claude-Modelle entwickelt. Bei der Verwendung mit Infercom greifen Sie über eine Anthropic-kompatible Schnittstelle auf Open-Source-Modelle (wie MiniMax, DeepSeek, Llama) zu - nicht auf Claude selbst.

Anthropic SDK installieren

pip install anthropic

Client konfigurieren

Setzen Sie die base_url auf die Infercom API und geben Sie Ihren Infercom API-Schlüssel an.
Sie haben noch keinen Infercom API-Schlüssel? Holen Sie sich Ihren auf der Seite API-Schlüssel und URLs.
import anthropic

client = anthropic.Anthropic(
    base_url="https://api.infercom.ai",
    api_key="ihr-infercom-api-schluessel"
)

Grundlegende Verwendung

Nicht-Streaming-Beispiel

import anthropic

client = anthropic.Anthropic(
    base_url="https://api.infercom.ai",
    api_key="ihr-infercom-api-schluessel"
)

message = client.messages.create(
    model="MiniMax-M2.7",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "Was ist die Hauptstadt von Deutschland?"}
    ]
)

print(message.content[0].text)

Streaming-Beispiel

import anthropic

client = anthropic.Anthropic(
    base_url="https://api.infercom.ai",
    api_key="ihr-infercom-api-schluessel"
)

with client.messages.stream(
    model="MiniMax-M2.7",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "Schreibe ein Haiku über KI."}
    ]
) as stream:
    for text in stream.text_stream:
        print(text, end="", flush=True)

System-Prompts

Verwenden Sie den system-Parameter, um dem Modell Anweisungen zu geben.
message = client.messages.create(
    model="MiniMax-M2.7",
    max_tokens=1024,
    system="Du bist ein hilfreicher Assistent, der wie ein Pirat spricht.",
    messages=[
        {"role": "user", "content": "Hallo!"}
    ]
)

Mehrteilige Konversationen

message = client.messages.create(
    model="MiniMax-M2.7",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "Mein Name ist Thomas."},
        {"role": "assistant", "content": "Freut mich, Thomas!"},
        {"role": "user", "content": "Wie ist mein Name?"}
    ]
)

Tool-Verwendung (Funktionsaufrufe)

Die Anthropic Messages API unterstützt Tool-Verwendung für Modelle mit Funktionsaufruf-Fähigkeiten.
Tool-Verwendung funktioniert mit MiniMax-M2.7, MiniMax-M2.5 und gpt-oss-120b. Andere Modelle rufen möglicherweise nicht zuverlässig Tools auf. Siehe Funktionsaufrufe für modellspezifische Hinweise.

Tools definieren

import anthropic

client = anthropic.Anthropic(
    base_url="https://api.infercom.ai",
    api_key="ihr-infercom-api-schluessel"
)

message = client.messages.create(
    model="MiniMax-M2.7",
    max_tokens=200,
    tools=[
        {
            "name": "get_weather",
            "description": "Holt das aktuelle Wetter für einen bestimmten Ort",
            "input_schema": {
                "type": "object",
                "properties": {
                    "location": {
                        "type": "string",
                        "description": "Die Stadt und das Land, z.B. München, Deutschland"
                    }
                },
                "required": ["location"]
            }
        }
    ],
    messages=[
        {"role": "user", "content": "Wie ist das Wetter in München?"}
    ]
)

print(message.content)
Wenn das Modell sich entscheidet, das Tool zu verwenden, enthält die Antwort einen tool_use-Inhaltsblock:
[
  {
    "type": "tool_use",
    "id": "call_abc123",
    "name": "get_weather",
    "input": {"location": "München, Deutschland"}
  }
]

Tool-Ergebnisse bereitstellen

Nach der Ausführung des Tools senden Sie das Ergebnis zurück, um die Konversation fortzusetzen:
message = client.messages.create(
    model="MiniMax-M2.7",
    max_tokens=200,
    tools=[
        {
            "name": "get_weather",
            "description": "Holt das aktuelle Wetter für einen bestimmten Ort",
            "input_schema": {
                "type": "object",
                "properties": {
                    "location": {"type": "string"}
                },
                "required": ["location"]
            }
        }
    ],
    messages=[
        {"role": "user", "content": "Wie ist das Wetter in München?"},
        {
            "role": "assistant",
            "content": [
                {
                    "type": "tool_use",
                    "id": "call_abc123",
                    "name": "get_weather",
                    "input": {"location": "München, Deutschland"}
                }
            ]
        },
        {
            "role": "user",
            "content": [
                {
                    "type": "tool_result",
                    "tool_use_id": "call_abc123",
                    "content": "Sonnig, 22°C"
                }
            ]
        }
    ]
)

print(message.content[0].text)

Asynchrone Verwendung

import anthropic
import asyncio

async def main():
    client = anthropic.AsyncAnthropic(
        base_url="https://api.infercom.ai",
        api_key="ihr-infercom-api-schluessel"
    )

    message = await client.messages.create(
        model="MiniMax-M2.7",
        max_tokens=1024,
        messages=[
            {"role": "user", "content": "Hallo!"}
        ]
    )
    print(message.content[0].text)

asyncio.run(main())

Verwendung mit curl

Sie können die Messages API auch direkt mit curl aufrufen:
curl https://api.infercom.ai/v1/messages \
  -H "Content-Type: application/json" \
  -H "x-api-key: ihr-infercom-api-schluessel" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "model": "MiniMax-M2.7",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Hallo!"}
    ]
  }'

Unterstützte Parameter

ParameterTypBeschreibung
modelstringErforderlich. Das zu verwendende Modell (z.B. MiniMax-M2.7)
messagesarrayErforderlich. Array von Nachrichtenobjekten mit role und content
max_tokensintegerErforderlich. Maximale Anzahl zu generierender Tokens
systemstringSystem-Prompt für das Modell
temperaturenumberSampling-Temperatur (0.0-1.0)
top_pnumberNucleus-Sampling-Parameter
top_kintegerTop-k-Sampling-Parameter
stop_sequencesarrayBenutzerdefinierte Stoppsequenzen
streambooleanStreaming-Antworten aktivieren
toolsarrayTool-Definitionen für Funktionsaufrufe
tool_choiceobjectTool-Verwendung steuern (auto, any oder spezifisches Tool)

Nicht unterstützte Funktionen

Die folgenden Anthropic-spezifischen Funktionen werden nicht unterstützt:
  • Extended Thinking (thinking-Parameter)
  • Prompt-Caching (cache_control)
  • Vision/Bildeingaben
  • PDF-Dateieingaben
  • Zitate
  • Serverseitige Tools (Websuche, Code-Ausführung)
  • Batch-API

Unterschiede zur Anthropic API

AspektAnthropicInfercom
ModelleClaude (Opus, Sonnet, Haiku)Open-Source-Modelle (MiniMax, DeepSeek, Llama, Gemma)
Base-URLhttps://api.anthropic.comhttps://api.infercom.ai
API-Schlüssel-Headerx-api-keyx-api-key (identisch)
Versions-HeaderErforderlich: anthropic-versionUnterstützt, aber optional

Wann Anthropic- vs. OpenAI-Kompatibilität verwenden

AnwendungsfallEmpfohlene API
Bestehender Anthropic SDK-CodeAnthropic Messages API (/v1/messages)
Claude Code, LangChain AnthropicAnthropic Messages API (/v1/messages)
OpenAI SDK-CodeOpenAI Chat Completions API (/v1/chat/completions)
Agentenbasierte Workflows, Coding-ToolsResponses API (/v1/responses)
Neue ProjekteBeliebig - alle drei APIs funktionieren mit denselben Modellen

Verwandte Dokumentation