MiniMax M2.5 (Infercom)

Der führende Agentic-Effizienz-Leader: Überbrückt die Lücke zwischen der Erschwinglichkeit von Open-Weight-Modellen und der Aufgabenausführung auf Frontier-Niveau.

Jetzt ausprobieren

Über das Modell

Das MiniMax M2.5 (Infercom) ist ein Mixture-of-Experts-(MoE)-Modell mit 229B Parametern, das im Februar 2026 veröffentlicht wurde. Es nutzt eine bahnbrechende "Hybrid Attention"-Architektur (Verhältnis 7:1 von Lightning- zu SoftMax-Attention), um lineare Skalierung für lange Kontexte zu ermöglichen. Die Variante Infercom ist speziell für Antworten im Subsekundenbereich in nachrichtenbasierten autonomen Agenten optimiert.

Wichtige Modellfunktionen

Lightning Recall:
Bietet branchenführende Abrufleistung über sein riesiges Kontextfenster und eliminiert den "lost-in-the-middle"-Fehler nahezu vollständig.
Agentische Orchestrierung:
Speziell auf mehrstufige Tool-Calling-Sequenzen vortrainiert, um Aufgaben mit hoher Zuverlässigkeit auszuführen.
Geringer VRAM-Bedarf:
Trotz seiner Größe ermöglicht die Infercom-Quantisierung den Einsatz auf standardmäßiger Enterprise-Hardware mit erheblichen Durchsatzsteigerungen.

Anwendungen & Anwendungsfälle

24/7-Messaging-Agenten:
Ideal für stark frequentierte Kundensupport- und Sales-Bots, bei denen die Kosten pro Token ein entscheidender Geschäftsfaktor sind.
Full-Stack Vibe-Coding:
Optimiert für schnelles Prototyping und iterative Codegenerierung.
Persistente Speichersysteme:
Perfekt für langlebige KI-Assistenten, die sich Details aus wochenlangen Gesprächen merken müssen.

‹ GLM-4.7

MiniMax M2 ›

Empfohlene Modelle.
Basierend auf Ihren Bedürfnissen

Qwen (DeepMask)

Vielseitiges Modell mit Schlussfolgern und Werkzeugnutzung. Stark bei Dokumenten- und Bildanalyse sowie im mehrsprachigen Chat.

Qwen (DeepMask)

Vielseitiges Modell mit Schlussfolgern und Werkzeugnutzung. Stark bei Dokumenten- und Bildanalyse sowie im mehrsprachigen Chat.

Qwen3 (StackIT)

Vielseitiges Modell mit Schlussfolgerungsvermögen und Werkzeugnutzung. Stark in der Analyse von Dokumenten und Bildern sowie im mehrsprachigen Chat.

Qwen3 (StackIT)

Vielseitiges Modell mit Schlussfolgerungsvermögen und Werkzeugnutzung. Stark in der Analyse von Dokumenten und Bildern sowie im mehrsprachigen Chat.

Kimi K2 (DeepMask)

Am besten für tiefes Schlussfolgern und die Nutzung von Werkzeugen. Ideal für lange, mehrstufige Aufgaben und Dokumentenanalyse.

Kimi K2 (DeepMask)

Am besten für tiefes Schlussfolgern und die Nutzung von Werkzeugen. Ideal für lange, mehrstufige Aufgaben und Dokumentenanalyse.

Modellspezifikationen

Allgemein
Modellanbieter	MiniMax
Haupteinsatzbereiche	`Mehrstufige Agenten` `Effizientes RAG` `Wissensarbeit`
Intelligenz
Reasoning Effort	Adaptiv (prägnant)
GPQA Diamond	80,0%
Speicher
Max. Kontext	1,0 Mio. Token
Geschwindigkeit
Latenz (TTFT)	1,17 s
Durchsatz	100+ Token/Sek.

Entdecke die intelligentere Art, mit KI zu arbeiten

Ein Arbeitsbereich für alle führenden KI-Modelle. Schneller denken. Intelligenter erstellen.

Probiere DeepMask kostenlos aus

Haiku 4.5

Neuer Chat

Chats

Projekte

Zuletzt

Anzeigen

Jonas ist beigetreten!

Wie kann ich Ihnen heute helfen?

KI kann Fehler machen. Bitte überprüfen Sie die Antworten sorgfältig.

Modelle

Qwen (DeepMask)

Kimi K2 (DeepMask)

GPT-OSS 120B (Stack IT)

Haiku 4.5

Gemma 3 27B (Stack IT)

Gemini 2.2 Flash

Gemini 2.5 Flash

GPT-4o

GPT-4.1

Mistral Large 2.1

DeepSeek V3

GPT-5.3

Opus 4.5

Sonett 4.5

GPT-o3 Mini

Grok 3 Mini

Grok 4 Fast

Haiku 4.5

Neuer Chat

Chats

Projekte

KI-Automatisierungsprodukt

Recherche für die Sommerkampagne

PR-Projektagenten

Täglicher Blog-Inhalt

Werbebanner auf der Haupt-Landingpage

Zuletzt

Anzeigen

Jonas Müller

Kostenpflichtiger Plan

Modelle

Qwen (DeepMask)

Kimi K2 (DeepMask)

Qwen3 (Stack IT)

GPT 5.2

GPT-OSS 120B (Stack IT)

Haiku 4.5

Gemma 3 27B (Stack IT)

Gemini 2.0 Flash

Gemini 2.5 Flash

GPT-4o

GPT-4.1

Mistral Large 2.1

DeepSeek V3

GPT-5.3

Opus 4.5

Sonett 4.5

GPT-o3 Mini

Grok 3 Mini

Grok 4 Fast

Jonas ist beigetreten!

Wie kann ich Ihnen heute helfen?

KI kann Fehler machen. Bitte überprüfen Sie die Antworten sorgfältig.

Entdecke die intelligentere Art, mit KI zu arbeiten

Ein Arbeitsbereich für alle führenden KI-Modelle. Schneller denken. Intelligenter erstellen.

Probiere DeepMask kostenlos aus

Haiku 4.5

Neuer Chat

Chats

Projekte

Zuletzt

Anzeigen

Jonas ist beigetreten!

Wie kann ich Ihnen heute helfen?

KI kann Fehler machen. Bitte überprüfen Sie die Antworten sorgfältig.

Modelle

Qwen (DeepMask)

Kimi K2 (DeepMask)

GPT-OSS 120B (Stack IT)

Haiku 4.5

Gemma 3 27B (Stack IT)

Gemini 2.2 Flash

Gemini 2.5 Flash

GPT-4o

GPT-4.1

Mistral Large 2.1

DeepSeek V3

GPT-5.3

Opus 4.5

Sonett 4.5

GPT-o3 Mini

Grok 3 Mini

Grok 4 Fast

Haiku 4.5

Neuer Chat

Chats

Projekte

KI-Automatisierungsprodukt

Recherche für die Sommerkampagne

PR-Projektagenten

Täglicher Blog-Inhalt

Werbebanner auf der Haupt-Landingpage

Zuletzt

Anzeigen

Jonas Müller

Kostenpflichtiger Plan

Modelle

Qwen (DeepMask)

Kimi K2 (DeepMask)

Qwen3 (Stack IT)

GPT 5.2

GPT-OSS 120B (Stack IT)

Haiku 4.5

Gemma 3 27B (Stack IT)

Gemini 2.0 Flash

Gemini 2.5 Flash

GPT-4o

GPT-4.1

Mistral Large 2.1

DeepSeek V3

GPT-5.3

Opus 4.5

Sonett 4.5

GPT-o3 Mini

Grok 3 Mini

Grok 4 Fast

Jonas ist beigetreten!

Wie kann ich Ihnen heute helfen?

KI kann Fehler machen. Bitte überprüfen Sie die Antworten sorgfältig.

MiniMax M2.5 (Infercom)

Über das Modell

Wichtige Modellfunktionen

Lightning Recall:

Agentische Orchestrierung:

Geringer VRAM-Bedarf:

Anwendungen & Anwendungsfälle

24/7-Messaging-Agenten:

Full-Stack Vibe-Coding:

Persistente Speichersysteme:

Empfohlene Modelle.Basierend auf Ihren Bedürfnissen

Empfohlene Modelle.Basierend auf Ihren Bedürfnissen

Modellspezifikationen

Allgemein

MiniMax

Intelligenz

Adaptiv (prägnant)

80,0%

Speicher

1,0 Mio. Token

Geschwindigkeit

1,17 s

100+ Token/Sek.

Entdecke die intelligentere Art, mit KI zu arbeiten

Entdecke die intelligentere Art, mit KI zu arbeiten

Empfohlene Modelle.
Basierend auf Ihren Bedürfnissen

Empfohlene Modelle.
Basierend auf Ihren Bedürfnissen