GLM-4.7 Flash

Die ultraschnelle "Agent-Loop"-Engine für die Automatisierung mit hohem Volumen.

Jetzt ausprobieren

Über das Modell

GLM-4.7 Flash ist die leichte, Hochgeschwindigkeits-Variante von Z.ai's 4.7er-Serie. Es ist für "Action-First"-Szenarien entwickelt, in denen ein Modell Hunderte kleiner Entscheidungen pro Minute treffen muss. Es ist eines der erschwinglichsten Modelle auf dem Markt 2026 und daher der Favorit für "Agent Swarms", bei denen Dutzende von Instanzen parallel laufen.

Wichtige Modellfähigkeiten

Verschachteltes Denken:
Kann seine Denkschritte während der Ausführung von Aufgaben ausgeben, ohne einen großen Geschwindigkeitsnachteil.
Zweisprachige Optimierung:
Optimiert für ein Token-zu-Wort-Verhältnis von 0,75 im Englischen und 1,5 im Chinesischen.
Agentische Werkzeugnutzung:
Speziell auf repetitive "Search-and-Extract"-Workflows abgestimmt.
Extrem niedrige Latenz:
Entwickelt für Echtzeit-Chat und interaktive UI-Komponenten.

Anwendungen & Anwendungsfälle

Dateneingabe in Echtzeit:
Verarbeitung von Tausenden Rechnungen in Datenbanken.
Groß angelegte Web-Scraper:
Zusammenfassung von Hunderten Suchergebnissen parallel.
Zweisprachiger Kundensupport:
Sofortige, kontextbezogene Übersetzung und Unterstützung auf Englisch/Mandarin.

‹ Opus 4.5

GLM-4.7 ›

Empfohlene Modelle.
Basierend auf Ihren Bedürfnissen

Qwen (DeepMask)

Vielseitiges Modell mit Schlussfolgern und Werkzeugnutzung. Stark bei Dokumenten- und Bildanalyse sowie im mehrsprachigen Chat.

Qwen (DeepMask)

Vielseitiges Modell mit Schlussfolgern und Werkzeugnutzung. Stark bei Dokumenten- und Bildanalyse sowie im mehrsprachigen Chat.

Qwen3 (StackIT)

Vielseitiges Modell mit Schlussfolgerungsvermögen und Werkzeugnutzung. Stark in der Analyse von Dokumenten und Bildern sowie im mehrsprachigen Chat.

Qwen3 (StackIT)

Vielseitiges Modell mit Schlussfolgerungsvermögen und Werkzeugnutzung. Stark in der Analyse von Dokumenten und Bildern sowie im mehrsprachigen Chat.

Kimi K2 (DeepMask)

Am besten für tiefes Schlussfolgern und die Nutzung von Werkzeugen. Ideal für lange, mehrstufige Aufgaben und Dokumentenanalyse.

Kimi K2 (DeepMask)

Am besten für tiefes Schlussfolgern und die Nutzung von Werkzeugen. Ideal für lange, mehrstufige Aufgaben und Dokumentenanalyse.

Modellspezifikationen

Allgemein
Modellanbieter	Z.ai
Hauptanwendungsfälle	`Echtzeit-Agenten` `Lokale UI-Generierung` `Hochgeschwindigkeitsübersetzung`
Intelligenz
Schlussfolgerungsaufwand	Standard
GPQA Diamond	58.1%
Speicher
Maximaler Kontext	203K Tokens
Geschwindigkeit
Latenz (TTFT)	0.59s
Durchsatz	91 Tokens/Sec

Entdecke die intelligentere Art, mit KI zu arbeiten

Ein Arbeitsbereich für alle führenden KI-Modelle. Schneller denken. Intelligenter erstellen.

Probiere DeepMask kostenlos aus

Haiku 4.5

Neuer Chat

Chats

Projekte

Zuletzt

Anzeigen

Jonas ist beigetreten!

Wie kann ich Ihnen heute helfen?

KI kann Fehler machen. Bitte überprüfen Sie die Antworten sorgfältig.

Modelle

Qwen (DeepMask)

Kimi K2 (DeepMask)

GPT-OSS 120B (Stack IT)

Haiku 4.5

Gemma 3 27B (Stack IT)

Gemini 2.2 Flash

Gemini 2.5 Flash

GPT-4o

GPT-4.1

Mistral Large 2.1

DeepSeek V3

GPT-5.3

Opus 4.5

Sonett 4.5

GPT-o3 Mini

Grok 3 Mini

Grok 4 Fast

Haiku 4.5

Neuer Chat

Chats

Projekte

KI-Automatisierungsprodukt

Recherche für die Sommerkampagne

PR-Projektagenten

Täglicher Blog-Inhalt

Werbebanner auf der Haupt-Landingpage

Zuletzt

Anzeigen

Jonas Müller

Kostenpflichtiger Plan

Modelle

Qwen (DeepMask)

Kimi K2 (DeepMask)

Qwen3 (Stack IT)

GPT 5.2

GPT-OSS 120B (Stack IT)

Haiku 4.5

Gemma 3 27B (Stack IT)

Gemini 2.0 Flash

Gemini 2.5 Flash

GPT-4o

GPT-4.1

Mistral Large 2.1

DeepSeek V3

GPT-5.3

Opus 4.5

Sonett 4.5

GPT-o3 Mini

Grok 3 Mini

Grok 4 Fast

Jonas ist beigetreten!

Wie kann ich Ihnen heute helfen?

KI kann Fehler machen. Bitte überprüfen Sie die Antworten sorgfältig.

Entdecke die intelligentere Art, mit KI zu arbeiten

Ein Arbeitsbereich für alle führenden KI-Modelle. Schneller denken. Intelligenter erstellen.

Probiere DeepMask kostenlos aus

Haiku 4.5

Neuer Chat

Chats

Projekte

Zuletzt

Anzeigen

Jonas ist beigetreten!

Wie kann ich Ihnen heute helfen?

KI kann Fehler machen. Bitte überprüfen Sie die Antworten sorgfältig.

Modelle

Qwen (DeepMask)

Kimi K2 (DeepMask)

GPT-OSS 120B (Stack IT)

Haiku 4.5

Gemma 3 27B (Stack IT)

Gemini 2.2 Flash

Gemini 2.5 Flash

GPT-4o

GPT-4.1

Mistral Large 2.1

DeepSeek V3

GPT-5.3

Opus 4.5

Sonett 4.5

GPT-o3 Mini

Grok 3 Mini

Grok 4 Fast

Haiku 4.5

Neuer Chat

Chats

Projekte

KI-Automatisierungsprodukt

Recherche für die Sommerkampagne

PR-Projektagenten

Täglicher Blog-Inhalt

Werbebanner auf der Haupt-Landingpage

Zuletzt

Anzeigen

Jonas Müller

Kostenpflichtiger Plan

Modelle

Qwen (DeepMask)

Kimi K2 (DeepMask)

Qwen3 (Stack IT)

GPT 5.2

GPT-OSS 120B (Stack IT)

Haiku 4.5

Gemma 3 27B (Stack IT)

Gemini 2.0 Flash

Gemini 2.5 Flash

GPT-4o

GPT-4.1

Mistral Large 2.1

DeepSeek V3

GPT-5.3

Opus 4.5

Sonett 4.5

GPT-o3 Mini

Grok 3 Mini

Grok 4 Fast

Jonas ist beigetreten!

Wie kann ich Ihnen heute helfen?

KI kann Fehler machen. Bitte überprüfen Sie die Antworten sorgfältig.

GLM-4.7 Flash

Über das Modell

Wichtige Modellfähigkeiten

Verschachteltes Denken:

Zweisprachige Optimierung:

Agentische Werkzeugnutzung:

Extrem niedrige Latenz:

Anwendungen & Anwendungsfälle

Dateneingabe in Echtzeit:

Groß angelegte Web-Scraper:

Zweisprachiger Kundensupport:

Empfohlene Modelle.Basierend auf Ihren Bedürfnissen

Empfohlene Modelle.Basierend auf Ihren Bedürfnissen

Modellspezifikationen

Allgemein

Z.ai

Intelligenz

Standard

58.1%

Speicher

203K Tokens

Geschwindigkeit

0.59s

91 Tokens/Sec

Entdecke die intelligentere Art, mit KI zu arbeiten

Entdecke die intelligentere Art, mit KI zu arbeiten

Empfohlene Modelle.
Basierend auf Ihren Bedürfnissen

Empfohlene Modelle.
Basierend auf Ihren Bedürfnissen