Richtlinie zur fairen Nutzung
Modell-Rate-Limits und Nutzungsrichtlinien für Nutzer des Test- und Professional-Tarifs
Diese Fair-Use-Richtlinie regelt die Nutzung der über die DeepMask-Plattform verfügbaren KI-Modelle. Sie soll einen fairen Zugang, die Zuverlässigkeit der Plattform und für jeden Nutzer ein durchgängig hochwertiges Erlebnis gewährleisten. DeepMask bietet Zugang zu über 25 führenden KI-Modellen von Anbietern wie OpenAI, Anthropic, Google, Meta, Mistral, xAI, Moonshot AI und weiteren. Da diese Modelle unterschiedliche Rechenkosten und Nachfragemuster aufweisen, setzen wir gestaffelte Ratenlimits ein, um zu verhindern, dass einzelne Nutzer die Kapazitäten monopolisieren und das Erlebnis für andere beeinträchtigen.
Unser Ziel ist einfach: Jeder DeepMask-Nutzer sollte jederzeit ohne Leistungseinbußen auf jedes verfügbare Modell zugreifen können. Diese Richtlinie macht das möglich.
DeepMask organisiert seine KI-Modelle in vier Kategorien basierend auf Rechenaufwand und Nachfrage. Jede Kategorie hat ihr eigenes Ratenlimit, gemessen in Nachrichten pro rollierendem 3-Stunden-Zeitraum. Diese Limits gelten pro Nutzer und pro Kategorie.
Ratenlimits nach Tarif
Wenn ein Benutzer das Limit für eine bestimmte Kategorie erreicht, kann er vorübergehend keine neuen Nachrichten an Modelle in dieser Kategorie senden. Er kann sofort zu einem beliebigen Modell in einer anderen Kategorie wechseln und weiterarbeiten. Die Limits werden in einem rollierenden 3-Stunden-Fenster zurückgesetzt – der Zugriff wird also mit der Zeit automatisch wiederhergestellt.
Die meisten Nutzer erreichen diese Limits nie. Sie dienen als Sicherheitsmaßnahme, nicht als Hindernis. Wenn Sie regelmäßig an Limits stoßen, sollten Sie ein Upgrade auf den Professional-Tarif in Betracht ziehen, um deutlich höhere Kontingente zu erhalten.
Schnelle Modelle
Leichte, schnelle Modelle, optimiert für schnelle Abfragen, einfache Aufgaben, Entwürfe und die Nutzung mit hohem Volumen. Diese Modelle bieten die niedrigsten Kosten pro Token und die höchsten Rate Limits – ideal für alltägliche Produktivitätsaufgaben.
Testlimit:
50 Nachrichten pro 3 Stunden
Pro-Limit:
250 Nachrichten pro 3 Stunden
Modelle:
Mistral-small-2503
Gemini 2.0 Flash
GLM 4.7 Flash
Gemma-3-27b
Ausgewogenes Modell
Modelle der Mittelklasse, die Geschwindigkeit, Qualität und Kosten ausbalancieren. Gut geeignet für Schreiben, Analyse, Zusammenfassungen, Forschungsunterstützung und Aufgaben, die mehr Nuancen erfordern, als Fast-Modelle bieten.
Testlimit:
30 Nachrichten pro 3 Stunden
Pro Limit:
100 Nachrichten pro 3 Stunden
Modelle:
Minimax M2
Minimax M2.1
GPT-oss-120b
Mistral-medium-2505
Gemini 2.5 Flash
Mistral-Large 3
Gemini 3 Flash
Kimi-K2-thinking
Qwen – DeepMask
Fortgeschrittenes Modell
Modelle mit hoher Leistungsfähigkeit für komplexes Schlussfolgern, tiefgehende Analysen, Programmierung, strategische Arbeit und Aufgaben, bei denen die Qualität der Ausgabe oberste Priorität hat. Diese Modelle verbrauchen deutlich mehr Rechenleistung und sind entsprechend bepreist.
Testlimit:
10 Nachrichten pro 3 Stunden
Pro Limit:
50 Nachrichten pro 3 Stunden
Modelle:
GLM 4.7
Kimi K2.5
o3-mini
Haiku-4.5
Qwen3 – STACKIT
DeepSeek V3
GPT-4.1
GPT-4o
Minimax 2.5
Premium-Modell
Die leistungsstärksten und teuersten verfügbaren Modelle. Reserviert für besonders wichtige Aufgaben, die die absolut beste Ausgabe erfordern — Executive-Briefings, komplexe juristische Analysen, anspruchsvolle Programmieraufgaben und Spitzenforschung. Aufgrund ihres extrem hohen Rechenbedarfs sind die Rate-Limits am strengsten.
Testlimit:
5 Nachrichten pro 3 Stunden
Pro Limit:
20 Nachrichten pro 3 Stunden
Modelle:
GPT-5.2
GPT-5.3
GPT-5.4
Sonnet 4.5
Opus 4.5
Sonnet 4.6
Opus 4.6
Wenn Sie die zulässige Anzahl von Nachrichten für eine Modellkategorie innerhalb des 3-Stunden-Zeitraums überschreiten, zeigt DeepMask eine Benachrichtigung an, die Sie darüber informiert, dass das Limit für diese Kategorie erreicht wurde. Folgendes können Sie tun:
Modelle wechseln:
Verwenden Sie sofort ein beliebiges Modell aus einer anderen Kategorie. Wenn Sie zum Beispiel alle Ihre Advanced-Nachrichten verbraucht haben, wechseln Sie zu einem Balanced- oder Fast-Modell, um weiterzuarbeiten:
Warten Sie, bis das Fenster zurückgesetzt wird
Ratenbegrenzungen gelten in einem gleitenden 3-Stunden-Fenster. Wenn Ihre ältesten Nachrichten die 3-Stunden-Marke überschreiten, wird automatisch Kapazität freigegeben.
Aktualisieren Sie Ihren Tarif
Nutzer der Testversion, die häufig an Limits stoßen, sollten ein Upgrade auf den Professional-Plan in Betracht ziehen, der in allen Kategorien 3–5-mal höhere Limits bietet.
Wichtig: Ratenlimits gelten pro Kategorie, nicht pro Modell. Die Verwendung von 10 Nachrichten über drei verschiedene Advanced-Modelle hinweg zählt weiterhin als 10 Advanced-Nachrichten.
Organisationen im DeepMask-Enterprise-Tarif profitieren von individuell angepassten Ratenlimits, die auf ihre spezifischen Nutzungsmuster und Teamgröße zugeschnitten sind. Die Enterprise-Limits werden während des Onboardings konfiguriert und können jederzeit in Absprache mit Ihrem dedizierten Customer Success Manager angepasst werden.
Zu den Enterprise-Funktionen gehören:
Benutzerdefinierte Ratenbegrenzungen
Pro Benutzer, pro Team oder organisationsweit – auf Ihre Bedürfnisse zugeschnitten.
Priorisierter Modellzugriff
Garantierte Kapazitätszuweisung für geschäftskritische Workloads.
Nutzungsanalyse
Detaillierte Dashboards, die den Tokenverbrauch nach Benutzer, Team, Modell und Zeitraum anzeigen.
Dedizierte Infrastruktur
Für souveräne Modellbereitstellungen auf STACKIT sorgt dedizierte Rechenleistung dafür, dass es zu keinen Ressourcenengpässen kommt.
Um Enterprise-Ratenlimits und benutzerdefinierte Konfigurationen zu besprechen, wenden Sie sich an unser Vertriebsteam unter contact@deepmask.io oder besuchen Sie deepmask.io/contact-sales.
Die Richtlinie zur fairen Nutzung gilt zusammen mit den Nutzungsbedingungen von DeepMask. Die folgenden Aktivitäten sind strengstens verboten und können zur Sperrung oder Kündigung des Kontos führen:
Automatisierter Missbrauch
Verwendung von Bots, Skripten oder automatisierten Tools, um Nachrichten in großem Umfang zu versenden oder Rate-Limits zu umgehen.
API-Scraping
Programmgesteuertes Extrahieren von Modellausgaben über die Chat-Oberfläche ohne Autorisierung.
Kontofreigabe
Das Weitergeben von Login-Daten, um effektive Ratenlimits über mehrere Personen hinweg zu vervielfachen.
Umgehung
Jeder Versuch, das Rate-Limiting-System durch technische Mittel zu umgehen, zu manipulieren oder auszunutzen.
Weiterverkauf
Die Ausgabe von DeepMask verwenden, um Drittanbietern KI-Dienste ohne eine kommerzielle Vereinbarung bereitzustellen.
DeepMask behält sich das Recht vor, Nutzungslimits anzupassen, Modellkategorien zu ändern oder jederzeit und nach eigenem Ermessen Maßnahmen gegen Konten zu ergreifen, die an verbotenen Aktivitäten beteiligt sind.
Unabhängig davon, welches Modell Sie verwenden oder zu welcher Kategorie es gehört, wird die gesamte DeepMask-Inferenz innerhalb der Europäischen Union verarbeitet. Unser primärer Infrastrukturpartner ist STACKIT, die souveräne Cloud-Sparte der Schwarz Gruppe, mit Rechenzentren in Deutschland.
Weitere Bereitstellungen in EU-Regionen werden durch Partnerschaften mit Microsoft Azure, Amazon Web Services (AWS) und Google Cloud betrieben — alle mit strengen Kontrollen zur Datenresidenz konfiguriert, die sicherstellen, dass keine Daten den EU-Rechtsraum verlassen.
Keine Daten werden für das Modelltraining verwendet
Vertraglich garantiert von allen vorgelagerten KI-Anbietern.
Ende-zu-Ende-Verschlüsselung
AES-256 im Ruhezustand, TLS 1.3 bei der Übertragung.
DSGVO-konform
Vollständig im Einklang mit der Datenschutz-Grundverordnung.
Modellkategorien, Ratenlimits und Preise können sich ändern, wenn wir unser Modellangebot erweitern, neue Anbieter aufnehmen und auf die Nachfrage der Plattform reagieren. Wir werden Nutzer mindestens 14 Tage vor Inkrafttreten über wesentliche Änderungen per E-Mail und/oder In-App-Benachrichtigung informieren.
Die aktuelle Version dieser Richtlinie ist jederzeit unter deepmask.io/fair-usage-policy verfügbar.