vibe-coding24. Juni 202614 Min.

Hermes Agent: KI-Agent lokal & DSGVO-freundlich nutzen

Hermes Agent installieren und nutzen, Schritt für Schritt: dein autonomer KI-Agent auf Desktop oder Server, mit lokalem LLM via LM Studio DSGVO-freundlich.

Autor

Wolfgang Stefani

Vibe Designer & Vibe Coder aus Berlin. Mehr erfahren

Hermes Agent: KI-Agent lokal & DSGVO-freundlich nutzen

Das Wichtigste

→Der Hermes Agent von Nous Research ist ein KI-Agent, der auf deinem eigenen Rechner oder Server lebt und über Telegram erreichbar ist
→Anders als ein Chatbot arbeitet er auch ohne dich weiter: geplante Aufgaben (Cron), eigenes Gedächtnis und selbst geschriebene Fähigkeiten
→Mit einem lokalen Modell über LM Studio verlässt kein einziger Prompt deinen Rechner, das ist der einfachste Weg zu DSGVO-freundlicher KI
→Bei mir übernimmt Hermes den wöchentlichen SEO-Report, den Newsletter-Entwurf und die Website-Überwachung, das spart rund 2 Stunden pro Woche
→Installation geht in zwei Wegen: per Desktop-App für den Einstieg oder per Server (VPS), wenn Aufgaben rund um die Uhr laufen sollen

Montag, 9 Uhr.

Während ich noch meinen ersten Kaffee trinke, liegt in meinem Telegram schon ein fertiger SEO-Report. Klicks der letzten Woche, größte Gewinner, ein Alarm zu einer Seite mit schlechter Klickrate, dazu drei konkrete Empfehlungen. Geschrieben hat ihn der Hermes Agent, ein KI-Agent, der auf meinem Server lebt und arbeitet, während ich schlafe.

Kennst du das Gefühl, dass du dieselben kleinen Aufgaben jede Woche neu erledigst? Reports zusammenklicken, Website prüfen, Newsletter aufsetzen. Genau hier setzt ein KI-Agent an. Er ist kein Chatfenster, das auf deine Frage wartet. Er ist eher ein digitaler Mitarbeiter, der seine Aufgaben kennt und sie eigenständig abarbeitet.

In diesem Artikel zeige ich dir, was der Hermes Agent ist, wofür ich ihn konkret nutze und wie du ihn selbst installierst. Einmal bequem per Desktop-App und einmal auf einem Server. Und der Teil, der mich als deutschen Freelancer am meisten interessiert: wie du Hermes mit einem lokalen KI-Modell betreibst, sodass deine Daten den Rechner nie verlassen.

Hermes Agent: dein KI-Mitarbeiter, der auf deinem eigenen Rechner lebt

Flat-Illustration, freundlicher Roboter-Assistent an einem Schreibtisch mit laufenden Zahnrädern im Hintergrund, blau-gelbe Editorial-Illustration mit geometrischen Formen

Der Hermes Agent ist ein quelloffenes Programm der Firma Nous Research. Quelloffen heißt: der komplette Programmcode liegt offen auf GitHub, frei einsehbar und kostenlos unter der MIT-Lizenz. Du installierst ihn auf deinem eigenen Rechner oder Server. Und dann sprichst du mit ihm. Ganz normal, über einen Messenger wie Telegram, so als würdest du einem Kollegen schreiben.

Der Unterschied zu ChatGPT oder Claude im Browser ist wichtig. Ein Chatbot wartet. Du stellst eine Frage, er antwortet, dann ist Schluss. Ein Agent handelt. Er hat Zugriff auf Werkzeuge wie das Terminal deines Servers, einen Web-Scraper oder deinen GitHub-Account. Er merkt sich, wie du arbeitest. Und er startet Aufgaben zu festen Zeiten von selbst.

Stell dir den Unterschied so vor: Ein Chatbot ist ein Lexikon, das du aufschlägst. Hermes ist eine Assistentin, die morgens an deinem Schreibtisch sitzt und schon angefangen hat.

Damit das funktioniert, braucht Hermes ein KI-Modell als "Denkmotor". Ein KI-Modell (englisch: Large Language Model, kurz LLM) ist das eigentliche Sprachgehirn, das Texte versteht und schreibt. Das Schöne: du entscheidest, welches Gehirn er nutzt. Ein Modell aus der Cloud. Oder ein lokales Modell, das auf deiner eigenen Hardware läuft und deine Daten niemals nach draußen lässt. Genau das macht Hermes für den Datenschutz so spannend.

newsletter.sh

# Neuer Artikel? Du erfährst es als Erstes.

# Kein Spam. Ein kurzes Mail, wenn etwas erscheint.

Hermes Agent oder Hermes Modell? Kurze Begriffsklärung

Hier lauert eine Verwechslung, die ich gleich aus dem Weg räumen will. Nous Research nennt zwei verschiedene Dinge "Hermes".

Einmal gibt es die Hermes Sprachmodelle (zum Beispiel Hermes 4). Das sind reine KI-Modelle, also Denkmotoren, vergleichbar mit GPT oder Claude.

Und dann gibt es den Hermes Agent. Das ist der Rahmen drumherum, der so ein Modell mit Werkzeugen, Gedächtnis und Messenger-Anbindung verbindet. Der Agent kann ein Hermes-Modell als Motor nutzen, aber genauso gut ein ganz anderes.

In diesem Artikel geht es um den Agent. Wenn ich "Hermes" schreibe, meine ich das Programm auf dem Server, nicht das Sprachmodell.

Was Hermes wirklich kann: meine 5 laufenden Aufgaben

Flat-Illustration, mehrere Aufgabenkarten die von einem zentralen Roboterarm sortiert werden, Uhr-Symbole für geplante Zeiten, blau-gelbe Farbgebung

Theorie ist schön. Aber was macht so ein Agent den ganzen Tag? Ich zeige dir, was bei mir tatsächlich läuft. Auf meinem Server arbeiten gerade fünf feste Aufträge, alle melden sich über Telegram.

Der SEO-Montag. Jeden Montag um 9 Uhr fragt Hermes die Google Search Console nach den Zahlen der letzten Woche, holt parallel die aktuellen Rankings für meine Ziel-Keywords und vergleicht alles mit der Vorwoche. Fünf Minuten später habe ich einen fertigen Report im Chat. Früher habe ich dafür rund 45 Minuten in drei Tools geklickt.

Der Newsletter im Zwiegespräch. Dienstags schickt mir Hermes eine nummerierte Liste meiner Blogartikel, die noch nicht im Newsletter waren. Ich antworte mit einer Zahl. Hermes liest den Artikel, schreibt einen Entwurf nach meinen Tonalitäts-Regeln und legt direkt eine Kampagne im E-Mail-Tool an. Ich antworte test, bekomme eine Testmail, sage revise mach den Einstieg direkter und am Ende send. Fertig.

Der stille Wächter. Jede Nacht um 6 Uhr prüft Hermes, ob meine Website erreichbar ist und schnell lädt. Meistens passiert: nichts. Keine Nachricht heißt, alles ist gut. Einmal aber kam morgens ein Alarm. Der Serverprozess der Website war abgestürzt. Neustart, Problem gelöst, bevor der erste Besucher die Seite überhaupt aufgerufen hat.

Dazu kommen zwei Aufräum-Aufgaben: einmal im Monat sucht Hermes nach toten Links in meinen Blogartikeln und prüft, ob es ein Update für ihn selbst gibt.

Was bringt das unterm Strich? Hier die ehrliche Rechnung.

Aufgabe	Früher manuell	Mit Hermes
Wöchentlicher SEO-Report	~45 min	~2 min (lesen, reagieren)
Newsletter (Entwurf bis Versand)	~60 min	~10 min
Täglicher Website-Check	~35 min/Woche	0 min (nur bei Alarm)
Broken-Link-Prüfung (monatlich)	~60 min	0 min
Gesamt pro Woche	~2,5 Stunden	~12 Minuten

Rund zwei Stunden pro Woche, die ich nicht mehr mit Klickarbeit verbringe. Es ist nicht die kreative Arbeit, die Hermes übernimmt. Es sind die immer gleichen Schritte, bei denen ich ohnehin nur einer Checkliste folge.

Ich ziehe jeden Montag Zahlen aus vier Tools in eine Tabelle. Das kostet mich jedes Mal einen halben Morgen.

Das ist klassisch. Und meistens der erste Arbeitsablauf, den ich anpacken würde.

30 Minuten Erstgespräch, kostenlos. Danach weißt du, wie das bei dir automatisch läuft.

Erstgespräch buchen →

So lernt Hermes dazu, ohne dass du programmierst

Flat-Illustration, Roboter der ein eigenes Rezeptbuch schreibt, daneben ein Gehirn-Symbol und eine Weckuhr, blau-gelbe Editorial-Illustration

Wie kommt Hermes von "ich kann nichts" zu "ich erledige deinen SEO-Report"? Über drei Bausteine, die zusammenspielen. Und keiner davon verlangt, dass du Code schreibst.

Der erste Baustein sind Fähigkeiten (im Original "Skills"). Eine Fähigkeit ist eine Art Rezept, das beschreibt, wie eine Aufgabe abläuft. Das Besondere: Hermes schreibt diese Rezepte selbst. Du sagst ihm in normaler Sprache, was du regelmäßig brauchst. Er legt dann eine neue Fähigkeit dafür an. Beim nächsten Mal greift er einfach darauf zurück.

Der zweite Baustein ist das Gedächtnis. Hermes speichert in einfachen Textdateien, wer du bist, wie du arbeitest und was er zuletzt erledigt hat. Deshalb musst du ihm nicht jedes Mal alles neu erklären. Er weiß, dass ich auf Deutsch schreibe und meinen Newsletter im Du verfasse.

Der dritte Baustein ist der Zeitplaner (technisch: Cron). Das ist eine feste Liste mit Uhrzeiten und Aufgaben. "Jeden Montag um 9 Uhr" oder "jede Nacht um 6 Uhr". Du sprichst die Zeit in normaler Sprache aus, Hermes übersetzt sie in einen geplanten Auftrag. Genau dieser Zeitplaner macht den Unterschied zum normalen Chatbot. Hermes wartet nicht auf dich, er hat einen Wecker.

Profi-Tipp

Bring jede neue Routine zuerst einmal von Hand zum Laufen, im Chat. Erst wenn das Ergebnis sitzt, lässt du sie als geplanten Auftrag wiederholen. So vermeidest du, dass ein Fehler jede Woche automatisch wiederholt wird.

Schritt für Schritt: Hermes per Desktop-App installieren

Flat-Illustration, Laptop mit geöffneter App und Download-Pfeil, daneben ein Smartphone mit Chat-Symbol, blau-gelbe Editorial-Illustration

Der einfachste Einstieg führt über die Desktop-App. Die gibt es für Mac, Windows und Linux. Sie nimmt dir das Arbeiten im Terminal ab. So gehst du vor:

App laden. Öffne die offizielle Seite hermes-agent.nousresearch.com und lade den Installer für dein Betriebssystem herunter. Die Seite erkennt automatisch, ob du auf Mac oder Windows bist.
Installieren und starten. Doppelklick auf die Datei, der Anweisung folgen, dann Hermes öffnen. Falls die App beim ersten Start zickt, hilft meist der Befehl hermes update im Terminal, danach klappt der Start.
Modell auswählen. Beim ersten Start fragt dich Hermes nach einem Denkmotor. Du kannst diesen Schritt mit "Choose provider later" erst einmal überspringen und dich in Ruhe in der App umsehen. Über die Einstellungen hinterlegst du später deinen Zugang zu einem KI-Modell.
Loslegen. Du startest eine neue Sitzung und schreibst wie in einem Chat. Oben im Fenster wählst du das Modell und die Denktiefe. Hermes kann eine Unterhaltung sogar in ein neues Fenster abzweigen, wenn du eine Idee getrennt weiterverfolgen willst.

Damit du Hermes auch unterwegs vom Handy aus erreichst, verbindest du ihn mit Telegram. Das läuft in Kurzform so: Im Telegram schreibst du dem offiziellen Bot @BotFather, lässt dir mit /newbot einen eigenen Bot anlegen und bekommst dafür einen Zugangsschlüssel (Token). Diesen Schlüssel trägst du in Hermes ein, dann antwortet dir dein Agent direkt im Messenger.

Wichtig

Gib bei der Telegram-Anbindung immer deine eigene Nutzer-ID als erlaubten Nutzer an. Sonst könnte theoretisch jede fremde Person, die deinen Bot findet, Befehle auf deinem Rechner auslösen. Diese eine Einstellung ist die wichtigste Sicherheitsmaßnahme beim Start.

Lieber rund um die Uhr? Hermes auf einem Server betreiben

Flat-Illustration, Server-Schrank mit kleinem wachem Roboter davor, Mond und Sterne im Hintergrund für Nachtbetrieb, blau-gelbe Farbgebung

Die Desktop-App hat einen Haken: Sie läuft nur, wenn dein Computer an ist. Mein SEO-Montag um 9 Uhr soll aber auch funktionieren, wenn mein Laptop im Rucksack steckt. Deshalb läuft mein Hermes auf einem kleinen Mietserver (einem VPS, also einem virtuellen Server) bei einem deutschen Anbieter.

Die Installation ist ein einziger Befehl, den du im Terminal des Servers einfügst:

# Mac, Linux oder Server:
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash

Danach richtest du Hermes mit einem Assistenten ein:

hermes setup        # führt dich durch Modell und Messenger
hermes gateway      # startet die Telegram-Anbindung

Soll Hermes auch nach einem Neustart des Servers von allein wieder hochfahren? Dafür läuft er als Hintergrunddienst. Auf meinem Server übernimmt das ein kleiner Wächter des Betriebssystems (systemd). Er startet den Agent bei jedem Reboot automatisch und holt ihn nach einem Absturz binnen Sekunden zurück. Einmal einrichten, nie wieder dran denken.

Wann lohnt sich der Server statt der Desktop-App? Immer dann, wenn du geplante Aufgaben hast, die unabhängig von deinem Rechner laufen sollen. Reports, Überwachung, nächtliche Backups. Für reines Ausprobieren reicht die Desktop-App völlig.

Hermes mit lokalem LLM: DSGVO-freundlich dank LM Studio

Flat-Illustration, Laptop mit Schloss-Symbol und lokalem Modell-Chip, durchgestrichene Cloud daneben, blau-gelbe Editorial-Illustration

Jetzt kommt der Teil, der für dich als Selbstständige oder kleinen Betrieb am wichtigsten ist. Datenschutz. Sobald echte Kundendaten ins Spiel kommen, stellt sich eine simple Frage: Wohin gehen meine Daten eigentlich, wenn ich mit einer KI arbeite?

Bei einem Cloud-Modell wandern deine Eingaben an einen Anbieter, oft in die USA. Bei einem lokalen Modell passiert das nicht. Das Modell läuft auf deiner eigenen Hardware. Kein einziger Prompt verlässt deinen Rechner. Genau hier glänzt Hermes, denn du kannst ihm jeden beliebigen Denkmotor vorsetzen, auch einen lokalen.

Am einfachsten geht das mit LM Studio. Das ist ein kostenloses Programm mit Oberfläche, das KI-Modelle auf deinem Mac oder PC ausführt und sie über einen lokalen Zugang bereitstellt. Hermes kennt LM Studio von Haus aus. So verbindest du beide:

LM Studio installieren und ein Modell herunterladen. Für einen Mac mit 32 bis 36 GB Arbeitsspeicher nutze ich gern ein lokales Qwen3.6-35B-A3B. Das ist ein Modell mit einem Spezialistenteam im Inneren (Mixture of Experts), das pro Anfrage nur die passenden Experten aktiviert und deshalb sparsam mit dem Speicher umgeht.
Lokalen Server starten. In LM Studio aktivierst du den Server-Modus. Das Programm stellt dein Modell dann unter einer lokalen Adresse bereit, standardmäßig http://localhost:1234/v1.
Hermes umstellen. Du führst hermes model aus, wählst "LM Studio" und bestätigst die lokale Adresse. Ab jetzt denkt Hermes komplett auf deiner Hardware.

Wichtig

Hermes braucht ein Modell mit einem ausreichend großen Kurzzeitgedächtnis. Das Kurzzeitgedächtnis (Kontextfenster) bestimmt, wie viel Text das Modell auf einmal verarbeiten kann. Für Hermes sollte es bei rund 64.000 Einheiten liegen (Tokens, so heißen die kleinen Textbausteine, in die ein Modell jeden Text zerlegt). Lade in LM Studio also eine Variante deines Modells, die dieses größere Fenster unterstützt, sonst verbindet sich Hermes nicht sauber.

Warum ist das ein Gewinn für den Datenschutz? Weil bei der KI-Verarbeitung kein externer Auftragsverarbeiter mehr im Spiel ist und keine Daten in ein Drittland übertragen werden. Das ist der sauberste Weg, wenn du mit sensiblen Kundendaten arbeitest. Wenn du tiefer einsteigen willst, habe ich das in meinem Artikel zu DSGVO-konformem KI-Coding ausführlich beschrieben.

Eine ehrliche Einordnung gehört dazu: Ein lokales Modell heißt nicht automatisch komplett offline. Wenn dein Agent eine Web-Suche startet, eine E-Mail verschickt oder über Telegram antwortet, verlassen diese Daten trotzdem deinen Rechner. Lokal ist das Sprachgehirn, nicht zwangsläufig jedes Werkzeug. Für den Kern, also deine Prompts und die Antworten, gilt aber: sie bleiben bei dir.

Welches KI-Modell soll Hermes antreiben?

Flat-Illustration, Roboter an einem Schaltpult wählt zwischen einer Abo-Karte und einem Preisschild, ein Motor als Symbol in der Mitte, blau-gelbe Editorial-Illustration

Hermes ist nur die Hülle. Das Modell ist der Motor. Und hier hast du zwei grundsätzliche Wege: ein Modell, für das du sowieso schon zahlst, oder eins, das dich nur pro Nutzung kostet. Beides geht.

Dein vorhandenes Abo weiternutzen

Zahlst du ohnehin schon für ChatGPT, GitHub Copilot oder Grok? Dann kann Hermes dieses Abo als Denkmotor mitbenutzen, ohne dass extra Kosten pro Anfrage anfallen. Du meldest dich einmal über den Browser an (ein sogenannter OAuth-Login, also anmelden ohne einen Schlüssel zu kopieren). Das war's.

Abo	Mit Hermes nutzbar?	Anmeldung
ChatGPT Plus / Pro (über OpenAI Codex)	Ja	Browser-Login
GitHub Copilot	Ja, über deinen Copilot-Zugang	Browser-Login
Grok (X Premium+)	Ja	Browser-Login
Claude	Nein, nur per API-Schlüssel	Schlüssel
Google Gemini	Nein, nur per API-Schlüssel	Schlüssel

Eine Sache zu Claude, weil sie sich 2026 geändert hat. Anthropic hat es Drittanbieter-Tools untersagt, sich mit einem Claude-Abo (Pro oder Max) einzuloggen. Wer das früher mit OpenClaw oder ähnlichen Tools gemacht hat, kennt den Ärger. Für Claude in Hermes brauchst du deshalb den API-Schlüssel von Anthropic. Der rechnet pro Nutzung ab. Dein Claude-Abo einfach als Hermes-Motor mitzunutzen, geht heute nicht mehr.

Wichtig

Ein Abo ist für einen Menschen im Chat gedacht, nicht für einen Agenten, der rund um die Uhr Anfragen feuert. Du kannst schneller an die Nutzungsgrenzen deines Abos stoßen, als dir lieb ist. Manche Anbieter erlauben das Mitbenutzen über fremde Tools laut ihren Nutzungsbedingungen außerdem nur eingeschränkt. Lies im Zweifel das Kleingedruckte deines Anbieters.

Günstig pro Nutzung: offene Modelle über OpenRouter

Wenn deine Aufgaben keine sensiblen Personendaten anfassen, ist der pragmatischste Weg ein günstiges, offenes Modell. Über einen Anbieter wie OpenRouter (ein Sammelzugang zu hunderten Modellen mit einem einzigen Schlüssel) zahlst du nur, was du wirklich verbrauchst. Und das ist bei diesen Modellen erstaunlich wenig.

Hier ein paar starke, günstige Modelle mit ihren Live-Preisen bei OpenRouter (Stand 24. Juni 2026, Preise ändern sich schnell):

Modell	Preis je 1 Mio. Tokens (rein / raus)	Hinweis
GLM 4.7 Flash	~0,06 / 0,40 $	Sehr günstig und flott
DeepSeek V4 Flash	~0,09 / 0,18 $	Günstigster Allrounder, 1 Mio. Tokens Kontext
MiniMax M3	~0,30 / 1,20 $	1 Mio. Tokens Kontext, versteht auch Bilder
DeepSeek V4 Pro	~0,44 / 0,87 $	Mehr Leistung, immer noch günstig
GLM 5.2	~0,95 / 3,00 $	Aktuelles Flaggschiff von z.ai, 1 Mio. Tokens Kontext

Ein Token ist die kleine Texteinheit von vorhin. Eine Million davon sind grob 750.000 Wörter. Jetzt der Vergleich, der wehtut: Ein Spitzenmodell wie GPT-5.5 oder Claude Opus kostet beim Ausgeben rund 25 bis 30 $ pro Million Tokens. MiniMax M3 liegt bei 1,20 $. DeepSeek V4 Flash bei 18 Cent. Selbst ein neues Flaggschiff wie GLM 5.2 ist mit 3 $ noch ein Bruchteil davon. Du zahlst also oft nur ein Zehntel bis ein Zwanzigstel. Für einen Agenten, der den ganzen Tag im Hintergrund Token frisst, ist das der Unterschied zwischen ein paar Euro und ein paar hundert Euro im Monat.

Mein eigener Hermes läuft genau so. MiniMax M3 über OpenRouter, günstig und schnell genug für Reports und Newsletter-Entwürfe. Meine Aufgaben fassen ohnehin keine Kundendaten an, deshalb brauche ich dafür kein lokales Modell.

Und wenn Datenschutz an erster Stelle steht, bleibt der lokale Weg von vorhin: null Kosten pro Anfrage, dafür brauchst du die passende Hardware.

Was kostet der Betrieb?

Flat-Illustration, Waage die ein Cloud-Symbol gegen ein Sparschwein abwägt, Münzstapel daneben, blau-gelbe Editorial-Illustration

Hermes selbst ist kostenlos. Bezahlen musst du nur den Denkmotor und, falls gewünscht, den Server. Drei Wege, drei Kostenbilder.

Mit einem lokalen Modell zahlst du für die KI gar nichts. Keine laufende Rechnung, keine Begrenzung der Anfragen. Du brauchst nur einen Rechner mit genug Arbeitsspeicher, idealerweise einen Mac mit Apple Silicon oder einen PC mit guter Grafikkarte.

Mit einem Cloud-Modell zahlst du pro Nutzung. Über einen Anbieter wie OpenRouter hinterlegst du einen Zugangsschlüssel und gibst dir am besten ein monatliches Limit, etwa 20 €, als Kostenbremse. Du wechselst das Modell mit einem Befehl, je nachdem, ob du Tempo oder Sparsamkeit brauchst.

Dazu kommt der Server, wenn du Aufgaben rund um die Uhr laufen lassen willst. Ein kleiner VPS liegt je nach Anbieter im niedrigen zweistelligen Bereich pro Monat. Mein Hermes läuft auf einem deutschen Server und nutzt aktuell ein günstiges Cloud-Modell als Motor, weil meine Aufgaben keine sensiblen Personendaten anfassen.

Mein Tipp: Starte lokal auf dem Desktop, das kostet dich nichts außer Strom. Wenn du merkst, dass du feste, wiederkehrende Aufgaben hast, kommt der Server dazu.

Hermes oder ein Cloud-Agent wie der ChatGPT-Agent?

Vielleicht fragst du dich, warum du dir die Mühe machen solltest, wenn es fertige Agenten von OpenAI oder Microsoft gibt. Es ist eine Frage von Kontrolle.

Ein Cloud-Agent läuft auf den Servern des Anbieters. Du bekommst, was vorgesehen ist. Deine Daten liegen dort. Hermes läuft auf deiner Maschine. Du bestimmst, welches Modell denkt, welche Werkzeuge er anfassen darf und ob überhaupt Daten nach außen gehen.

Für viele alltägliche Aufgaben ist ein Cloud-Agent völlig in Ordnung. Bequem, schnell, fertig eingerichtet. Aber wenn dir Eigentum und Datenschutz wichtig sind, dazu ein Agent, der wirklich dir gehört und mit der Zeit deine Arbeitsweise lernt, dann ist ein selbst betriebener Agent wie Hermes die ehrlichere Wahl.

Ein KI-Agent wie Hermes nimmt dir nicht die kreative Arbeit ab. Er nimmt dir die Wiederholung ab. Und genau die frisst bei den meisten Selbstständigen die meiste Zeit.

Wenn du das Gefühl hast, dass in deinem Arbeitsalltag zu viele Routineaufgaben hängen, lass uns gemeinsam schauen, wo ein eigener, DSGVO-freundlicher KI-Agent dir konkret hilft. In meiner KI-Beratung finden wir heraus, welche deiner Aufgaben sich automatisieren lassen und welches Setup für dich Sinn ergibt.

Brauchst du Hilfe dabei?

Was für ein Projekt hast du im Kopf?

Ich helfe dir gerne weiter. Schreib mir kurz, worum es geht.

Kein Spam. Wolfgang antwortet persönlich. Meist am selben Tag.

← Vorheriger ArtikelKI im Unternehmen einführen: Fahrplan für kleine Teams

Mehr Blogeinträge

KI-Agent für Marketing: Was du jetzt automatisieren kannst

KI-Agenten im Marketing automatisieren Content, Ads-Loops und tägliches Reporting. Konkrete Arbeitsabläufe für Marketer, ohne Agentur, ohne Entwickler.

Artikel lesen

Claude & Datenschutz: Ist Claude DSGVO-konform? (2026)

Welcher Claude-Plan ist DSGVO-konform, wann brauchst du einen AVV und was darfst du eingeben? Praktischer Leitfaden für Selbstständige und KMUs.

Artikel lesen

Claude Prompting: Was echte Evals über Prompts zeigen

Claude Prompting: Warum weiche Verbote nicht halten, was 46 Artikel-Evals zeigen und wie du Constraints in deinem System-Prompt wirklich scharf bekommst.

Artikel lesen

Zurück zum Blog

Montag, 9 Uhr.

Hermes Agent: dein KI-Mitarbeiter, der auf deinem eigenen Rechner lebt

Flat-Illustration, freundlicher Roboter-Assistent an einem Schreibtisch mit laufenden Zahnrädern im Hintergrund, blau-gelbe Editorial-Illustration mit geometrischen Formen

Stell dir den Unterschied so vor: Ein Chatbot ist ein Lexikon, das du aufschlägst. Hermes ist eine Assistentin, die morgens an deinem Schreibtisch sitzt und schon angefangen hat.

newsletter.sh

# Neuer Artikel? Du erfährst es als Erstes.

# Kein Spam. Ein kurzes Mail, wenn etwas erscheint.

Hermes Agent oder Hermes Modell? Kurze Begriffsklärung

Hier lauert eine Verwechslung, die ich gleich aus dem Weg räumen will. Nous Research nennt zwei verschiedene Dinge "Hermes".

Einmal gibt es die Hermes Sprachmodelle (zum Beispiel Hermes 4). Das sind reine KI-Modelle, also Denkmotoren, vergleichbar mit GPT oder Claude.

In diesem Artikel geht es um den Agent. Wenn ich "Hermes" schreibe, meine ich das Programm auf dem Server, nicht das Sprachmodell.

Was Hermes wirklich kann: meine 5 laufenden Aufgaben

Flat-Illustration, mehrere Aufgabenkarten die von einem zentralen Roboterarm sortiert werden, Uhr-Symbole für geplante Zeiten, blau-gelbe Farbgebung

Dazu kommen zwei Aufräum-Aufgaben: einmal im Monat sucht Hermes nach toten Links in meinen Blogartikeln und prüft, ob es ein Update für ihn selbst gibt.

Was bringt das unterm Strich? Hier die ehrliche Rechnung.

Aufgabe	Früher manuell	Mit Hermes
Wöchentlicher SEO-Report	~45 min	~2 min (lesen, reagieren)
Newsletter (Entwurf bis Versand)	~60 min	~10 min
Täglicher Website-Check	~35 min/Woche	0 min (nur bei Alarm)
Broken-Link-Prüfung (monatlich)	~60 min	0 min
Gesamt pro Woche	~2,5 Stunden	~12 Minuten

Ich ziehe jeden Montag Zahlen aus vier Tools in eine Tabelle. Das kostet mich jedes Mal einen halben Morgen.

Das ist klassisch. Und meistens der erste Arbeitsablauf, den ich anpacken würde.

30 Minuten Erstgespräch, kostenlos. Danach weißt du, wie das bei dir automatisch läuft.

Erstgespräch buchen →

So lernt Hermes dazu, ohne dass du programmierst

Flat-Illustration, Roboter der ein eigenes Rezeptbuch schreibt, daneben ein Gehirn-Symbol und eine Weckuhr, blau-gelbe Editorial-Illustration

Wie kommt Hermes von "ich kann nichts" zu "ich erledige deinen SEO-Report"? Über drei Bausteine, die zusammenspielen. Und keiner davon verlangt, dass du Code schreibst.

Profi-Tipp

Schritt für Schritt: Hermes per Desktop-App installieren

Flat-Illustration, Laptop mit geöffneter App und Download-Pfeil, daneben ein Smartphone mit Chat-Symbol, blau-gelbe Editorial-Illustration

Der einfachste Einstieg führt über die Desktop-App. Die gibt es für Mac, Windows und Linux. Sie nimmt dir das Arbeiten im Terminal ab. So gehst du vor:

App laden. Öffne die offizielle Seite hermes-agent.nousresearch.com und lade den Installer für dein Betriebssystem herunter. Die Seite erkennt automatisch, ob du auf Mac oder Windows bist.
Installieren und starten. Doppelklick auf die Datei, der Anweisung folgen, dann Hermes öffnen. Falls die App beim ersten Start zickt, hilft meist der Befehl hermes update im Terminal, danach klappt der Start.
Modell auswählen. Beim ersten Start fragt dich Hermes nach einem Denkmotor. Du kannst diesen Schritt mit "Choose provider later" erst einmal überspringen und dich in Ruhe in der App umsehen. Über die Einstellungen hinterlegst du später deinen Zugang zu einem KI-Modell.
Loslegen. Du startest eine neue Sitzung und schreibst wie in einem Chat. Oben im Fenster wählst du das Modell und die Denktiefe. Hermes kann eine Unterhaltung sogar in ein neues Fenster abzweigen, wenn du eine Idee getrennt weiterverfolgen willst.

Wichtig

Lieber rund um die Uhr? Hermes auf einem Server betreiben

Flat-Illustration, Server-Schrank mit kleinem wachem Roboter davor, Mond und Sterne im Hintergrund für Nachtbetrieb, blau-gelbe Farbgebung

Die Installation ist ein einziger Befehl, den du im Terminal des Servers einfügst:

# Mac, Linux oder Server:
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash

Danach richtest du Hermes mit einem Assistenten ein:

hermes setup        # führt dich durch Modell und Messenger
hermes gateway      # startet die Telegram-Anbindung

Hermes mit lokalem LLM: DSGVO-freundlich dank LM Studio

Flat-Illustration, Laptop mit Schloss-Symbol und lokalem Modell-Chip, durchgestrichene Cloud daneben, blau-gelbe Editorial-Illustration

LM Studio installieren und ein Modell herunterladen. Für einen Mac mit 32 bis 36 GB Arbeitsspeicher nutze ich gern ein lokales Qwen3.6-35B-A3B. Das ist ein Modell mit einem Spezialistenteam im Inneren (Mixture of Experts), das pro Anfrage nur die passenden Experten aktiviert und deshalb sparsam mit dem Speicher umgeht.
Lokalen Server starten. In LM Studio aktivierst du den Server-Modus. Das Programm stellt dein Modell dann unter einer lokalen Adresse bereit, standardmäßig http://localhost:1234/v1.
Hermes umstellen. Du führst hermes model aus, wählst "LM Studio" und bestätigst die lokale Adresse. Ab jetzt denkt Hermes komplett auf deiner Hardware.

Wichtig

Welches KI-Modell soll Hermes antreiben?

Flat-Illustration, Roboter an einem Schaltpult wählt zwischen einer Abo-Karte und einem Preisschild, ein Motor als Symbol in der Mitte, blau-gelbe Editorial-Illustration

Hermes ist nur die Hülle. Das Modell ist der Motor. Und hier hast du zwei grundsätzliche Wege: ein Modell, für das du sowieso schon zahlst, oder eins, das dich nur pro Nutzung kostet. Beides geht.

Dein vorhandenes Abo weiternutzen

Abo	Mit Hermes nutzbar?	Anmeldung
ChatGPT Plus / Pro (über OpenAI Codex)	Ja	Browser-Login
GitHub Copilot	Ja, über deinen Copilot-Zugang	Browser-Login
Grok (X Premium+)	Ja	Browser-Login
Claude	Nein, nur per API-Schlüssel	Schlüssel
Google Gemini	Nein, nur per API-Schlüssel	Schlüssel

Wichtig

Günstig pro Nutzung: offene Modelle über OpenRouter

Hier ein paar starke, günstige Modelle mit ihren Live-Preisen bei OpenRouter (Stand 24. Juni 2026, Preise ändern sich schnell):

Modell	Preis je 1 Mio. Tokens (rein / raus)	Hinweis
GLM 4.7 Flash	~0,06 / 0,40 $	Sehr günstig und flott
DeepSeek V4 Flash	~0,09 / 0,18 $	Günstigster Allrounder, 1 Mio. Tokens Kontext
MiniMax M3	~0,30 / 1,20 $	1 Mio. Tokens Kontext, versteht auch Bilder
DeepSeek V4 Pro	~0,44 / 0,87 $	Mehr Leistung, immer noch günstig
GLM 5.2	~0,95 / 3,00 $	Aktuelles Flaggschiff von z.ai, 1 Mio. Tokens Kontext

Und wenn Datenschutz an erster Stelle steht, bleibt der lokale Weg von vorhin: null Kosten pro Anfrage, dafür brauchst du die passende Hardware.

Was kostet der Betrieb?

Flat-Illustration, Waage die ein Cloud-Symbol gegen ein Sparschwein abwägt, Münzstapel daneben, blau-gelbe Editorial-Illustration

Hermes selbst ist kostenlos. Bezahlen musst du nur den Denkmotor und, falls gewünscht, den Server. Drei Wege, drei Kostenbilder.

Mein Tipp: Starte lokal auf dem Desktop, das kostet dich nichts außer Strom. Wenn du merkst, dass du feste, wiederkehrende Aufgaben hast, kommt der Server dazu.

Hermes oder ein Cloud-Agent wie der ChatGPT-Agent?

Vielleicht fragst du dich, warum du dir die Mühe machen solltest, wenn es fertige Agenten von OpenAI oder Microsoft gibt. Es ist eine Frage von Kontrolle.

Ein KI-Agent wie Hermes nimmt dir nicht die kreative Arbeit ab. Er nimmt dir die Wiederholung ab. Und genau die frisst bei den meisten Selbstständigen die meiste Zeit.