Montag, 9 Uhr.
Während ich noch meinen ersten Kaffee trinke, liegt in meinem Telegram schon ein fertiger SEO-Report. Klicks der letzten Woche, größte Gewinner, ein Alarm zu einer Seite mit schlechter Klickrate, dazu drei konkrete Empfehlungen. Geschrieben hat ihn der Hermes Agent, ein KI-Agent, der auf meinem Server lebt und arbeitet, während ich schlafe.
Kennst du das Gefühl, dass du dieselben kleinen Aufgaben jede Woche neu erledigst? Reports zusammenklicken, Website prüfen, Newsletter aufsetzen. Genau hier setzt ein KI-Agent an. Er ist kein Chatfenster, das auf deine Frage wartet. Er ist eher ein digitaler Mitarbeiter, der seine Aufgaben kennt und sie eigenständig abarbeitet.
In diesem Artikel zeige ich dir, was der Hermes Agent ist, wofür ich ihn konkret nutze und wie du ihn selbst installierst. Einmal bequem per Desktop-App und einmal auf einem Server. Und der Teil, der mich als deutschen Freelancer am meisten interessiert: wie du Hermes mit einem lokalen KI-Modell betreibst, sodass deine Daten den Rechner nie verlassen.
Hermes Agent: dein KI-Mitarbeiter, der auf deinem eigenen Rechner lebt

Der Hermes Agent ist ein quelloffenes Programm der Firma Nous Research. Quelloffen heißt: der komplette Programmcode liegt offen auf GitHub, frei einsehbar und kostenlos unter der MIT-Lizenz. Du installierst ihn auf deinem eigenen Rechner oder Server. Und dann sprichst du mit ihm. Ganz normal, über einen Messenger wie Telegram, so als würdest du einem Kollegen schreiben.
Der Unterschied zu ChatGPT oder Claude im Browser ist wichtig. Ein Chatbot wartet. Du stellst eine Frage, er antwortet, dann ist Schluss. Ein Agent handelt. Er hat Zugriff auf Werkzeuge wie das Terminal deines Servers, einen Web-Scraper oder deinen GitHub-Account. Er merkt sich, wie du arbeitest. Und er startet Aufgaben zu festen Zeiten von selbst.
Stell dir den Unterschied so vor: Ein Chatbot ist ein Lexikon, das du aufschlägst. Hermes ist eine Assistentin, die morgens an deinem Schreibtisch sitzt und schon angefangen hat.
Damit das funktioniert, braucht Hermes ein KI-Modell als "Denkmotor". Ein KI-Modell (englisch: Large Language Model, kurz LLM) ist das eigentliche Sprachgehirn, das Texte versteht und schreibt. Das Schöne: du entscheidest, welches Gehirn er nutzt. Ein Modell aus der Cloud. Oder ein lokales Modell, das auf deiner eigenen Hardware läuft und deine Daten niemals nach draußen lässt. Genau das macht Hermes für den Datenschutz so spannend.
# Neuer Artikel? Du erfährst es als Erstes.
# Kein Spam. Ein kurzes Mail, wenn etwas erscheint.
Hermes Agent oder Hermes Modell? Kurze Begriffsklärung
Hier lauert eine Verwechslung, die ich gleich aus dem Weg räumen will. Nous Research nennt zwei verschiedene Dinge "Hermes".
Einmal gibt es die Hermes Sprachmodelle (zum Beispiel Hermes 4). Das sind reine KI-Modelle, also Denkmotoren, vergleichbar mit GPT oder Claude.
Und dann gibt es den Hermes Agent. Das ist der Rahmen drumherum, der so ein Modell mit Werkzeugen, Gedächtnis und Messenger-Anbindung verbindet. Der Agent kann ein Hermes-Modell als Motor nutzen, aber genauso gut ein ganz anderes.
In diesem Artikel geht es um den Agent. Wenn ich "Hermes" schreibe, meine ich das Programm auf dem Server, nicht das Sprachmodell.
Was Hermes wirklich kann: meine 5 laufenden Aufgaben

Theorie ist schön. Aber was macht so ein Agent den ganzen Tag? Ich zeige dir, was bei mir tatsächlich läuft. Auf meinem Server arbeiten gerade fünf feste Aufträge, alle melden sich über Telegram.
Der SEO-Montag. Jeden Montag um 9 Uhr fragt Hermes die Google Search Console nach den Zahlen der letzten Woche, holt parallel die aktuellen Rankings für meine Ziel-Keywords und vergleicht alles mit der Vorwoche. Fünf Minuten später habe ich einen fertigen Report im Chat. Früher habe ich dafür rund 45 Minuten in drei Tools geklickt.
Der Newsletter im Zwiegespräch. Dienstags schickt mir Hermes eine nummerierte Liste meiner Blogartikel, die noch nicht im Newsletter waren. Ich antworte mit einer Zahl. Hermes liest den Artikel, schreibt einen Entwurf nach meinen Tonalitäts-Regeln und legt direkt eine Kampagne im E-Mail-Tool an. Ich antworte test, bekomme eine Testmail, sage revise mach den Einstieg direkter und am Ende send. Fertig.
Der stille Wächter. Jede Nacht um 6 Uhr prüft Hermes, ob meine Website erreichbar ist und schnell lädt. Meistens passiert: nichts. Keine Nachricht heißt, alles ist gut. Einmal aber kam morgens ein Alarm. Der Serverprozess der Website war abgestürzt. Neustart, Problem gelöst, bevor der erste Besucher die Seite überhaupt aufgerufen hat.
Dazu kommen zwei Aufräum-Aufgaben: einmal im Monat sucht Hermes nach toten Links in meinen Blogartikeln und prüft, ob es ein Update für ihn selbst gibt.
Was bringt das unterm Strich? Hier die ehrliche Rechnung.
| Aufgabe | Früher manuell | Mit Hermes |
|---|---|---|
| Wöchentlicher SEO-Report | ~45 min | ~2 min (lesen, reagieren) |
| Newsletter (Entwurf bis Versand) | ~60 min | ~10 min |
| Täglicher Website-Check | ~35 min/Woche | 0 min (nur bei Alarm) |
| Broken-Link-Prüfung (monatlich) | ~60 min | 0 min |
| Gesamt pro Woche | ~2,5 Stunden | ~12 Minuten |
Rund zwei Stunden pro Woche, die ich nicht mehr mit Klickarbeit verbringe. Es ist nicht die kreative Arbeit, die Hermes übernimmt. Es sind die immer gleichen Schritte, bei denen ich ohnehin nur einer Checkliste folge.
So lernt Hermes dazu, ohne dass du programmierst

Wie kommt Hermes von "ich kann nichts" zu "ich erledige deinen SEO-Report"? Über drei Bausteine, die zusammenspielen. Und keiner davon verlangt, dass du Code schreibst.
Der erste Baustein sind Fähigkeiten (im Original "Skills"). Eine Fähigkeit ist eine Art Rezept, das beschreibt, wie eine Aufgabe abläuft. Das Besondere: Hermes schreibt diese Rezepte selbst. Du sagst ihm in normaler Sprache, was du regelmäßig brauchst. Er legt dann eine neue Fähigkeit dafür an. Beim nächsten Mal greift er einfach darauf zurück.
Der zweite Baustein ist das Gedächtnis. Hermes speichert in einfachen Textdateien, wer du bist, wie du arbeitest und was er zuletzt erledigt hat. Deshalb musst du ihm nicht jedes Mal alles neu erklären. Er weiß, dass ich auf Deutsch schreibe und meinen Newsletter im Du verfasse.
Der dritte Baustein ist der Zeitplaner (technisch: Cron). Das ist eine feste Liste mit Uhrzeiten und Aufgaben. "Jeden Montag um 9 Uhr" oder "jede Nacht um 6 Uhr". Du sprichst die Zeit in normaler Sprache aus, Hermes übersetzt sie in einen geplanten Auftrag. Genau dieser Zeitplaner macht den Unterschied zum normalen Chatbot. Hermes wartet nicht auf dich, er hat einen Wecker.
Profi-Tipp
Bring jede neue Routine zuerst einmal von Hand zum Laufen, im Chat. Erst wenn das Ergebnis sitzt, lässt du sie als geplanten Auftrag wiederholen. So vermeidest du, dass ein Fehler jede Woche automatisch wiederholt wird.
Schritt für Schritt: Hermes per Desktop-App installieren

Der einfachste Einstieg führt über die Desktop-App. Die gibt es für Mac, Windows und Linux. Sie nimmt dir das Arbeiten im Terminal ab. So gehst du vor:
- App laden. Öffne die offizielle Seite hermes-agent.nousresearch.com und lade den Installer für dein Betriebssystem herunter. Die Seite erkennt automatisch, ob du auf Mac oder Windows bist.
- Installieren und starten. Doppelklick auf die Datei, der Anweisung folgen, dann Hermes öffnen. Falls die App beim ersten Start zickt, hilft meist der Befehl
hermes updateim Terminal, danach klappt der Start. - Modell auswählen. Beim ersten Start fragt dich Hermes nach einem Denkmotor. Du kannst diesen Schritt mit "Choose provider later" erst einmal überspringen und dich in Ruhe in der App umsehen. Über die Einstellungen hinterlegst du später deinen Zugang zu einem KI-Modell.
- Loslegen. Du startest eine neue Sitzung und schreibst wie in einem Chat. Oben im Fenster wählst du das Modell und die Denktiefe. Hermes kann eine Unterhaltung sogar in ein neues Fenster abzweigen, wenn du eine Idee getrennt weiterverfolgen willst.
Damit du Hermes auch unterwegs vom Handy aus erreichst, verbindest du ihn mit Telegram. Das läuft in Kurzform so: Im Telegram schreibst du dem offiziellen Bot @BotFather, lässt dir mit /newbot einen eigenen Bot anlegen und bekommst dafür einen Zugangsschlüssel (Token). Diesen Schlüssel trägst du in Hermes ein, dann antwortet dir dein Agent direkt im Messenger.
Wichtig
Gib bei der Telegram-Anbindung immer deine eigene Nutzer-ID als erlaubten Nutzer an. Sonst könnte theoretisch jede fremde Person, die deinen Bot findet, Befehle auf deinem Rechner auslösen. Diese eine Einstellung ist die wichtigste Sicherheitsmaßnahme beim Start.
Lieber rund um die Uhr? Hermes auf einem Server betreiben

Die Desktop-App hat einen Haken: Sie läuft nur, wenn dein Computer an ist. Mein SEO-Montag um 9 Uhr soll aber auch funktionieren, wenn mein Laptop im Rucksack steckt. Deshalb läuft mein Hermes auf einem kleinen Mietserver (einem VPS, also einem virtuellen Server) bei einem deutschen Anbieter.
Die Installation ist ein einziger Befehl, den du im Terminal des Servers einfügst:
# Mac, Linux oder Server:
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
Danach richtest du Hermes mit einem Assistenten ein:
hermes setup # führt dich durch Modell und Messenger
hermes gateway # startet die Telegram-Anbindung
Soll Hermes auch nach einem Neustart des Servers von allein wieder hochfahren? Dafür läuft er als Hintergrunddienst. Auf meinem Server übernimmt das ein kleiner Wächter des Betriebssystems (systemd). Er startet den Agent bei jedem Reboot automatisch und holt ihn nach einem Absturz binnen Sekunden zurück. Einmal einrichten, nie wieder dran denken.
Wann lohnt sich der Server statt der Desktop-App? Immer dann, wenn du geplante Aufgaben hast, die unabhängig von deinem Rechner laufen sollen. Reports, Überwachung, nächtliche Backups. Für reines Ausprobieren reicht die Desktop-App völlig.
Hermes mit lokalem LLM: DSGVO-freundlich dank LM Studio

Jetzt kommt der Teil, der für dich als Selbstständige oder kleinen Betrieb am wichtigsten ist. Datenschutz. Sobald echte Kundendaten ins Spiel kommen, stellt sich eine simple Frage: Wohin gehen meine Daten eigentlich, wenn ich mit einer KI arbeite?
Bei einem Cloud-Modell wandern deine Eingaben an einen Anbieter, oft in die USA. Bei einem lokalen Modell passiert das nicht. Das Modell läuft auf deiner eigenen Hardware. Kein einziger Prompt verlässt deinen Rechner. Genau hier glänzt Hermes, denn du kannst ihm jeden beliebigen Denkmotor vorsetzen, auch einen lokalen.
Am einfachsten geht das mit LM Studio. Das ist ein kostenloses Programm mit Oberfläche, das KI-Modelle auf deinem Mac oder PC ausführt und sie über einen lokalen Zugang bereitstellt. Hermes kennt LM Studio von Haus aus. So verbindest du beide:
- LM Studio installieren und ein Modell herunterladen. Für einen Mac mit 32 bis 36 GB Arbeitsspeicher nutze ich gern ein lokales Qwen3.6-35B-A3B. Das ist ein Modell mit einem Spezialistenteam im Inneren (Mixture of Experts), das pro Anfrage nur die passenden Experten aktiviert und deshalb sparsam mit dem Speicher umgeht.
- Lokalen Server starten. In LM Studio aktivierst du den Server-Modus. Das Programm stellt dein Modell dann unter einer lokalen Adresse bereit, standardmäßig
http://localhost:1234/v1. - Hermes umstellen. Du führst
hermes modelaus, wählst "LM Studio" und bestätigst die lokale Adresse. Ab jetzt denkt Hermes komplett auf deiner Hardware.
Wichtig
Hermes braucht ein Modell mit einem ausreichend großen Kurzzeitgedächtnis. Das Kurzzeitgedächtnis (Kontextfenster) bestimmt, wie viel Text das Modell auf einmal verarbeiten kann. Für Hermes sollte es bei rund 64.000 Einheiten liegen (Tokens, so heißen die kleinen Textbausteine, in die ein Modell jeden Text zerlegt). Lade in LM Studio also eine Variante deines Modells, die dieses größere Fenster unterstützt, sonst verbindet sich Hermes nicht sauber.
Warum ist das ein Gewinn für den Datenschutz? Weil bei der KI-Verarbeitung kein externer Auftragsverarbeiter mehr im Spiel ist und keine Daten in ein Drittland übertragen werden. Das ist der sauberste Weg, wenn du mit sensiblen Kundendaten arbeitest. Wenn du tiefer einsteigen willst, habe ich das in meinem Artikel zu DSGVO-konformem KI-Coding ausführlich beschrieben.
Eine ehrliche Einordnung gehört dazu: Ein lokales Modell heißt nicht automatisch komplett offline. Wenn dein Agent eine Web-Suche startet, eine E-Mail verschickt oder über Telegram antwortet, verlassen diese Daten trotzdem deinen Rechner. Lokal ist das Sprachgehirn, nicht zwangsläufig jedes Werkzeug. Für den Kern, also deine Prompts und die Antworten, gilt aber: sie bleiben bei dir.
Welches KI-Modell soll Hermes antreiben?

Hermes ist nur die Hülle. Das Modell ist der Motor. Und hier hast du zwei grundsätzliche Wege: ein Modell, für das du sowieso schon zahlst, oder eins, das dich nur pro Nutzung kostet. Beides geht.
Dein vorhandenes Abo weiternutzen
Zahlst du ohnehin schon für ChatGPT, GitHub Copilot oder Grok? Dann kann Hermes dieses Abo als Denkmotor mitbenutzen, ohne dass extra Kosten pro Anfrage anfallen. Du meldest dich einmal über den Browser an (ein sogenannter OAuth-Login, also anmelden ohne einen Schlüssel zu kopieren). Das war's.
| Abo | Mit Hermes nutzbar? | Anmeldung |
|---|---|---|
| ChatGPT Plus / Pro (über OpenAI Codex) | Ja | Browser-Login |
| GitHub Copilot | Ja, über deinen Copilot-Zugang | Browser-Login |
| Grok (X Premium+) | Ja | Browser-Login |
| Claude | Nein, nur per API-Schlüssel | Schlüssel |
| Google Gemini | Nein, nur per API-Schlüssel | Schlüssel |
Eine Sache zu Claude, weil sie sich 2026 geändert hat. Anthropic hat es Drittanbieter-Tools untersagt, sich mit einem Claude-Abo (Pro oder Max) einzuloggen. Wer das früher mit OpenClaw oder ähnlichen Tools gemacht hat, kennt den Ärger. Für Claude in Hermes brauchst du deshalb den API-Schlüssel von Anthropic. Der rechnet pro Nutzung ab. Dein Claude-Abo einfach als Hermes-Motor mitzunutzen, geht heute nicht mehr.
Wichtig
Ein Abo ist für einen Menschen im Chat gedacht, nicht für einen Agenten, der rund um die Uhr Anfragen feuert. Du kannst schneller an die Nutzungsgrenzen deines Abos stoßen, als dir lieb ist. Manche Anbieter erlauben das Mitbenutzen über fremde Tools laut ihren Nutzungsbedingungen außerdem nur eingeschränkt. Lies im Zweifel das Kleingedruckte deines Anbieters.
Günstig pro Nutzung: offene Modelle über OpenRouter
Wenn deine Aufgaben keine sensiblen Personendaten anfassen, ist der pragmatischste Weg ein günstiges, offenes Modell. Über einen Anbieter wie OpenRouter (ein Sammelzugang zu hunderten Modellen mit einem einzigen Schlüssel) zahlst du nur, was du wirklich verbrauchst. Und das ist bei diesen Modellen erstaunlich wenig.
Hier ein paar starke, günstige Modelle mit ihren Live-Preisen bei OpenRouter (Stand 24. Juni 2026, Preise ändern sich schnell):
| Modell | Preis je 1 Mio. Tokens (rein / raus) | Hinweis |
|---|---|---|
| GLM 4.7 Flash | ~0,06 / 0,40 $ | Sehr günstig und flott |
| DeepSeek V4 Flash | ~0,09 / 0,18 $ | Günstigster Allrounder, 1 Mio. Tokens Kontext |
| MiniMax M3 | ~0,30 / 1,20 $ | 1 Mio. Tokens Kontext, versteht auch Bilder |
| DeepSeek V4 Pro | ~0,44 / 0,87 $ | Mehr Leistung, immer noch günstig |
| GLM 5.2 | ~0,95 / 3,00 $ | Aktuelles Flaggschiff von z.ai, 1 Mio. Tokens Kontext |
Ein Token ist die kleine Texteinheit von vorhin. Eine Million davon sind grob 750.000 Wörter. Jetzt der Vergleich, der wehtut: Ein Spitzenmodell wie GPT-5.5 oder Claude Opus kostet beim Ausgeben rund 25 bis 30 $ pro Million Tokens. MiniMax M3 liegt bei 1,20 $. DeepSeek V4 Flash bei 18 Cent. Selbst ein neues Flaggschiff wie GLM 5.2 ist mit 3 $ noch ein Bruchteil davon. Du zahlst also oft nur ein Zehntel bis ein Zwanzigstel. Für einen Agenten, der den ganzen Tag im Hintergrund Token frisst, ist das der Unterschied zwischen ein paar Euro und ein paar hundert Euro im Monat.
Mein eigener Hermes läuft genau so. MiniMax M3 über OpenRouter, günstig und schnell genug für Reports und Newsletter-Entwürfe. Meine Aufgaben fassen ohnehin keine Kundendaten an, deshalb brauche ich dafür kein lokales Modell.
Und wenn Datenschutz an erster Stelle steht, bleibt der lokale Weg von vorhin: null Kosten pro Anfrage, dafür brauchst du die passende Hardware.
Was kostet der Betrieb?

Hermes selbst ist kostenlos. Bezahlen musst du nur den Denkmotor und, falls gewünscht, den Server. Drei Wege, drei Kostenbilder.
Mit einem lokalen Modell zahlst du für die KI gar nichts. Keine laufende Rechnung, keine Begrenzung der Anfragen. Du brauchst nur einen Rechner mit genug Arbeitsspeicher, idealerweise einen Mac mit Apple Silicon oder einen PC mit guter Grafikkarte.
Mit einem Cloud-Modell zahlst du pro Nutzung. Über einen Anbieter wie OpenRouter hinterlegst du einen Zugangsschlüssel und gibst dir am besten ein monatliches Limit, etwa 20 €, als Kostenbremse. Du wechselst das Modell mit einem Befehl, je nachdem, ob du Tempo oder Sparsamkeit brauchst.
Dazu kommt der Server, wenn du Aufgaben rund um die Uhr laufen lassen willst. Ein kleiner VPS liegt je nach Anbieter im niedrigen zweistelligen Bereich pro Monat. Mein Hermes läuft auf einem deutschen Server und nutzt aktuell ein günstiges Cloud-Modell als Motor, weil meine Aufgaben keine sensiblen Personendaten anfassen.
Mein Tipp: Starte lokal auf dem Desktop, das kostet dich nichts außer Strom. Wenn du merkst, dass du feste, wiederkehrende Aufgaben hast, kommt der Server dazu.
Hermes oder ein Cloud-Agent wie der ChatGPT-Agent?
Vielleicht fragst du dich, warum du dir die Mühe machen solltest, wenn es fertige Agenten von OpenAI oder Microsoft gibt. Es ist eine Frage von Kontrolle.
Ein Cloud-Agent läuft auf den Servern des Anbieters. Du bekommst, was vorgesehen ist. Deine Daten liegen dort. Hermes läuft auf deiner Maschine. Du bestimmst, welches Modell denkt, welche Werkzeuge er anfassen darf und ob überhaupt Daten nach außen gehen.
Für viele alltägliche Aufgaben ist ein Cloud-Agent völlig in Ordnung. Bequem, schnell, fertig eingerichtet. Aber wenn dir Eigentum und Datenschutz wichtig sind, dazu ein Agent, der wirklich dir gehört und mit der Zeit deine Arbeitsweise lernt, dann ist ein selbst betriebener Agent wie Hermes die ehrlichere Wahl.
Ein KI-Agent wie Hermes nimmt dir nicht die kreative Arbeit ab. Er nimmt dir die Wiederholung ab. Und genau die frisst bei den meisten Selbstständigen die meiste Zeit.
Wenn du das Gefühl hast, dass in deinem Arbeitsalltag zu viele Routineaufgaben hängen, lass uns gemeinsam schauen, wo ein eigener, DSGVO-freundlicher KI-Agent dir konkret hilft. In meiner KI-Beratung finden wir heraus, welche deiner Aufgaben sich automatisieren lassen und welches Setup für dich Sinn ergibt.




