Kategorie: Tool-Tests

  • Remote agents in Vibe. Powered by Mistral Medium 3.5.

    Remote agents in Vibe. Powered by Mistral Medium 3.5.

    Stell dir vor, du programmierst auf deinem Laptop und musst eine große Aufgabe erledigen, wie einen Fehler in einem Spiel zu finden. Bisher musstest du die ganze Zeit am Computer sitzen und warten. Jetzt gibt es eine neue Technik: Coding-Agenten, die in der Cloud arbeiten. Sie laufen auf einem fernen Computer im Internet, nicht auf deinem. Du startest sie und machst weiter mit deinem Tag. Wenn sie fertig sind, bekommst du eine Nachricht. Das ist wie ein Helfer, der für dich arbeitet, während du etwas anderes machst.

    Diese neuen Helfer heißen Mistral Medium 3.5. Sie sind wie ein schlauer Assistent beim Programmieren. Du nutzt sie im Mistral Vibe CLI oder direkt in Le Chat. Le Chat ist ein Programm zum Chatten, ähnlich wie WhatsApp. Hier stellst du Programmieraufgaben. Der Helfer arbeitet im Hintergrund, während du weiterchattest. Das ist praktisch, weil du nicht auf jeden Schritt warten musst.

    Was ist Mistral Medium 3.5?

    Mistral Medium 3.5 ist ein neues Modell mit verschiedenen Fähigkeiten. Es befolgt Anweisungen, denkt logisch und programmiert. Es hat 128 Milliarden Parameter. Ein Parameter ist wie ein kleines Bauteil im Gehirn des Computers. Je mehr, desto schlauer. Es verarbeitet bis zu 256.000 Zeichen auf einmal – so lang wie ein ganzes Buch. Du kannst es auf deinem eigenen Computer laufen lassen, wenn du vier Grafikkarten hast. Grafikkarten sind spezielle Teile im Computer für schnelle Berechnungen.

    Dieses Modell ist gut in Tests. Es erreichte 77,6% bei einem Test namens SWE-Bench Verified. Das ist besser als viele andere Modelle. Es versteht auch Bilder, weil es einen speziellen Teil hat, der für Bilder trainiert wurde. Das ist nützlich, wenn du ein Bild von einem Fehler in deinem Programm zeigst. Der Helfer sieht, was falsch ist, und hilft dir.

    Remote agents in Vibe

    Ab heute laufen Coding-Sessions in der Cloud, während du weg bist. Du startest viele davon gleichzeitig. Das ist wie mehrere Hausaufgaben auf einmal, aber der Computer macht sie für dich. Du startest sie im Mistral Vibe CLI oder in Le Chat. Während sie laufen, siehst du, was sie tun: welche Dateien sie ändern, welche Werkzeuge sie benutzen und wie weit sie sind. Wenn du eine lokale Session auf deinem eigenen Computer hast, verschiebst du sie in die Cloud. Dann läuft sie weiter, auch wenn du deinen Laptop ausschaltest.

    Vibe arbeitet mit Systemen zusammen, die Entwickler kennen: GitHub, Linear, Jira, Sentry, Slack und Teams. Jede Session läuft in einer isolierten Umgebung. Sie kann kein Schaden an deinem richtigen System anrichten. Wenn die Arbeit fertig ist, erstellt der Helfer einen Pull Request auf GitHub und sagt dir Bescheid. Ein Pull Request ist ein Vorschlag, um Code zu ändern. Du prüfst nur das Ergebnis, nicht jeden Schritt.

    Diese Technik ist perfekt für Aufgaben, die viel Arbeit machen, aber wenig Nachdenken erfordern: Code umstrukturieren, Tests erstellen, Programmbibliotheken aktualisieren oder Fehler beheben. Du startest diese Aufgaben und machst mit wichtigeren Dingen weiter.

    Work mode in Le Chat

    Le Chat hat jetzt einen neuen Modus namens Work mode. Das ist ein mächtiger Agent für komplexe Aufgaben. Er benutzt mehrere Werkzeuge gleichzeitig und arbeitet an großen Projekten. Zum Beispiel prüft er deine E-Mails, Nachrichten und Termine in einem Durchgang. Oder er bereitet ein Meeting vor, indem er Informationen über Teilnehmer sammelt und eine Zusammenfassung erstellt. Er führt Recherchen durch, durchsucht das Internet und interne Dokumente, und schreibt einen Bericht. Du bearbeitest diesen Bericht, bevor du ihn versendest.

    Work mode sortiert deine E-Mails und schlägt Antworten vor. Er erstellt Aufgaben in Jira, basierend auf Diskussionen mit deinem Team. Und er sendet eine Zusammenfassung an dein Team auf Slack. Die Sessions dauern länger als normale Chat-Antworten. Der Agent arbeitet über viele Schritte hinweg, durch Versuch und Irrtum, bis die Aufgabe erledigt ist.

    Im Work mode sind die Verbindungen zu anderen Programmen standardmäßig eingeschaltet. Der Agent greift auf Dokumente, E-Mails, Kalender und andere Systeme zu, um die richtigen Informationen zu bekommen. Du siehst jede Aktion und die Gedankengänge dahinter. Bevor der Agent sensible Aktionen ausführt, wie das Senden einer Nachricht oder das Ändern eines Dokuments, fragt er dich um Erlaubnis. So behältst du die Kontrolle.

    Wie du anfangen kannst

    Mistral Medium 3.5 ist ab heute in Mistral Vibe und Le Chat verfügbar. Es unterstützt die Remote-Coding-Agenten und den Work mode in Le Chat für die Pro-, Team- und Enterprise-Pläne. Über die API kostet es 1,5 Dollar pro Million eingegebener Token und 7,5 Dollar pro Million ausgegebener Token. Ein Token ist ein Stück Text, etwa ein Wort oder ein Teil davon. Die offenen Gewichte sind auf Hugging Face verfügbar unter einer modifizierten MIT-Lizenz. Du kannst das Modell herunterladen und selbst benutzen. Es ist auch auf NVIDIA GPU-beschleunigten Endpunkten verfügbar, zum Beispiel auf build.nvidia.com und als NVIDIA NIM.

    Diese Technologie hilft dir, schneller und effizienter zu programmieren. Du lagerst Aufgaben aus und arbeitest parallel. Das spart Zeit und Nerven. Probiere es aus und lass dich überraschen, wie viel einfacher Programmieren sein kann.

    Quellenangabe

    Dieser Artikel basiert auf einem Originalartikel: https://mistral.ai/news/vibe-remote-agents-mistral-medium-3-5

  • OpenAI Privacy Filter: Dein Datenschutz-Helfer für KI

    OpenAI Privacy Filter: Dein Datenschutz-Helfer für KI

    Stell dir vor, du schreibst eine E-Mail oder einen Chat mit einer KI und gibst dabei aus Versehen deine Adresse, Telefonnummer oder dein Geburtsdatum preis. Das willst du nicht. Genau hier kommt der OpenAI Privacy Filter ins Spiel. Das ist ein neues Werkzeug von OpenAI, das hilft, persönliche Daten in Texten zu finden und zu verstecken. In diesem Blogpost erkläre ich dir, was das ist, wie es funktioniert und warum es für deine Privatsphäre wichtig ist.

    Was ist der OpenAI Privacy Filter?

    Der OpenAI Privacy Filter ist ein sogenanntes Open-Weight-Modell. Ein Modell ist ein kleines Computerprogramm, das gelernt hat, Muster zu erkennen. Open-Weight bedeutet, dass die Gewichte des Modells – die Einstellungen, die es intelligent machen – für jeden frei zugänglich sind. Das ist praktisch, weil dann jeder Entwickler das Modell herunterladen und für seine eigenen Programme nutzen kann. Der Filter wurde speziell dafür trainiert, PII zu erkennen. PII steht für Personally Identifiable Information – auf Deutsch: personenbezogene Daten. Das sind alle Informationen, mit denen man eine bestimmte Person identifizieren kann, wie Name, Adresse, E-Mail, Telefonnummer, Kreditkartennummer oder sogar Passwörter.

    Wie funktioniert die PII Erkennung?

    Der Privacy Filter durchsucht einen Text und markiert alle Stellen, an denen solche persönlichen Daten vorkommen. Stell dir vor, du hast eine E-Mail geschrieben: „Hallo Max, meine Telefonnummer ist 0176-12345678.“ Der Filter erkennt dann, dass „0176-12345678“ eine Telefonnummer ist, und kann sie durch etwas wie [PRIVATE_PHONE] ersetzen. Das nennt man PII schwärzen – also die Daten unkenntlich machen. Der Filter versteht auch den Zusammenhang. Wenn du schreibst „Ich wohne in Berlin“, erkennt er nicht automatisch, dass Berlin eine private Adresse ist, weil Berlin eine große Stadt ist. Aber wenn du schreibst „Meine Adresse ist Musterstraße 12, 12345 Berlin“, dann wird das als private Adresse erkannt. So vermeidet der Filter Fehler, die einfache Programme machen.

    Warum ist das besser als alte Methoden?

    Früher haben Programme oft nur nach bestimmten Mustern gesucht, wie nach einer Zahlenfolge, die wie eine Telefonnummer aussieht. Das hat viele Fehler gemacht. Eine Bestellnummer wie „1234-5678-9012“ könnte auch wie eine Kreditkartennummer aussehen, obwohl sie gar keine ist. Der OpenAI Privacy Filter ist schlauer: Er nutzt Künstliche Intelligenz (KI), um den Text zu verstehen. Er erkennt, ob eine Zahl wirklich eine private Telefonnummer oder nur eine Produkt-ID ist. Das ist context-aware, also kontextbewusst. Dadurch werden weniger echte Daten versehentlich gelöscht oder falsche Daten übersehen.

    Was ist ein Open-Weight-Modell für Datenschutz?

    Ein Open-Weight-Modell für Datenschutz bedeutet, dass du den Filter auf deinem eigenen Rechner laufen lassen kannst. Du musst deine Daten nicht zu einem Server von OpenAI schicken. Das ist super für die Privatsphäre. Denn wenn du lokale PII Erkennung ohne Server machst, bleiben deine persönlichen Daten auf deinem Gerät. Niemand anders kann sie sehen. Das ist besonders wichtig, wenn du mit sensiblen Informationen arbeitest, zum Beispiel in einer Arztpraxis oder einer Bank. Der Filter ist auch schnell: Er kann Texte mit bis zu 128.000 Zeichen auf einmal verarbeiten – das ist so lang wie ein ganzes Buchkapitel.

    Wie gut ist der Filter im Test?

    OpenAI hat den Filter auf einem speziellen Test, dem PII-Masking-300k Benchmark, geprüft. Ein Benchmark ist wie ein Wettbewerb, bei dem verschiedene Programme verglichen werden. Der Privacy Filter hat dabei eine Genauigkeit von über 96% erreicht. Das bedeutet: Von 100 persönlichen Daten hat er 96 richtig erkannt und geschwärzt. Das ist state-of-the-art, also der beste Wert, den es derzeit gibt. Natürlich macht er auch mal Fehler – zum Beispiel bei sehr seltenen Namen oder wenn der Text sehr kurz ist. Aber insgesamt ist er zuverlässig.

    Welche Daten kann der Filter erkennen?

    Der Filter kann acht verschiedene Kategorien von persönlichen Daten erkennen:

    • private_person – Namen von Personen
    • private_address – Adressen
    • private_email – E-Mail-Adressen
    • private_phone – Telefonnummern
    • private_url – private Internetadressen
    • private_date – private Daten wie Geburtstage
    • account_number – Kontonummern, Kreditkartennummern
    • secret – Passwörter, API-Schlüssel

    Stell dir vor, du hast einen Text mit deiner Kreditkartennummer. Der Filter kann sie durch [ACCOUNT_NUMBER] ersetzen. Oder wenn du dein Passwort in eine Nachricht schreibst, wird es durch [SECRET] maskiert. So bleiben deine Daten sicher.

    Wie können Entwickler den Filter nutzen?

    Entwickler können den Filter von Hugging Face oder GitHub herunterladen und in ihre eigenen Programme einbauen. Sie können ihn auch an ihre speziellen Bedürfnisse anpassen, indem sie ihn mit eigenen Daten trainieren. Das nennt man Fine-Tuning. Wenn zum Beispiel eine Firma viele medizinische Texte verarbeitet, kann sie den Filter so trainieren, dass er auch spezielle medizinische Begriffe erkennt. Der Filter ist klein und schnell – er hat nur 1,5 Milliarden Parameter, aber nur 50 Millionen sind aktiv. Das macht ihn effizient.

    Was sind die Grenzen?

    Der Filter ist kein Allheilmittel. Er kann nicht alle Fehler vermeiden. In sehr wichtigen Bereichen wie Recht, Medizin oder Finanzen sollte immer noch ein Mensch die Daten überprüfen. Außerdem funktioniert er am besten auf Englisch und kann bei anderen Sprachen oder seltenen Namen schlechter sein. Aber für den Alltag und viele Anwendungen ist er ein nützliches Werkzeug.

    Warum ist das für dich wichtig?

    Als Schüler der 8. Klasse nutzt du vielleicht schon KI-Chatbots oder schreibst E-Mails. Manchmal gibst du dabei aus Versehen persönliche Daten preis. Mit dem Privacy Filter könnten solche Programme deine Daten automatisch schützen. Du könntest zum Beispiel einen Chatbot fragen, ob er deine Hausaufgaben korrigiert, ohne dass er deinen Namen oder deine Adresse speichert. Das gibt dir mehr Kontrolle über deine Privatsphäre. Und weil der Filter auf deinem eigenen Gerät läuft, weiß niemand, was du schreibst.

    Fazit

    Der OpenAI Privacy Filter ist ein cleveres Werkzeug, das persönliche Daten in Texten erkennt und schützt. Er ist offen, schnell und genau. Er hilft dabei, dass KI-Systeme die Welt kennenlernen, aber nicht dich als Privatperson. Wenn du mehr über Datenschutz lernen willst, ist das ein gutes Beispiel dafür, wie moderne Technik unsere Privatsphäre bewahren kann. Probier es aus – deine Daten werden es dir danken.

  • Claude Code Routines: Automatisierung für Softwareentwickler einfach erklärt

    Claude Code Routines: Automatisierung für Softwareentwickler einfach erklärt

    Stell dir einen digitalen Helfer vor, der Aufgaben für dich erledigt. Immer zur richtigen Zeit, ohne dass du daran denken musst. Das sind Routinen in Claude Code. Claude Code ist ein Werkzeug für Softwareentwickler. Es hilft beim Programmieren.

    Routinen sind automatische Abläufe. Du richtest sie einmal ein. Danach laufen sie von selbst. Das ist wie ein Wecker, der deine Morgenroutine startet. Hier geht es um Programmieraufgaben.

    Was sind Routinen?

    Eine Routine ist eine Automatisierung in Claude Code. Du konfigurierst sie einmal. Du gibst an, was gemacht werden soll und wann. Du verbindest die Routine mit deinen Projekten.

    Die Routine läuft auf der Infrastruktur von Claude Code. Dein Laptop muss nicht eingeschaltet sein. Die Arbeit passiert in der Cloud. Die Routine arbeitet selbstständig weiter.

    Drei Arten von Routinen

    Routinen können auf drei Arten starten. Jede Art hat ihren Einsatzzweck.

    Geplante Routinen

    Geplante Routinen laufen nach einem Zeitplan. Du bestimmst, wie oft sie ausgeführt werden. Zum Beispiel stündlich, täglich oder wöchentlich.

    Ein Beispiel: Jede Nacht um 2 Uhr holt Claude Code den wichtigsten Fehlerbericht. Es versucht, den Fehler zu beheben. Dann öffnet es einen Entwurf für eine Code-Änderung.

    API-Routinen

    API-Routinen werden durch Aufrufe von anderen Programmen gestartet. API ist eine Schnittstelle. Sie ermöglicht, dass Programme miteinander reden. Jede Routine bekommt eine eigene Internet-Adresse und einen Sicherheitsschlüssel.

    Andere Programme können eine Nachricht an diese Adresse schicken. Das startet die Routine. Zum Beispiel: Dein Bereitschaftsdienst-System schickt eine Warnung. Claude Code liest die Warnung. Es findet den betroffenen Dienst. Dann schreibt es eine Zusammenfassung in den Chat.

    GitHub-Webhook-Routinen

    Diese Routinen starten bei Ereignissen in GitHub. GitHub ist eine Plattform für Programmierprojekte. Webhooks sind Benachrichtigungen bei bestimmten Ereignissen. Zum Beispiel wenn jemand neuen Code einreicht.

    Ein Beispiel: Du möchtest, dass Claude Code alle Code-Änderungen prüft, die ein bestimmtes Modul betreffen. Bei jeder Änderung startet Claude Code. Es prüft die Änderung und schreibt eine Zusammenfassung.

    Was können Teams mit Routinen machen?

    Teams nutzen Routinen für verschiedene Aufgaben.

    Verwaltung der Aufgabenliste

    Jede Nacht prüft Claude Code neue Aufgaben in der Liste. Es sortiert die Aufgaben, vergibt Labels und weist sie zu. Dann schreibt es eine Zusammenfassung in den Team-Chat.

    Dokumentation aktuell halten

    Einmal pro Woche scannt Claude Code alle eingereichten Code-Änderungen. Es sucht nach Dokumentation mit veralteten Informationen. Dann öffnet es Änderungsvorschläge.

    Bereitstellung prüfen

    Nach jeder neuen Programmversion startet Claude Code automatisch Tests. Es prüft, ob alles funktioniert. Es sucht in Fehlerprotokollen nach Problemen. Dann teilt es dem Team mit, ob die Version freigegeben werden kann.

    Code-Überprüfung automatisieren

    Bei neuen Code-Einreichungen startet Claude Code. Es prüft den Code nach den Regeln des Teams. Es sucht nach Sicherheitsproblemen. Es prüft die Leistung. Dann hinterlässt es Kommentare im Code.

    Wie fängt man mit Routinen an?

    Routinen sind verfügbar. Du brauchst einen Claude Code Account. Es gibt verschiedene Tarife. Die meisten unterstützen Routinen. Du kannst auf der Claude Code Website deine erste Routine erstellen.

    Jede Routine verbraucht etwas von deinem Monatskontingent. Pro-Nutzer können bis zu 5 Routinen pro Tag laufen. Max-Nutzer bis zu 15 Routinen. Team- und Enterprise-Nutzer bis zu 25 Routinen.

    Warum sind Routinen wichtig?

    Routinen sparen Zeit und machen die Arbeit zuverlässiger. Stell dir vor, du musst jeden Tag die gleiche Aufgabe machen. Irgendwann vergisst du es vielleicht. Eine Routine macht die Aufgabe immer, pünktlich und genau.

    Für Softwareteams bedeutet das: Mehr Zeit für kreative Arbeit. Weniger Zeit für Wiederholungen. Bessere Qualität, weil Prüfungen nie vergessen werden. Schnellere Reaktion auf Probleme.

    Die Zukunft der Routinen

    Die Entwickler von Claude Code planen Erweiterungen. Routinen sollen von noch mehr Ereignissen starten können. Nicht nur von GitHub, sondern von vielen Quellen.

    Routinen sind ein Werkzeug in der Softwareentwicklung. Sie helfen Teams, effizienter zu arbeiten. Sie sorgen für bessere Qualität.

    Für Schüler der 8. Klasse ist das ein Einblick in die Softwareentwicklung. Es zeigt, wie Automatisierung funktioniert. Wer sich für Computer interessiert, findet hier ein Thema.

    Dieser Artikel basiert auf einem Originalartikel: https://claude.com/blog/introducing-routines-in-claude-code

  • NotebookLM: Die Revolution in der KI-Recherche

    NotebookLM: Die Revolution in der KI-Recherche

    KI-Tools gibt es mittlerweile wie Sand am Meer. Die meisten machen dasselbe: Du tippst eine Frage, die KI antwortet — und manchmal erfindet sie dabei Fakten, die schlicht falsch sind. NotebookLM funktioniert anders. Ich nutze es seit einigen Monaten regelmäßig und erkläre dir hier, was es von anderen Tools unterscheidet.

    Was ist NotebookLM?

    NotebookLM ist ein kostenloses KI-Tool von Google. Das Besondere: Es antwortet nicht aus seinem allgemeinen Trainingswissen, sondern ausschließlich aus den Quellen, die du ihm gibst. PDFs, Webseiten, YouTube-Videos, Google Docs — du lädst sie hoch, und NotebookLM arbeitet nur damit.

    Das löst das größte Problem von KI-Chats: Halluzinationen. Wenn NotebookLM etwas nicht in deinen Quellen findet, sagt es das — anstatt etwas zu erfinden.

    Wie funktioniert das in der Praxis?

    Du erstellst ein sogenanntes Notebook und lädst deine Quellen hoch. Das kann ein Jahresbericht sein, eine Bedienungsanleitung, mehrere Fachartikel oder die Aufzeichnung eines Meetings. Danach stellst du Fragen — und NotebookLM antwortet mit direkten Verweisen auf die jeweilige Quelle.

    Ein konkretes Beispiel aus meiner Arbeit: Ich habe drei verschiedene KI-Studien in ein Notebook geladen und gefragt, welche Branchen in allen drei Studien als Hauptprofiteure genannt werden. Das hätte mich ohne KI eine Stunde gekostet. NotebookLM hat es in Sekunden erledigt — mit genauen Quellenangaben.

    Was kann NotebookLM noch?

    • Audio-Zusammenfassung: NotebookLM kann einen Podcast-ähnlichen Dialog zwischen zwei KI-Stimmen generieren, die deine Quellen besprechen. Gut zum Wiederholen von Inhalten.
    • Mindmaps und Zusammenfassungen: Automatisch generiert aus deinen Dokumenten.
    • Briefings erstellen: Eine kompakte Übersicht über deine Quellen als Einstiegspunkt.
    • Quizze: Zum Testen ob man den Inhalt verstanden hat — nützlich fürs Lernen.

    Für wen lohnt sich NotebookLM?

    Für jeden, der regelmäßig mit größeren Textmengen arbeitet. Konkret: Unternehmer die Verträge, Berichte oder Marktanalysen auswerten. Gründer die Businesspläne oder Förderbedingungen durcharbeiten. Alle die Meetings dokumentieren und schnell auf Inhalte zugreifen wollen.

    Weniger geeignet ist es für kreative Aufgaben wie Texte schreiben oder Brainstorming — dafür gibt es bessere Tools.

    Datenschutz

    NotebookLM ist ein Google-Produkt. Wer sensible Unternehmensdaten nicht bei Google hochladen möchte, sollte das berücksichtigen. Für öffentlich zugängliche Quellen oder eigene Dokumente ohne Vertraulichkeitsgrad ist es unproblematisch.

    Häufige Fragen

    Kostet NotebookLM etwas?

    Die Basisversion ist kostenlos. Es gibt eine kostenpflichtige NotebookLM Plus Version mit höheren Nutzungsgrenzen und zusätzlichen Funktionen.

    Welche Dateiformate werden unterstützt?

    PDFs, Google Docs, Google Slides, Webseiten (via URL), YouTube-Videos und einfache Textdateien. Word-Dateien müssen vorher konvertiert werden.

    Wie viele Quellen kann ich hochladen?

    In der kostenlosen Version bis zu 50 Quellen pro Notebook, mit bis zu 500.000 Wörtern je Quelle.

    Ist NotebookLM besser als ChatGPT?

    Es ist anders, nicht besser. ChatGPT ist stärker bei kreativen Aufgaben und allgemeinen Fragen. NotebookLM ist präziser wenn es um das Arbeiten mit eigenen Dokumenten geht. Ich nutze beide — je nach Aufgabe.

    Kann NotebookLM auf das Internet zugreifen?

    Nur über Quellen die du selbst als URLs hinzufügst. Es durchsucht nicht eigenständig das Internet.