Agentic Coding mit LLMs: Der Einstieg in die Entwickler-Matrix
In der sich ständig weiterentwickelnden Landschaft der Softwareentwicklung stehen wir an der Schwelle zu einer neuen Ära - einer Ära, in der Entwickler und KI auf eine Weise zusammenarbeiten, die einst im Reich der Science-Fiction angesiedelt war. Dies ist die Geschichte meiner Reise durch die Revolution des agentenbasierten Programmierens, von den ersten Experimenten mit lokalen Modellen bis hin zu den ausgefeilten Workflows, die durch Tools wie Windsurf ermöglicht werden.
Die rote Pille der Entwicklung
Erinnern Sie sich an den Schlüsselmoment in The Matrix, als Neo die rote Pille wählt? Genau so habe ich mich gefühlt, als ich anfing, mit LLMs in meinem Entwicklungsworkflow zu experimentieren. Meine Reise begann mit einfachen Projekten, um die Fähigkeiten verschiedener Modelle zu testen, darunter Claude Sonet, Mistral und GPT.
Als CTO musste ich ein Gleichgewicht zwischen Innovation und Risikomanagement finden. Agentic Coding hat sich in dieser Hinsicht als unschätzbar wertvoll erwiesen, da es mir ermöglicht,:
- Schnelle Erstellung von Prototypen für neue Funktionen
- Einhaltung der DSGVO
- Optimierung von Entwicklungs-Workflows
- Sicherstellung der Code-Qualität über alle Projekte hinweg
Meine ersten Schritte in der Code-Matrix
Meine ersten Experimente konzentrierten sich auf die Entwicklung von Themen für Ghost CMS und die Integration eines 3D-Viewers auf der Grundlage von pmndrs-Repos mit Three.js. Dieses Projekt diente mir als Testfeld, um die Stärken und Grenzen der verschiedenen LLMs zu verstehen.
Navigieren in der Matrix für Entwickler
1. Modellexploration
Das Testen und Vergleichen verschiedener LLMs im Jahr 2024/2025 offenbart unterschiedliche Eigenschaften und Fähigkeiten:
Claude Sonet (Anthropic): Bekannt für seine Stabilität und seine fortgeschrittenen Argumentationsfähigkeiten, obwohl es eine der teureren Optionen bleibt. Jüngste Updates haben die Genauigkeit der Code-Vervollständigung um 15 % verbessert.
Deepseek (CN): Die Modelle R1 und V3 sind aufgrund ihrer Geschwindigkeit und Zuverlässigkeit nach wie vor sehr beliebt. Die neueste Version (V3.2) bietet eine verbesserte edit_tool-Integration und eine bessere Kontextbehandlung.
GPT-4o (OpenAI): Die neueste Version bietet schnellere Reaktionszeiten und ein besseres Code-Verständnis, ist aber nach wie vor kostspielig. Die neue Funktion 'Code Interpreter' bietet Debugging-Vorschläge in Echtzeit.
Llama 3.3 (Meta): Ein Kraftpaket für Entwickler, das hervorragende Code-Erklärung und Debugging-Unterstützung bietet. Seine Open-Source-Natur macht es zu einem Favoriten für Anpassungen.
Mistral 2.0 (FRA/EU): Bekannt für seine außergewöhnliche Code-Vervollständigung und lokalen Einsatzmöglichkeiten. Die neueste Version unterstützt größere Kontextfenster (bis zu 128k Token).
Gemini Pro (Google): Bietet eine starke Integration mit den Entwickler-Tools und Cloud-Diensten von Google. Die Funktion „Code Assistant“ bietet Echtzeit-Vorschläge und Fehlererkennung.
Jüngste Benchmarks zeigen, dass sich die Genauigkeit der Codegenerierung bei allen Modellen verbessert hat, doch hängt die Wahl von den spezifischen Anforderungen ab:
- Für schnelles Prototyping: GPT-4o und Llama 3.3 sind führend
- Für Kosteneffizienz: Deepseek V3 und Mistral 2.0 sind die erste Wahl
- Für die Sicherheit in Unternehmen: Claude Sonet ist nach wie vor der Goldstandard
- Für Open-Source-Flexibilität: Llama 3.3 und Mistral 2.0 sind ideal
Das Verständnis dieser Eigenschaften hilft bei der Auswahl des richtigen Werkzeugs für bestimmte Entwicklungsaufgaben, sei es für Rapid Prototyping, Debugging oder die Pflege von Legacy-Code.
2. Lokale Entwicklung
Lokale Modelle mit Ollama waren vielversprechend, hatten aber mit der Kontextlänge zu kämpfen. Während die Konsistenz bei der Fortsetzung früherer Arbeiten überraschend gut war, erwies sich die Verwaltung und Aktualisierung lokaler LLMs als zeitaufwändig.
3. Vergleichende Analyse
Deepseek und seine neuesten Argumentationsmodelle haben meine Herangehensweise an die vergleichende Arbeit revolutioniert, insbesondere mit Tools wie Cline und Windsurf. Die Fähigkeit, Gedankenketten zu verfolgen, wurde besonders wertvoll bei der Arbeit mit großen, bereits existierenden Codebasen. Zu verstehen, was die Entscheidung antreibt, sich jedem Input zu nähern, der dem LLM gegeben wird, ist entscheidend und vorteilhaft für die Entwicklung.
4. Workflow-Integration
Mein Arbeitsablauf hat sich weiterentwickelt und konzentriert sich auf Effizienz und Präzision. Ganz gleich, ob ich Merge Requests überprüfe, Legacy-Code entwirre oder UI-Elemente poliere, meine Tools passen sich der jeweiligen Aufgabe an.
Die Modernisierung des Ghost CMS-Themes beispielsweise war wie eine Zeitmaschine, die sowohl die Vergangenheit als auch die Gegenwart unserer Codebasis verstand. Auch die Implementierung einer komplexen Funktion für meine Website verlief nahtlos - vom ersten Commit bis zur endgültigen Freigabe konnte ich mich dank des Kontextbewusstseins darauf konzentrieren. Außerdem gab es mir genug Hoffnung, um weiterzumachen und meinen agenturischen Programmierworkflow zu verbessern.
Der Schlüssel ist Flexibilität. Werkzeuge sollten die Kreativität fördern und nicht einschränken, damit ich mich auf die Kunst der Entwicklung konzentrieren kann. Es geht darum, ein wertvolles Ergebnis zu schaffen.
Die Entwicklung der Agentencodierung
Die Landschaft der Agentencodierung hat sich seit meinen ersten Experimenten dramatisch entwickelt. Heute verwende ich hauptsächlich Windsurf, dessen diff- und flussbasierter Ansatz sich gegenüber der Cursor-Methodik als überlegen erwiesen hat. Ein wichtiges Unterscheidungsmerkmal ist Windsurfs Implementierung von Deepseek, die Cursor fehlt. Diese Entwicklung spiegelt die Entwicklung von Neo in The Matrix wider - von der Entdeckung der digitalen Welt zur Beherrschung derselben. Offensichtlich folge ich nur meiner anfänglichen Matrix-Analogie, aber so habe ich mich tatsächlich gefühlt.
Windsurf vs. Cursor
Analytisch: Cascade liefert detaillierte Informationen darüber, was und wie es die bereits vorhandene Codebasis untersucht.
- Flussbasierter Arbeitsablauf: Ermöglicht einen natürlicheren Entwicklungsfortschritt
- Diff-basierter Ansatz: Bietet eine klarere Verfolgung von Änderungen und Iterationen
- Integration: Nahtlose Kombination mit bestehenden Entwicklungswerkzeugen
- Leistung: Effizienter Umgang mit komplexen Projekten
- Deepseek-Implementierung: Die Integration von Windsurf bietet überlegene Argumentationsmöglichkeiten
Datenschutz in der Codematrix
Ein entscheidender Aspekt bei der agentenbasierten Codierung ist der Datenschutz. Wenn Sie mit gehosteten LLMs arbeiten, befinden sich Ihre Daten auf den Servern des Anbieters, wodurch möglicherweise sensible Informationen preisgegeben werden. Die SOC2 Typ 2 Konformität von Codeium trägt diesen Bedenken Rechnung durch:
Datenverschlüsselung: Alle Daten werden während der Übertragung und im Ruhezustand verschlüsselt
- Zugriffskontrollen: Strenge Richtlinien regeln, wer auf Ihren Code zugreifen darf
- Regelmäßige Audits : Unabhängige Überprüfung der Sicherheitspraktiken
- Incident Response : Bewährte Prozesse für den Umgang mit potenziellen Verstößen
- Diese Konformität gibt mir Sicherheit bei der Bearbeitung sensibler Projekte, da ich weiß, dass mein Code durch Sicherheitsmaßnahmen auf Unternehmensniveau geschützt ist.
Die Zukunft der Zusammenarbeit zwischen Entwicklern und KI
Ich glaube, dass die agentenbasierte Programmierung unsere neue Realität werden wird, ähnlich wie in der Matrix. Es ist jedoch wichtig, sich daran zu erinnern, dass diese Tools Assistenten sind, nicht Ersatz. Die menschliche Note in der Softwareentwicklung - die Kreativität, die Problemlösung, die Vision - bleibt unsere rote Pille.
Profi-Tipps für die Navigation in der Code-Matrix
- Beginnen Sie mit klaren, spezifischen Zielen für Ihre Experimente
- Dokumentieren Sie Ihre Ergebnisse systematisch
- Verwenden Sie vergleichende Tools, um die Leistung zu messen
- Kombinieren Sie mehrere Modelle, um die besten Ergebnisse zu erzielen
- Behalten Sie immer den Überblick
- Machen Sie sich die Hände schmutzig - vermeiden Sie überbewertete Tutorials
- Verfolgen Sie Ihre Zeit, um echte Produktivitätsgewinne zu messen
- Priorisieren Sie von Anfang an Datenschutz und Compliance
- Wählen Sie Tools, die mit Ihrer Entwicklungsphilosophie übereinstimmen
- Bewerten Sie Ihren Arbeitsablauf kontinuierlich und passen Sie ihn an
Die Matrix-Frage: Wie tief würden Sie tatsächlich eintauchen? Viele YouTuber präsentieren eine ausgefeilte, überbewertete Perspektive, die den Übergang mühelos erscheinen lässt. In Wirklichkeit ist die agenturische Programmierung heute fantastisch, aber als ich anfing, war sie eine Herausforderung. Inmitten des Hypes gab es einen Blick in die Zukunft. Mein Rat? Stürzt euch in die Tiefen des Universums, aber nutzt eure Zeit mit Bedacht.
Ingmar Konnow
- Register with Email
- Login with LinkedIn
- Login with GitHub