Künstliche Intelligenz

Agentic Coding mit LLMs: Der Einstieg in die Entwickler-Matrix

Ingmar Konnow

10 März 2025 • Lesezeit: 5 Min.

In der sich ständig weiterentwickelnden Landschaft der Softwareentwicklung stehen wir an der Schwelle zu einer neuen Ära - einer Ära, in der Entwickler und KI auf eine Weise zusammenarbeiten, die einst im Reich der Science-Fiction angesiedelt war. Hier das Log zu meiner Reise durch die Revolution des agentenbasierten Programmierens, von den ersten Experimenten mit lokalen Modellen bis hin zu den ausgefeilten Workflows, die durch Tools wie Windsurf ermöglicht werden.

Die rote Pille der Entwicklung

Wie in "The Matrix" als Neo die rote Pille wählt? Genau so habe ich mich gefühlt, als ich anfing, mit LLMs in meinem Entwicklungsworkflow zu experimentieren. Gestartet bin ich mit einfachen Projekten, um die Fähigkeiten verschiedener Modelle zu testen, darunter Claude Sonet, Mistral und GPT.

Als CTO musste ich ein Gleichgewicht zwischen Innovation und Risikomanagement finden. Agentic Coding hat sich in dieser Hinsicht als unschätzbar wertvoll erwiesen, da es mir ermöglicht:

Schnelle Erstellung von Prototypen für neue Funktionen
Einhaltung der DSGVO
Optimierung von Entwicklungs-Workflows
Sicherstellung der Code-Qualität über alle Projekte hinweg

Meine ersten Schritte in der Code-Matrix

Meine ersten Experimente konzentrierten sich auf die Entwicklung von Themes für Ghost CMS und die Integration eines 3D-Viewers auf der Grundlage von pmndrs-Repos mit Three.js. Dieses Projekt diente mir als Testfeld, um die Stärken und Grenzen der verschiedenen LLMs zu verstehen. Oftmals ist es stark mit den abhängig wie gut der Kontext aufgenommen und verstanden wird.

black and gray laptop computer turned on

Navigieren in der Matrix für Entwickler

1. Modellexploration

Das Testen und Vergleichen verschiedener LLMs im Jahr 2024/2025 offenbart unterschiedliche Eigenschaften und Fähigkeiten:

Claude Sonet (Anthropic): Bekannt für seine Stabilität und seine fortgeschrittenen Argumentationsfähigkeiten, obwohl es eine der teureren Optionen bleibt. Jüngste Updates haben die Genauigkeit der Code-Vervollständigung um 15 % verbessert.

Deepseek (CN): Die Modelle R1 und V3 sind aufgrund ihrer Geschwindigkeit und Zuverlässigkeit nach wie vor sehr beliebt. Die neueste Version (V3.2) bietet eine verbesserte edit_tool-Integration und eine bessere Kontextbehandlung.

GPT-4o (OpenAI): Die neueste Version bietet schnellere Reaktionszeiten und ein besseres Code-Verständnis, ist aber nach wie vor kostspielig. Die neue Funktion 'Code Interpreter' bietet Debugging-Vorschläge in Echtzeit.

Llama 3.3 (Meta): Ein Kraftpaket für Entwickler, das hervorragende Code-Erklärung und Debugging-Unterstützung bietet. Seine Open-Source-Natur macht es zu einem Favoriten für Anpassungen.

Mistral 2.0 (FRA/EU): Bekannt für seine außergewöhnliche Code-Vervollständigung und lokalen Einsatzmöglichkeiten. Die neueste Version unterstützt größere Kontextfenster (bis zu 128k Token).

Gemini Pro (Google): Bietet eine starke Integration mit den Entwickler-Tools und Cloud-Diensten von Google. Die Funktion „Code Assistant“ bietet Echtzeit-Vorschläge und Fehlererkennung.

Jüngste Benchmarks zeigen, dass sich die Genauigkeit der Codegenerierung bei allen Modellen verbessert hat, doch hängt die Wahl von den spezifischen Anforderungen ab:

Für schnelles Prototyping: GPT-4o und Llama 3.3 sind führend
Für Kosteneffizienz: Deepseek V3 und Mistral 2.0 sind die erste Wahl
Für die Sicherheit in Unternehmen: Claude Sonet ist nach wie vor der Goldstandard
Für Open-Source-Flexibilität: Llama 3.3 und Mistral 2.0 sind ideal

Das Verständnis dieser Eigenschaften hilft bei der Auswahl des richtigen Werkzeugs für bestimmte Entwicklungsaufgaben, sei es für Rapid Prototyping, Debugging oder die Pflege von Legacy-Code.

2. Lokale Entwicklung

Lokale Modelle mit Ollama waren vielversprechend, hatten aber mit der Kontextlänge zu kämpfen. Während die Konsistenz bei der Fortsetzung früherer Arbeiten überraschend gut war, erweist sich die Verwaltung und Aktualisierung lokaler LLMs jedoch als zeitaufwändig.

3. Vergleichende Analyse

Deepseek und seine neuesten Argumentationsmodelle haben meine Herangehensweise an die vergleichende Arbeit revolutioniert, insbesondere mit Tools wie Cline und Windsurf. Die Fähigkeit, Gedankenketten zu verfolgen, wurde besonders wertvoll bei der Arbeit mit großen, bereits existierenden Codebasen. Zu verstehen, was die Entscheidung antreibt, sich jedem Input zu nähern, der dem LLM gegeben wird, ist entscheidend und vorteilhaft für die Entwicklung.

4. Workflow-Integration

Mein Arbeitsablauf hat sich weiterentwickelt und konzentriert sich auf Effizienz und Präzision. Ganz gleich, ob ich Merge Requests überprüfe, Legacy-Code entwirre oder UI-Elemente poliere, die Tools passen sich der jeweiligen Aufgabe an.

Die Modernisierung des Ghost CMS-Themes beispielsweise war wie eine Zeitmaschine, verstanden wurde sowohl die Vergangenheit als auch die Gegenwart Codebasis. Auch die Implementierung einer komplexen Funktion für meine Website verlief nahtlos - vom ersten Commit bis zur endgültigen Freigabe konnte ich mich dank des Kontextbewusstseins darauf konzentrieren. Außerdem konnten die Ergebnisse ausreichend überzeugen, um weiterzumachen und meinen Programmierworkflow zu verbessern.

Der Schlüssel ist Flexibilität. Werkzeuge sollten die Kreativität fördern und nicht einschränken, damit ich mich auf die Entwicklung konzentrieren kann. Es geht darum, ein wertvolles Ergebnis zu schaffen.

Die Entwicklung der Agentencodierung

Die Landschaft der Agentencodierung hat sich seit meinen ersten Experimenten dramatisch entwickelt. Heute verwende ich hauptsächlich Windsurf, dessen diff- und flowbasierter Ansatz sich gegenüber der Cursor als überlegen erwiesen hat. Ein wichtiges Unterscheidungsmerkmal ist Windsurfs Implementierung von Deepseek, die Cursor fehlt. Diese Entwicklung spiegelt die Entwicklung von Neo in The Matrix wider - von der Entdeckung der digitalen Welt zur Beherrschung derselben. Offensichtlich folge ich hiermit meiner anfänglichen Matrix-Analogie, allerdings habe ich mich tatsächlich so gefühlt.

Windsurf vs. Cursor

Analytisch: Cascade liefert detaillierte Informationen darüber, was und wie es die bereits vorhandene Codebasis untersucht.

Flowbasierter Arbeitsablauf: Ermöglicht einen natürlicheren Entwicklungsfortschritt
Diff-basierter Ansatz: Bietet eine klarere Verfolgung von Änderungen und Iterationen
Integration: Nahtlose Kombination mit bestehenden Entwicklungswerkzeugen
Leistung: Effizienter Umgang mit komplexen Projekten
Deepseek-Implementierung: Die Integration von Windsurf bietet überlegene Argumentationsmöglichkeiten

Datenschutz in der Codematrix

Ein entscheidender Aspekt bei der agentenbasierten Codierung ist der Datenschutz. Wer mit gehosteten LLMs arbeitet, befördert die eigenen Daten auf den Server des Anbieters, wodurch möglicherweise sensible Informationen preisgegeben werden. Die SOC2 Typ 2 Konformität von Codeium trägt diesen Bedenken Rechnung durch:

Datenverschlüsselung: Alle Daten werden während der Übertragung und im Ruhezustand verschlüsselt

Zugriffskontrollen: Strenge Richtlinien regeln, wer auf Ihren Code zugreifen darf
Regelmäßige Audits : Unabhängige Überprüfung der Sicherheitspraktiken
Incident Response : Bewährte Prozesse für den Umgang mit potenziellen Verstößen
Diese Konformität gibt zwar Sicherheit bei der Bearbeitung sensibler Projekte, weil Code durch Sicherheitsmaßnahmen auf Unternehmensniveau geschützt ist.

Abschließen lässt sich feststellen: Selbst wenn Daten besonders verschlüsselt werden und auch nur Teile davon ab und an verarbeitet werden ist bleibt es die eigene Verantwortung. Datenschutz und das Übertagen von schützenswerten Daten in Drittländer ergibt einen Widerspruch.

Die Zukunft der Zusammenarbeit zwischen Entwicklern und KI

Ich denke, dass die agentenbasierte Programmierung unsere neue Realität darstellt, ähnlich wie in der Matrix. Es ist jedoch wichtig, sich daran zu erinnern, dass diese Tools Assistenten sind, nicht Ersatz. Die menschliche Note in der Softwareentwicklung - die Kreativität, die Problemlösung, die Vision - bleibt unsere rote Pille.

Immer mit klaren, spezifischen Zielen starten, selbst für Experimente
Dokumentieren von Ergebnissen und Eingaben
Verwenden Sie vergleichende Tools, um die Leistung zu messen
Kombinieren Sie mehrere Modelle, um die besten Ergebnisse zu erzielen
Behalten Sie immer den Überblick
Machen Sie sich die Hände schmutzig - vermeiden Sie überbewertete Tutorials
Verfolgen Sie Ihre Zeit, um echte Produktivitätsgewinne zu messen
Priorisieren Sie von Anfang an Datenschutz und Compliance
Wählen Sie Tools, die mit Ihrer Entwicklungsphilosophie übereinstimmen
Bewerten Sie Ihren Arbeitsablauf kontinuierlich und passen Sie ihn an

Die Matrix-Frage: Wie tief würden Sie tatsächlich eintauchen? Viele YouTuber präsentieren eine ausgefeilte, überbewertete Perspektive, die den Übergang mühelos erscheinen lässt. In Wirklichkeit ist die agenturische Programmierung heute fantastisch, aber als ich anfing, war sie eine Herausforderung. Inmitten des Hypes gab es einen Blick in die Zukunft. Mein Rat? Stürzt euch in die Tiefen des Universums, aber nutzt eure Zeit mit Bedacht.

Ingmar Konnow

About Me | X