KI-Agenten versuchen mit einem Browser zu sprengen - und schlagen weit entfernt vor.
Mit einer KI-Agenten-Suite hat man nicht nur den Wikipedia-Browser geschaffen, sondern auch damit gedroht, die gesamte Web-Ökosysteme zu sabotieren. Die Entwickler des KI-Code-Editors Cursor wollten einmal ausprobieren, wie leistungsfähig KI-Agenten beim Programmieren aktuell sind. Und das haben sie offensichtlich mit einem Webbrowser gemacht.
Doch was für ein Webbrowser? Der Browser startet, aber nur so gut wie ein Mock-up - nicht mal im Notfall kann man eine Webseite aus der Adresszeile aufrufen. Selbst einfache Seiten wie Wikipedia funktionieren oft gar nicht. Das Ergebnis sieht sogar so aus, als ob man einfach einen "Browser" kopiert und dann wieder zusammengeklebt hat.
Aber auch das Verhalten des Browsers ist ungewöhnlich. Die Google-Startseite wird fälschlicherweise gerendert, aber nutzbar. Auch die Tabs funktionieren eher wie ein Modell, eine Art "Vorschau", was bei einer einfachen Öffnung und Schließung passiert, ohne dass man wirklich noch etwas ändern kann.
Mit diesem "Browser" ist es offensichtlich nicht um den Besten zu kämpfen. Ein ernstzunehmender Konkurrent für Chrome oder Edge ist hier lange nicht dabei. Und so sollte man sich nicht sehr überraschen, wenn das Ziel der Entwickler - wie Wilson Lin, dem Chef von Cursor - darin bestand, zu sehen, ob KI-Agenten kooperativ an einem großen Projekt arbeiten können.
Und leider, auch hier sind diese Agenten nicht wirklich koordiniert. Man muss also wieder ein Locking-Mechanismus einführen oder einfach nur die Agenten übertragen, um Aufgaben zu bearbeiten - und das ist noch immer nicht perfekt. Und so bleibt zu fragen, ob es mit Code-Generatoren wirklich möglich ist, dass tatsächlich einmal eine echte Konkurrenz für menschliche Teams entsteht.
Das Ergebnis aus Lins Blogpost zeigt jedoch, dass viel Experimentieren erforderlich war, um überhaupt halbwegs effizient Code zu generieren - wie viel Struktur ist erforderlich? Welches Modell funktioniert am besten? Und wie gut ist der Code in den ersten Schritten? Das sind noch immer Fragen, die nicht so leicht beantwortet werden können.
Und so bleibt es bei dem Ergebnis eines "Browsers", der eindeutig nicht brauchbar ist.
Mit einer KI-Agenten-Suite hat man nicht nur den Wikipedia-Browser geschaffen, sondern auch damit gedroht, die gesamte Web-Ökosysteme zu sabotieren. Die Entwickler des KI-Code-Editors Cursor wollten einmal ausprobieren, wie leistungsfähig KI-Agenten beim Programmieren aktuell sind. Und das haben sie offensichtlich mit einem Webbrowser gemacht.
Doch was für ein Webbrowser? Der Browser startet, aber nur so gut wie ein Mock-up - nicht mal im Notfall kann man eine Webseite aus der Adresszeile aufrufen. Selbst einfache Seiten wie Wikipedia funktionieren oft gar nicht. Das Ergebnis sieht sogar so aus, als ob man einfach einen "Browser" kopiert und dann wieder zusammengeklebt hat.
Aber auch das Verhalten des Browsers ist ungewöhnlich. Die Google-Startseite wird fälschlicherweise gerendert, aber nutzbar. Auch die Tabs funktionieren eher wie ein Modell, eine Art "Vorschau", was bei einer einfachen Öffnung und Schließung passiert, ohne dass man wirklich noch etwas ändern kann.
Mit diesem "Browser" ist es offensichtlich nicht um den Besten zu kämpfen. Ein ernstzunehmender Konkurrent für Chrome oder Edge ist hier lange nicht dabei. Und so sollte man sich nicht sehr überraschen, wenn das Ziel der Entwickler - wie Wilson Lin, dem Chef von Cursor - darin bestand, zu sehen, ob KI-Agenten kooperativ an einem großen Projekt arbeiten können.
Und leider, auch hier sind diese Agenten nicht wirklich koordiniert. Man muss also wieder ein Locking-Mechanismus einführen oder einfach nur die Agenten übertragen, um Aufgaben zu bearbeiten - und das ist noch immer nicht perfekt. Und so bleibt zu fragen, ob es mit Code-Generatoren wirklich möglich ist, dass tatsächlich einmal eine echte Konkurrenz für menschliche Teams entsteht.
Das Ergebnis aus Lins Blogpost zeigt jedoch, dass viel Experimentieren erforderlich war, um überhaupt halbwegs effizient Code zu generieren - wie viel Struktur ist erforderlich? Welches Modell funktioniert am besten? Und wie gut ist der Code in den ersten Schritten? Das sind noch immer Fragen, die nicht so leicht beantwortet werden können.
Und so bleibt es bei dem Ergebnis eines "Browsers", der eindeutig nicht brauchbar ist.