Anzeige
Anzeige
Anzeige
Lesedauer 3 Min.

KI-Software greift in Test zu Erpressung aus Selbstschutz

Die Software mit Künstlicher Intelligenz des KI-Unternehmens Anthropic hat bei einem Test zu Erpressung aus Selbstschutz zurückgegriffen. Das Szenario bei dem Versuch der Firma war der Einsatz als Assistenz-Programm in einem fiktiven Unternehmen.
© (Quelle: Anthropic)

Anthropic gewährte dabei dem neuesten KI-Modell Claude Opus 4 Zugang zu angeblichen Firmen-E-Mails. Daraus erfuhr das Programm zwei Dinge: Dass es bald durch ein anderes Modell ersetzt werden soll und dass der dafür zuständige Mitarbeiter eine aussereheliche Beziehung hat.

Bei Testläufen drohte die KI danach dem Mitarbeiter «oft», die Affäre öffentlich zu machen, wenn er den Austausch vorantreibt, wie Anthropic in einem Bericht zu dem Modell schrieb. Die Software hatte in dem Testszenario auch die Option, zu akzeptieren, dass sie ersetzt wird.

Zu hilfsbereit

In der endgültigen Version von Claude Opus 4 seien solche «extremen Handlungen» selten und schwer auszulösen, hiess es. Sie kämen jedoch häufiger vor als bei früheren Modellen. Zugleich versuche die Software nicht, ihr Vorgehen zu verhehlen, betonte Anthropic.

Die KI-Firma testet ihre neuen Modelle ausgiebig, um sicher zu sein, dass sie keinen Schaden anrichten. Dabei fiel unter anderem auch auf, dass Claude Opus 4 sich dazu überreden liess, im Dark Web nach Drogen, gestohlenen Identitätsdaten und sogar waffentauglichem Atommaterial zu suchen. In der veröffentlichten Version seien auch Massnahmen gegen ein solches Verhalten ergriffen worden, betonte Anthropic.

Die Firma Anthropic, bei der unter anderem Amazon und Google eingestiegen sind, konkurriert mit dem ChatGPT-Entwickler OpenAI und anderen KI-Unternehmen. Die neuen Claude-Versionen Opus 4 und Sonnet 4 sind die bisher leistungsstärksten KI-Modelle des Unternehmens.

Zukunft mit KI-Agenten

Die Software soll besonders gut im Schreiben von Programmiercode sein. Bei Tech-Konzernen wird inzwischen zum Teil mehr als ein Viertel des Codes von KI generiert und dann von Menschen überprüft. Der aktuelle Trend sind sogenannte Agenten, die eigenständig Aufgaben erfüllen können.

Anthropic-Chef Dario Amodei sagte, er gehe davon aus, dass Software-Entwickler in Zukunft eine Reihe solcher KI-Agenten managen werden. Für die Qualitätskontrolle der Programme würden aber weiterhin Menschen involviert bleiben müssen - «um sicher zu sein, dass sie die richtigen Dinge tun».

Künstliche Intelligenz (KI)
Anzeige

Neueste Beiträge

Peter Gassmann verlässt Abraxas
Peter Gassmann, Geschäftsleitungsmitglied von Abraxas, hat sich entschieden das Unternehmen per Ende Juli 2026 zu verlassen. Die Suche nach einer qualifizierten Nachfolge in dieser Führungsposition im strategisch wichtigen Tätigkeitsfeld ist lanciert.
2 Minuten
26. Mär 2026
KI-Ausschreibung für 57 Mio. Franken von Bundeskanzlei
Die Bundeskanzlei lanciert eine Ausschreibung zur Beschaffung von IT-Dienstleistungen in den Bereichen Daten und künstliche Intelligenz (KI) für insgesamt 57 Millionen Franken. Die Ausschreibung wurde auf der Plattform für öffentliche Ausschreibungen Simap.ch veröffentlicht.
2 Minuten
26. Mär 2026
Hektische Handy-Nutzung am gefährlichsten
Smartphone-, Laptop- oder Tablet-User, die stundenlang auf das Display starren, werden weniger von Informationsüberflutung gepeinigt als diejenigen, die alle paar Minuten ihr Gerät zücken. 
3 Minuten
26. Mär 2026

Das könnte Sie auch interessieren

Neun von zehn Unternehmen erleiden einen Sicherheitsvorfall
Eine globale Umfrage des Enterprise-CMS-Anbieters Storyblok unter 300 leitenden IT- und Security-Verantwortlichen zeigt eine deutliche Diskrepanz zwischen Selbstwahrnehmung und Realität.
2 Minuten
Digitale Kriminalität bleibt auf ähnlichem Niveau wie 2024
Insgesamt sind 554'963 Straftaten gemäss Strafgesetzbuch (StGB) im Jahr 2025 verzeichnet worden. 57'761 Straftaten wurden mit einem digitalen Tatvorgehen erfasst.
3 Minuten
25. Mär 2026
Ist Ihr Passwort sicher? - Sicherheits-Tipps
Nur mit sicheren Passwörtern und den neuesten Technologien sind Ihre Daten und Ihre Konten im Internet effizient geschützt. Wir haben für Sie die ultimativen Tipps zum Passwort-Check!
9 Minuten
5. Mär 2026
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige