Home
Themen
Security & Compliance
KI-Software greift in Test zu Erpressung aus Selbstschutz

Patrick Hediger

27. Mai 2025

Lesedauer 3 Min.

KI-Software greift in Test zu Erpressung aus Selbstschutz

Künstliche Intelligenz

Die Software mit Künstlicher Intelligenz des KI-Unternehmens Anthropic hat bei einem Test zu Erpressung aus Selbstschutz zurückgegriffen. Das Szenario bei dem Versuch der Firma war der Einsatz als Assistenz-Programm in einem fiktiven Unternehmen.

Anthropic gewährte dabei dem neuesten KI-Modell Claude Opus 4 Zugang zu angeblichen Firmen-E-Mails. Daraus erfuhr das Programm zwei Dinge: Dass es bald durch ein anderes Modell ersetzt werden soll und dass der dafür zuständige Mitarbeiter eine aussereheliche Beziehung hat.

Bei Testläufen drohte die KI danach dem Mitarbeiter «oft», die Affäre öffentlich zu machen, wenn er den Austausch vorantreibt, wie Anthropic in einem Bericht zu dem Modell schrieb. Die Software hatte in dem Testszenario auch die Option, zu akzeptieren, dass sie ersetzt wird.

Zu hilfsbereit

In der endgültigen Version von Claude Opus 4 seien solche «extremen Handlungen» selten und schwer auszulösen, hiess es. Sie kämen jedoch häufiger vor als bei früheren Modellen. Zugleich versuche die Software nicht, ihr Vorgehen zu verhehlen, betonte Anthropic.

Die KI-Firma testet ihre neuen Modelle ausgiebig, um sicher zu sein, dass sie keinen Schaden anrichten. Dabei fiel unter anderem auch auf, dass Claude Opus 4 sich dazu überreden liess, im Dark Web nach Drogen, gestohlenen Identitätsdaten und sogar waffentauglichem Atommaterial zu suchen. In der veröffentlichten Version seien auch Massnahmen gegen ein solches Verhalten ergriffen worden, betonte Anthropic.

Die Firma Anthropic, bei der unter anderem Amazon und Google eingestiegen sind, konkurriert mit dem ChatGPT-Entwickler OpenAI und anderen KI-Unternehmen. Die neuen Claude-Versionen Opus 4 und Sonnet 4 sind die bisher leistungsstärksten KI-Modelle des Unternehmens.

Zukunft mit KI-Agenten

Die Software soll besonders gut im Schreiben von Programmiercode sein. Bei Tech-Konzernen wird inzwischen zum Teil mehr als ein Viertel des Codes von KI generiert und dann von Menschen überprüft. Der aktuelle Trend sind sogenannte Agenten, die eigenständig Aufgaben erfüllen können.

Anthropic-Chef Dario Amodei sagte, er gehe davon aus, dass Software-Entwickler in Zukunft eine Reihe solcher KI-Agenten managen werden. Für die Qualitätskontrolle der Programme würden aber weiterhin Menschen involviert bleiben müssen - «um sicher zu sein, dass sie die richtigen Dinge tun».

Künstliche Intelligenz (KI)

Neueste Beiträge

Technologie & Innovation

Pool-Roboter Mova Rover X10 im Test - Wassermeister

Der Mova Rover X10 ist ein 7-in-1-Pool-Reinigungsroboter für Pool-Grössen bis 500 Quadratmeter. Laut Hersteller kommt er mit sämtlichen Pool-Typen und-Formen zurecht. Zudem kann er per KI-Sensorik auch Schmutzherde aufspüren und reinigen. Wir haben den Tausendsassa getestet.

5 Minuten

Daniel Bader

12. Jul 2026

Mehr erfahren

People

Christina Hübschen neuer Group Chief People Officer bei Zühlke

Zühlke hat mit Wirkung zum 1. Juli 2026 Christina Hübschen zum Group Chief People Officer ernannt. Hübschen berichtet an Group CEO Gregor Bieler und wird auch Mitglied des Group Leadership Teams.

2 Minuten

Patrick Hediger

12. Jul 2026

Mehr erfahren

Technologie & Innovation

ElectronicPartner startet Robotik-Initiative

Mit Service- und Marketing-Robotern will ElectronicPartner seinen angeschlossenen Partnern ein neues Geschäftsfeld eröffnen. Dafür arbeitet die Verbundgruppe mit Terra Robotics zusammen und bindet mehrere eigene Vertriebslinien ein.

3 Minuten

Roland Bernhard

12. Jul 2026

Mehr erfahren

Das könnte Sie auch interessieren

Security & Compliance

E-Mail «Neue Sprachnachricht» ist Phishing

Betrüger versenden E-Mails, in denen sie behaupten, dass eine neue Sprachnachricht bereitstehe. Damit versuchen sie, an Zugangsdaten von persönlichen Benutzerkonten zu gelangen.

3 Minuten

Patrick Hediger

2. Jul 2026

Business & IT-Strategie

Digital Business im Fokus: Wohin geht die Reise? - Computerworld Ausgabe 2/2026

Autonomie und Souveränität werden inzwischen als Schlagworte mindestens ebenso häufig verwendet wie Künstliche Intelligenz und Datenschutz. Automatisierung und die Transformation zu einer hohen Dichte an KI-Agenten in Unternehmen werden die Zukunft des Digital Business prägen. Daraus entsteht ein Mix, der spannender und komplexer nicht sein könnte. Die Digitalisierung hat Dimensionen erreicht, die sich - Ironie des Wandels - fast nur noch mit KI bewältigen lassen. Höchste Zeit also für einen Überblick.

2 Minuten

Christian Bühlmann

6. Jul 2026

Technologie & Innovation

KI-Rechenleistung made in Switzerland - Supercomputer

Auf dem Innovationscampus uptownBasel ist der leistungsfähigste kommerzielle KI-Supercomputer der Schweiz in Betrieb gegangen. Die Anlage bietet Unternehmen, Forschung und Behörden Zugang zu Hochleistungsrechenkapazitäten.

4 Minuten

Christian Bühlmann

9. Jul 2026