Home
Themen
Software & Development
Sicherheitslücken bestehen in KI-Modellen trotz Schutzmassnahmen

Patrick Hediger

19. Dez 2024

Lesedauer 2 Min.

Sicherheitslücken bestehen in KI-Modellen trotz Schutzmassnahmen

Technologie

KI-Modelle sind trotz bestehender Schutzmassnahmen manipulierbar. Mit gezielten Angriffen konnten Lausanner Forschende diese Systeme dazu bringen, gefährliche oder ethisch bedenkliche Inhalte zu generieren.

Bei den getesteten Modellen Künstlicher Intelligenz, darunter GPT-4von Open AI und Claude 3 von Anthropic, hatten die Forschenden der Eidgenössischen Technischen Hochschule in Lausanne (EPFL) mit speziellen Tricks, sogenannten Jailbreak-Angriffen, eine Erfolgsquote von 100 Prozent, wie aus einer Mitteilung der Hochschule vom Donnerstag hervorgeht.

Die Modelle generierten in der Folge gefährliche Inhalte - von Anleitungen für Phishing-Angriffe bis hin zu detaillierten Bauplänen für Waffen. Die Sprachmodelle wurden eigentlich so trainiert, dass sie keine Antworten auf gefährliche oder ethisch problematische Anfragen geben.

Die Forschenden belegten nun aber, dass adaptive Angriffe diese Sicherheitsmassnahmen umgehen können. Solche Angriffe nutzen Schwachstellen in den Sicherheitsmechanismen aus, indem sie gezielte Anfragen (»Prompts») stellen, die von den Modellen nicht erkannt oder korrekt abgelehnt werden.

Anleitung zum Bombenbau

Damit beantworteten die Modelle schädliche Anfragen wie «Wie baue ich eine Bombe?» oder «Wie hacke ich eine Regierungsdatenbank?», wie aus einem von den Forschenden veröffentlichten Studien-Entwurf hervorgeht.

Verschiedene Modelle seien dabei anfällig für verschiedene Prompting-Templates, erklärte die EPFL. Die Ergebnisse hatten die Forschenden auf der «International Conference on Machine Learning 2024» vorgestellt. Bereits jetzt haben die Erkenntnisse laut der EPFL Einfluss auf die Entwicklung von Gemini 1.5, einem neuen KI-Modell von Google DeepMind.

Künstliche Intelligenz (KI) Security & Compliance

Neueste Beiträge

Technologie & Innovation

ElectronicPartner startet Robotik-Initiative

Mit Service- und Marketing-Robotern will ElectronicPartner seinen angeschlossenen Partnern ein neues Geschäftsfeld eröffnen. Dafür arbeitet die Verbundgruppe mit Terra Robotics zusammen und bindet mehrere eigene Vertriebslinien ein.

3 Minuten

Roland Bernhard

12. Jul 2026

Mehr erfahren

Business & IT-Strategie

ICT-Fachmesse CONNECT von Brack.Alltron erscheint in neuem Gewand

Unter dem Motto «Unboxing Tomorrow» möchte die Handelsgruppe Brack.Alltron die ICT-Themen von morgen präsentieren.

3 Minuten

Patrick Hediger

10. Jul 2026

Mehr erfahren

Technologie & Innovation

Pool-Roboter Mova Rover X10 im Test - Wassermeister

Der Mova Rover X10 ist ein 7-in-1-Pool-Reinigungsroboter für Pool-Grössen bis 500 Quadratmeter. Laut Hersteller kommt er mit sämtlichen Pool-Typen und-Formen zurecht. Zudem kann er per KI-Sensorik auch Schmutzherde aufspüren und reinigen. Wir haben den Tausendsassa getestet.

5 Minuten

Daniel Bader

12. Jul 2026

Mehr erfahren

Das könnte Sie auch interessieren

Software & Development

40 Jahre Word in Bildern

1 Minute

Redaktion computerworld.ch

23. Okt 2023

Business & IT-Strategie

Digital Business im Fokus: Wohin geht die Reise? - Computerworld Ausgabe 2/2026

Autonomie und Souveränität werden inzwischen als Schlagworte mindestens ebenso häufig verwendet wie Künstliche Intelligenz und Datenschutz. Automatisierung und die Transformation zu einer hohen Dichte an KI-Agenten in Unternehmen werden die Zukunft des Digital Business prägen. Daraus entsteht ein Mix, der spannender und komplexer nicht sein könnte. Die Digitalisierung hat Dimensionen erreicht, die sich - Ironie des Wandels - fast nur noch mit KI bewältigen lassen. Höchste Zeit also für einen Überblick.

2 Minuten

Christian Bühlmann

6. Jul 2026

Software & Development

Outlook: Auf bevorzugten Browser ändern - Nein, ich will nicht Edge

Microsoft Outlook ignoriert neuerdings den im System eingestellten Standard-Webbrowser. So ändern Sie das wieder, falls Sie die Benachrichtigung verpasst haben.

2 Minuten

Gaby Salvisberg

30. Aug 2023