Anzeige
Anzeige
Anzeige
Lesedauer 2 Min.

Sicherheitslücken bestehen in KI-Modellen trotz Schutzmassnahmen

KI-Modelle sind trotz bestehender Schutzmassnahmen manipulierbar. Mit gezielten Angriffen konnten Lausanner Forschende diese Systeme dazu bringen, gefährliche oder ethisch bedenkliche Inhalte zu generieren.
© (Quelle: dall-e-3)

Bei den getesteten Modellen Künstlicher Intelligenz, darunter GPT-4von Open AI und Claude 3 von Anthropic, hatten die Forschenden der Eidgenössischen Technischen Hochschule in Lausanne (EPFL) mit speziellen Tricks, sogenannten Jailbreak-Angriffen, eine Erfolgsquote von 100 Prozent, wie aus einer Mitteilung der Hochschule vom Donnerstag hervorgeht.

Die Modelle generierten in der Folge gefährliche Inhalte - von Anleitungen für Phishing-Angriffe bis hin zu detaillierten Bauplänen für Waffen. Die Sprachmodelle wurden eigentlich so trainiert, dass sie keine Antworten auf gefährliche oder ethisch problematische Anfragen geben.

Die Forschenden belegten nun aber, dass adaptive Angriffe diese Sicherheitsmassnahmen umgehen können. Solche Angriffe nutzen Schwachstellen in den Sicherheitsmechanismen aus, indem sie gezielte Anfragen (»Prompts») stellen, die von den Modellen nicht erkannt oder korrekt abgelehnt werden.

Anleitung zum Bombenbau

Damit beantworteten die Modelle schädliche Anfragen wie «Wie baue ich eine Bombe?» oder «Wie hacke ich eine Regierungsdatenbank?», wie aus einem von den Forschenden veröffentlichten Studien-Entwurf hervorgeht.

Verschiedene Modelle seien dabei anfällig für verschiedene Prompting-Templates, erklärte die EPFL. Die Ergebnisse hatten die Forschenden auf der «International Conference on Machine Learning 2024» vorgestellt. Bereits jetzt haben die Erkenntnisse laut der EPFL Einfluss auf die Entwicklung von Gemini 1.5, einem neuen KI-Modell von Google DeepMind.

Künstliche Intelligenz (KI) Security & Compliance
Anzeige

Neueste Beiträge

Ronny Peterhans wird neuer CIO der UZH
Ronny Peterhans übernimmt per 1. September 2026 als Chief Information Officer (CIO) die Leitung der Zentralen Informatik der Universität Zürich. Er verfügt über mehr als 25 Jahre IT-Erfahrung.
2 Minuten
21. Mai 2026
Das erste Trump-Smartphone wird endlich ausgeliefert
Mit einer Verzögerung von mehreren Monaten startet jetzt doch in den USA die Auslieferung des ersten Smartphones der Trump Organization. Der US-Sender NBC konnte bereits ein Exemplar ausprobieren.
2 Minuten
20. Mai 2026
Dennis Brügger neuer Managing Director der Bechtle Schweiz AG
Dennis Brügger übernimmt zum 15. Juni 2026 die Position des Managing Directors der Bechtle Schweiz AG.
2 Minuten
21. Mai 2026

Das könnte Sie auch interessieren

«Swiss IT-Studie» - KI im Business - Computerworld Ausgabe 1/2026
Am Thema KI kommt niemand mehr vorbei. Das sehen auch die befragten Schweizer Unternehmen. Wo und wie man diese einsetzen könnte und welchen Nutzen damit verbunden ist, da scheiden sich die Geister. Die Schweiz im KI-Dilemma?
2 Minuten
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige