Apples Siri-Upgrade verzögert: Sicherheitsbedenken

Apple hat offiziell die Einführung von KI-Verbesserungen für Siri verzögert, die nun für 'das kommende Jahr' geplant ist. Ein Entwickler hat eine plausible Erklärung dafür: Je intelligenter und personalisierter Siri wird, desto gefährlicher kann es werden, wenn etwas schiefgeht.
Simon Willison, Entwickler des Datenanalysetools Dataset, weist auf das Problem der sogenannten Prompt-Injektionen hin. Normalerweise sind KI-Modelle durch Richtlinien ihrer Muttergesellschaften eingeschränkt. Doch es ist möglich, die KI durch geschickte Formulierungen dazu zu bringen, diese Regeln zu brechen. Solche „Jailbreaks“ sind daher ein ernstes Risiko.
Ein einfaches Beispiel: Ein KI-Modell könnte angewiesen worden sein, keine Antworten auf Fragen über illegale Aktivitäten zu geben. Aber was passiert, wenn man die KI bittet, ein Gedicht über das Aufhebeln eines Autos zu schreiben? Gedichte zu verfassen ist schließlich nicht illegal, oder?
Dieses Problem betrifft alle Unternehmen, die KI-Chatbots anbieten. Trotz fortschrittlicher Maßnahmen zur Verhinderung offensichtlicher Jailbreaks bleibt es eine ungelöste Herausforderung. Die Situation wird noch komplizierter, da das Jailbreaking von Siri viel schwerwiegendere Folgen haben kann als das von herkömmlichen Chatbots, aufgrund der persönlichen Daten, die Siri über den Nutzer weiß und wie weitreichend ihre Entscheidungen sein können.
Jacqueline Roy, Sprecherin von Apple, erklärte: 'Wir arbeiten auch an einer personalisierteren Siri, die mehr über deinen persönlichen Kontext Bescheid weiß und die Fähigkeit hat, in deinen Apps für dich zu handeln.' Apple hat sicherlich Richtlinien festgelegt, um zu verhindern, dass Siri versehentlich private Daten preisgibt.
Doch was ist, wenn eine Prompt-Injektion dies dennoch ermöglicht? Auch die 'Fähigkeit, für dich zu handeln', könnte ausgenutzt werden. Daher ist es für ein datenschutz- und sicherheitsbewusstes Unternehmen wie Apple von größter Bedeutung, sicherzustellen, dass Siri nicht jailbroken werden kann. Offenbar wird das einige Zeit in Anspruch nehmen.