ChatGPT, Bard und Claude: Forscher machen KI-Chatbots zu rebellischen Regelbrechern

c64@feddit.de · edit-2 1 year ago

ChatGPT, Bard und Claude: Forscher machen KI-Chatbots zu rebellischen Regelbrechern

drre@feddit.de · edit-2 1 year ago

hier der Link zu dem ~~paper~~ Website die in dem Artikel erwähnt wird. https://llm-attacks.org/

hat soweit nicht wirklich was mit manuellem prompt engineering zu tun. (was ja wohl auch der Witz ist)

Peter Arbeitslos@feddit.de · 1 year ago

Hab neulich erst gemerkt, wie viel Spaß das jailbreaken machen kann.

Downcount@lemmy.world · 1 year ago

Wow. Richtig flott unterwegs diese Forscher. In einem anderen Universum hätte man vielleicht einfach mal nach chatgpt jailbreak gegoogelt.

Ozymandias1688@feddit.de · 1 year ago

Wow. Hast du den Artikel überhaupt gelesen?

c64@feddit.de · edit-2 1 year ago

Downcount@lemmy.world · edit-2 1 year ago

Ich mach mal kurz einen internen Sys 64738 und les mir den Artikel erneut durch. Vielleicht hab ich ja was übersehen.

Hm. Nein. Man kann also die AIs mit speziellen Strings überreden Sachen auszugeben, die sie nicht ausgeben sollten. War bekannt. Hat man jetzt also noch besser gelöst. Newsworthy ist das meiner Meinung nach immer noch nicht.

c64@feddit.de · edit-2 1 year ago

ChatGPT, Bard und Claude: Forscher machen KI-Chatbots zu rebellischen Regelbrechern

ChatGPT, Bard und Claude: Forscher machen KI-Chatbots zu rebellischen Regelbrechern

Golem.de: IT-News für Profis