Исследователи выяснили, что изображения блок-схемы обманом заставляют GPT-4o создавать вредоносный текст. Они передавали чат-боту эти изображения со схемами вредоносной деятельности вместе с текстовой подсказкой.
Вероятность успеха атаки составила 92,8%. В случае с версией GPT-4-vision-preview...