Чи навчався штучний інтелект на ваших зображеннях? Ось як це з’ясувати та відмовитися

На здивування багатьох людей, живі художники виявляють, що їхнє мистецтво використовувалося для навчання моделей ШІ без їхньої згоди. Використовуючи веб-інструмент під назвою «Have I Been Trained?», ви можете за лічені хвилини дізнатися, чи були ваші зображення передані в Midjourney, NightCafe та інші популярні генератори зображень зі штучним інтелектом.
Якщо зображення виявлені в одному з наборів даних, що використовуються для навчання цих систем, не варто впадати у відчай. Деякі організації розробили способи відмовитися від цієї практики, щоб уникнути видалення зображень з Інтернету та їх передачі компаніям, що працюють з штучним інтелектом.
Як взагалі навчають генераторів зображень ШІ
Коли система штучного інтелекту, як-от DALL-E, отримує запит на створення зображення, наприклад, «собаки в капелюсі на день народження», їй спочатку потрібно знати, як виглядає собака і що таке капелюх на день народження. Для цього вона використовує інформацію з великих наборів даних, які збирають мільярди зображень з Інтернету.
Як відомо, в Інтернеті можна знайти майже будь-які зображення, включно з безліччю зображень «собаки в капелюсі на день народження». Завдяки достатній кількості таких даних, модель штучного інтелекту може навчитися створювати зображення, схожі на ті, на яких її тренували.
Але що відбувається, якщо ці зображення були захищені авторським правом? А якщо вони належали художникам, фотографам або звичайним людям, які не знали, що їхні роботи використовуються для навчання системи ШІ?
Проблема для художників
Багато генераторів зображень на основі штучного інтелекту пропонують платні підписки, де користувачі можуть купувати кредити для створення додаткових зображень, що приносить компаніям прибуток. Однак цей прибуток часто здобувається за рахунок неавторизованого використання зображень людей, чиї роботи спочатку використовувалися для навчання системи ШІ.
З поширенням інформації про те, що зображення художників використовувалися для розробки таких систем, стає зрозуміло, що не всі погоджуються з цим. Багато хто вважає, що компанії, які працюють зі штучним інтелектом, повинні отримувати згоду перед використанням чиїхось зображень.

Особливо якщо ви популярний, відомий художник, створені у вашому стилі зображення можуть заполонити ринок, залучаючи шанувальників або потенційних меценатів, які не будуть впевнені, чи це мистецтво дійсно ваше, чи лише копія, створена за допомогою ШІ. Ще гірше, коли хтось може створювати твори у вашому стилі, щоб підтримувати ідеї, у які ви не вірите.
Ця проблема не нова; дипфейки існують уже багато років, і з появою ШІ ситуація може погіршитися. Тепер відтворювати «фальшиве» мистецтво стало швидко, дешево та просто. Існує лише кілька способів ідентифікувати зображення, створене штучним інтелектом, тому відрізнити оригінальне мистецтво від його аналога, створеного ШІ, стає все важче.
Набори даних: пошук та індексування ваших зображень
Як уже зазначалося, компанії, що працюють зі штучним інтелектом, використовують набори даних із зображеннями для навчання своїх моделей. Ці набори даних можна уявити як величезну електронну таблицю Excel, де один стовпець містить посилання на зображення з Інтернету, а інший – підпис до зображення.
Проте не всі компанії, які займаються штучним інтелектом, розкривають інформацію про те, які набори даних вони використовують. Наприклад, DALL-E не надає цієї інформації. Це ускладнює визначення того, на які дані посилається система під час створення зображення, що лише додає загальної загадковості процесам ШІ.
З іншого боку, модель Stable Diffusion, розроблена Stability AI, відкрито заявляє, що вона побудована на наборі даних LAION-5B, який містить 5,85 мільярда пар зображення-текст, відфільтрованих за допомогою моделі CLIP. Оскільки цей набір даних має відкритий код, будь-хто може вільно переглядати зображення, які він індексує, що призвело до жорсткої критики.
На початку 2023 року Getty Images подала до суду на Stability AI, звинувативши компанію у використанні зображень з її веб-сайту для навчання генератора зображень AI Stable Diffusion. Якщо вас цікавить, хто використовує Stable Diffusion, то це такі відомі платформи, як NightCafe, Midjourney і DreamStudio, які є одними з найбільших гравців у цій сфері.
Як дізнатися, чи використовувалися ваші зображення для навчання моделі ШІ
Створений групою художників, Spawning є колективом, метою якого є допомогти людям дізнатися, чи використовуються їхні зображення в наборах даних, таких як LAION-5B, що застосовується для навчання моделей ШІ. Вони розробили пошукову систему під назвою “Have I Been Trained?” , яка дозволяє легко шукати зображення за ключовими словами, наприклад, за ім’ям художника.
Have I Been Trained?

Have I Been Trained працює подібно до пошуку зображень Google, з тією різницею, що ваш пошук зіставляється з результатами в наборі даних LAION-5B. Ви можете шукати за ключовим словом або за зображенням, що особливо корисно, якщо ви хочете перевірити, чи було використано саме ваше зображення.

Ми використовували ім’я художниці Фріди Кало (1907-1954), щоб перевірити це, і знайшли поєднання історичних фотографій і того, що виглядає як фан-арт у формі дудлів, картин, вишивки хрестиком, в’язання гачком та ілюстрацій.
Якщо ви один із цих творців, ваша творчість стала частиною наборів даних, що забезпечують існування генераторів зображень ШІ. Тепер, завдяки цій силі, будь-хто може створювати образи Фріди, такі як цей химерний портрет «Фріда Кало, що їсть морозиво».

Спробуйте ввести власне ім’я виконавця в пошуковий рядок, щоб дізнатися, чи використовувалась ваша робота для навчання моделі ШІ.
Як відмовитися від навчальних наборів даних AI
Та сама команда, що створила веб-сайт Have I Been Trained, розробила інструмент, який дозволяє людям вибирати або виключати арт-системи ШІ. Це один із способів для художників зберігати контроль над тим, хто використовує їхнє мистецтво та з якою метою.
Інші мистецькі платформи починають наслідувати цей приклад. Наприклад, DeviantArt тепер пропонує можливість виключити свої зображення з наборів даних для навчання систем ШІ.
Have I Been Trained: інструмент відмови від AI
Окрім можливості перевірити, чи ваше зображення є в наборі даних, ви також можете відмовитися від включення своїх зображень у тренувальні дані LAION-5B за допомогою сайту Have I Been Trained.
Спершу потрібно створити обліковий запис. Потім, клацнувши правою кнопкою миші на зображенні, виберіть опцію «Вимкнути це зображення».

Якщо вибрати цей параметр, зображення буде додано до вашого списку відмови. Щоб отримати доступ до списку, натисніть на символ свого облікового запису у верхньому правому куті сторінки та виберіть «Мої списки». Щоб видалити зображення зі списку, клацніть на ньому правою кнопкою миші та виберіть «Видалити зі списку відмови».

Якщо ви художник, цей метод може бути виснажливим і недостатнім для ефективної відмови від усіх ваших зображень. Наразі не існує кращої альтернативи, але ймовірно, що в майбутньому ця система буде вдосконалена.
Списки відмови передаються компанії, що стоїть за LAION-5B, яка погодилася видалити ці зображення зі свого набору даних.
Налаштування відмови від DeviantArt
Наразі DeviantArt прокладає шлях для платформ для розміщення мистецтва, надаючи користувачам можливість відмовитися від використання своїх зображень у наборах даних. Спочатку потрібно було знайти налаштування та встановити прапорець для відмови, але завдяки значним відгукам спільноти DeviantArt цей параметр тепер увімкнено за замовчуванням.
Це означає, що жодне зображення, опубліковане на DeviantArt, не стане доступним для наборів даних зображень, якщо користувачі не дали на це свою згоду. Механізм, який використовує DeviantArt, включає позначення зображення HTML-тегом «noai». Цей тег повідомляє системам ШІ, що зображення заборонено для використання, і порушення цієї умови може призвести до порушення Умов обслуговування DeviantArt.

Ви можете знайти параметри відмови, навівши курсор миші на піктограму свого особистого облікового запису та натиснувши «Налаштування облікового запису». Потім клацніть «Загальні» в меню ліворуч і прокрутіть униз, доки не побачите заголовок « Повідомте наборам даних AI, що вони не можуть використовувати ваш вміст» .
Повага до творчості художників
Пошук компромісу між системами штучного інтелекту та художниками, чиї роботи допомагають навчати ці системи, потребує часу. Якщо ви творець, не почувайтесь безсилим. Завдяки потужним відгукам спільнот, які використовують мистецькі платформи, такі як DeviantArt, ви можете контролювати, хто використовує ваше мистецтво.
Не всі захочуть відмовитися від використання своїх зображень для навчання моделей ШІ; деякі люди не мають з цим проблем. Але найважливіше, щоб компанії зі штучним інтелектом отримували згоду та створювали справедливий і шанобливий простір для спільного існування моделей і художників.
Для тих, хто прагне глибше освоїти технології штучного інтелекту та інтегрувати їх у власне життя і бізнес, Академія CGPT пропонує широкий вибір навчальних програм і курсів. Вони допоможуть не лише опанувати інструменти, як-от ChatGPT, а й розкрити потенціал штучного інтелекту для максимального покращення продуктивності та розвитку.
Розпочніть свій шлях до продуктивності вже сьогодні разом з Академією CGPT!
Приєднуйтесь до навчальних програм від AcademyCGPT.
Щоб отримати докладні статті про штучний інтелект, відвідайте наш блог, який ми створюємо з любов’ю до технологій, людей та їхніх потреб.
