Чи є ChatGPT плагіатом? Вивчення джерел чат-бота

курс по chatgpt
×

Оберіть AI

ChatGPT сумно відомий своїми методами навчання, але чи означає це, що він насправді копіює роботу?

Незважаючи на те, що ChatGPT може відповісти на будь-яке ваше запитання, деякі користувачі цікавляться, чи містять його відповіді плагіат. Щоб дослідити це, ми створили чотири різні типи текстів за допомогою ChatGPT, а потім оцінили їх оригінальність за допомогою різних інструментів виявлення плагіату.

Що саме таке плагіат і як працюють LLM?

Щоб визначити, чи є ChatGPT винним у плагіаті, ви повинні спочатку зрозуміти, що таке плагіат. Плагіат передбачає використання слів, ідей або робіт іншої особи без належного посилання. Це включає пряме копіювання тексту з джерела без цитування або точне перефразування чужих ідей без підтвердження.

ChatGPT, як і інші великі мовні моделі (LLM) , навчається на великих наборах даних, переважно із загальнодоступного вмісту. Однак збір таких величезних обсягів даних викликає етичні питання, оскільки оригінальні творці не дали згоди на використання їхньої роботи під час навчання магістрів права. Це призводить до дискусій про етику та законність таких практик.

Хоча ChatGPT генерує відповіді на основі отриманих підказок, проблема полягає в ширшому контексті того, як OpenAI (розробник ChatGPT) отримав дані, які використовуються для його навчання, що передбачає використання вмісту без належної згоди. Багато хто вважає це плагіатом, а для багатьох веб-сайтів крадіжкою вмісту. Однак визначити точні джерела плагіату важко.

У решті цієї статті ми зосередимося на тому, чи плагіатить ChatGPT свої результати з інших джерел, не заглиблюючись у особливості того, звідки надходять його відповіді. Давайте перевіримо оригінальність відповідей ChatGPT за допомогою різних інструментів виявлення плагіату, щоб побачити, чи чат-бот використовує текст безпосередньо з онлайн-джерел.

Чи займається ChatGPT плагіатом есе?

У цьому першому прикладі ми доручили ChatGPT написати есе із 300 слів про проблеми психічного здоров’я.

Після цього ми використали різні інструменти виявлення плагіату, щоб оцінити оригінальність есе, створеного чат-ботом. Ці інструменти включали засіб перевірки плагіату Quetext, вбудований засіб перевірки плагіату Microsoft Word, засіб перевірки плагіату Grammarly та сканер плагіату Duplichecker.

Вбудований засіб перевірки подібності Microsoft повідомив про нульовий відсоток схожості з онлайн-джерелами. Рівні плагіату, виявлені іншими інструментами, також були мінімальними: детектор плагіату Grammarly виявив чотири відсотки, детектор плагіату QueText виявив п’ять відсотків, а сканер плагіату Duplichecker показав нуль відсотків.

Враховуючи невеликий відсоток виявленого плагіату, здається, що ChatGPT не копіює напряму есе з існуючих джерел.

Чи є ChatGPT плагіатом коду?

Щоб оцінити, чи ChatGPT плагіатить код, ми доручили чат-боту написати код для калькулятора на Python.

Після цього ми провели перевірку коду на плагіат, використовуючи спеціалізований засіб перевірки плагіату під назвою Dolos , який виявив нульовий відсоток схожості. Крім того, коли ми перевірили код за допомогою загальних інструментів виявлення плагіату тексту, згаданих вище, результати були узгодженими: майже жодна з програм не виявила більше чотирьох відсотків плагіату.

Коли ми запропонували ChatGPT створити код для калькулятора з різних облікових записів, відповіді виглядали різними. Це спостереження та результати перевірки на плагіат показують, що ChatGPT не просто копіює коди з онлайн-джерел. Натомість він спирається на набір даних, на якому його навчали, щоб самостійно генерувати код.

Чи є ChatGPT плагіатом математичних рішень?

Під час третього тесту ми поставили перед чат-ботом завдання розв’язати математичну задачу та детально обґрунтувати кожен крок.

Щоб перевірити оригінальність відповіді, ми перевірили її результати за допомогою кількох спеціальних інструментів виявлення плагіату для академічних закладів , зокрема засобу перевірки плагіату PapersOwl, сканера плагіату Trinka на основі штучного інтелекту, а також загальних інструментів перевірки плагіату, таких як Grammarly, Duplichecker і QueText.

Детектор плагіату PapersOwl показав майже 46-відсоткову схожість між згенерованими міркуваннями чат-бота та онлайн-джерелами. Подібним чином детектор плагіату Trinka повідомив про більше ніж 10-відсоткову схожість. Крім того, детектор плагіату Grammarly виявив 14 відсотків схожості, QueText – 17 відсотків, а Duplichecker – сім відсотків.

Виявлення високого рівня плагіату у згенерованій відповіді не означає, що чат-бот безпосередньо копіює міркування для математичних запитань з онлайн-джерел. Головним чином це пов’язано з тим, що розв’язки та обґрунтування математичних завдань часто є стандартними та широко доступними в Інтернеті.

Таким чином, незважаючи на те, що ChatGPT пропонує власні відповіді, знайти ті самі відповіді та міркування в Інтернеті можливо, що могло збільшити відсоток плагіату.

Чи використовує ChatGPT вміст із блогів?

Щоб перевірити, чи ChatGPT використовує вміст з онлайн-блогів, ми попросили чат-бота надати поради щодо підтримки працездатності акумулятора ноутбука.

Microsoft Word виявив 10 відсотків плагіату в створеному тексті. Duplichecker показав чотири відсотки, перевірка плагіату Grammarly показала 14 відсотків, але Quetext знайшов 58 відсотків плагіату в тексті. Після подальшого копання частина тексту у відповіді чат-бота збігалася з вмістом у деяких блогах.

Щоб ще раз перевірити, чи виявлення високого рівня плагіату не було випадковим, я поставив чат-боту ще кілька запитань про інформацію, яка легко доступна в Інтернеті. Відсоток плагіату в отриманих відповідях був значно вищим. Виходячи з нашого тестування, виявилося, що чат-бот іноді використовує фрази та текст з онлайн-джерел, що досить дивно.

Вам варто використовувати ChatGPT для роботи чи навчання?

Хоча багато безкоштовних онлайн-перевірок на плагіат не виявили значного плагіату у відповідях ChatGPT, ви не повинні використовувати його в академічних чи професійних цілях.

Не використовуйте ChatGPT для своїх шкільних завдань, якщо ви студент . Інструктори можуть використовувати такі інструменти, як GPTZero та детектор запису Turnitin AI для виявлення вмісту, створеного штучним інтелектом. Якщо вашу роботу позначать як створену штучним інтелектом за допомогою таких інструментів, ви можете провалити завдання або навіть бути виключеним зі школи. Незважаючи на те, що в багатьох інструментах виявлення GPT зазначено, що їх не слід використовувати для цієї мети, це так, і це може призвести до проблем. Не кажучи вже про те, що ви насправді лише обманюєте себе, не вивчаючи тему належним чином.

Чи можете ви використовувати чат-бот для покращення своєї роботи ? Якщо ви хочете покращити процес написання електронних листів чи інших текстових форм, використання ШІ може заощадити ваш час і зусилля. Однак ви повинні використовувати його лише як інструмент, який допоможе вам у виконанні ваших завдань, а не покладатися на те, що він виконає всю роботу за вас.

Навпаки, якщо ваша робота, наприклад професійне написання, забороняє використання таких інструментів, вам слід взагалі уникати використання ChatGPT або будь-якого іншого інструменту.

Сподіваємось, наше тестування дало вам уявлення про те, якою мірою ChatGPT може використовувати ресурси, доступні в Інтернеті. Однак важливо зазначити, що ми використовували безкоштовні інструменти плагіату та протестували лише обмежений набір даних. Отже, хоча наші висновки можуть бути корисними, їх не слід сприймати як абсолютні факти.

Ai Workshop 2.0