Експеримент з ChatGPT у Вікіпедії провалився

Чому експеримент з ChatGPT не вдався?

Засновник Вікіпедії Джиммі Вейлз запропонував використати ChatGPT для допомоги редакторам, але експеримент із тріском провалився. Штучний інтелект не тільки вигадав неіснуючі факти і джерела, а й порушив базові правила енциклопедії, що викликало невдоволення спільноти.

Яка була ідея експерименту?

Ідея полягала в тому, щоб використовувати ШІ як помічника-рецензента для перевірки чернеток статей. Це могло прискорити роботу волонтерів. Коли Вейлз завантажив у ChatGPT текст для перевірки, АІ впевнено заявив, що стаття відповідає всім правилам. Насправді ж, як з’ясували редактори, чат-бот видавав бажане за дійсне.

Які наслідки провалу?

ChatGPT послався на неіснуючі сторінки з правилами Вікіпедії, вигадав фейкові джерела і порекомендував використовувати прес-релізи як докази, що прямо заборонено. Цей провал викликав різку реакцію з боку редакторів. Вони заявили, що будь-яка система, схильна до “галюцинацій” (так називають помилки ШІ), підриває головний принцип Вікіпедії — перевіряльність фактів. Це шкодить репутації ресурсу, якому довіряють мільйони.

Згаданий випадок — не перший неприємний досвід Вікіпедії при роботі зі штучним інтелектом. Раніше спільнота вже змусила Wikimedia Foundation зупинити експеримент із генерації коротких переказів статей від нейромережі. Крім того, запровадили правило швидкого видалення низькоякісного машинного контенту, який редактори презирливо називають “AI slop” (“ШІ-бруд”).

У підсумку пропозицію Джиммі Вейлса відхилили. Редактори дійшли висновку, що на даному етапі розвитку ШІ не тільки не приносить користі, а й є проблематичним для Вікіпедії, оскільки на виправлення його помилок витрачається більше часу і сил, ніж на написання статей з нуля.

Раніше повідомлялося, що названо найточніший ШІ і це не ChatGPT — експерти перевірили популярні сервіси. Журналісти спільно з бібліотекарями провели масштабне тестування дев’яти популярних ШІ-сервісів, щоб з’ясувати, який з них дає найточніші відповіді та найрідше “галюцинує”. Результати виявилися несподіваними: беззаперечним лідером став не ChatGPT, а новий AI Mode від Google.

Цей матеріал має виключно загальноосвітній характер і не є медичною консультацією. Інформація призначена для ознайомлення з можливими симптомами, причинами та методами виявлення захворювань, але не повинна використовуватись для самодіагностики або самолікування. У разі проблем зі здоров’ям людині треба обов’язково звернутися до кваліфікованого лікаря.