Репозиторій наукових препринтів ArXiv запроваджує суворі заходи проти недбалого використання великих мовних моделей (LLM) у дослідницьких роботах. Відтепер за подання матеріалів із явними ознаками неперевіреної генерації ШІ авторам загрожує заборона на публікацію нових статей терміном на один рік. Після завершення бану дослідники зможуть повернутися на платформу лише за умови, що їхні наступні роботи спочатку будуть прийняті до рецензованих наукових журналів.
Причиною такого рішення став критичний сплеск низькоякісного контенту та фальсифікованих посилань. За оцінками модераторів, лише у 2025 році було зафіксовано понад 146 тисяч «галюцинованих» цитат. Неопровержними доказами зловживання вважатимуться вигадані джерела, помилкова лексика або технічні коментарі від нейромереж, залишені в тексті. Голова комп’ютерного напряму ArXiv Томас Дітеріх підкреслив, що нездатність авторів перевірити результати генерації ШІ повністю підриває довіру до всієї наукової праці.
Нові правила не означають повної заборони на використання LLM, проте вимагають від науковців брати повну відповідальність за фінальний зміст. Покарання діятиме за принципом «одного порушення»: після виявлення проблеми модераторами та підтвердження доказів керівництвом секцій, санкції застосовуватимуться негайно, хоча автори зберігатимуть право на апеляцію. Одночасно з цим ArXiv стає незалежною некомерційною організацією, що дозволить залучати більше ресурсів для боротьби з AI-спамом.
