Исследовательский репозиторий ArXiv

ArXiv

Исследовательский репозиторий ArXiv будет на год блокировать авторов, если они позволят искусственному интеллекту выполнять всю работу за них.

Что меняется на arXiv

arXiv вводит более строгие правила модерации статей, в которых использовались большие языковые модели (LLM). Цель — не запретить ИИ‑инструменты, а гарантировать достоверность публикуемых результатов.

Основные меры

  1. Санкции за небрежное использование LLM. При обнаружении неопровержимых доказательств того, что авторы не проверяли результаты, полученные с помощью LLM, применяются следующие меры:
    • запрет на публикацию на arXiv сроком на 1 год;
    • требование, чтобы последующие статьи сначала были приняты авторитетным рецензируемым изданием.
  2. Правило «одного нарушения». Достаточно одного доказанного случая, чтобы применить санкции. Однако процесс строго регламентирован:
    • модераторы должны чётко указать на проблему;
    • руководители секций должны подтвердить наличие нарушений;
    • авторы имеют право обжаловать решение.
  3. Усиление контроля за новыми авторами. Впервые публикующиеся авторы должны получить одобрение от признанного исследователя. Это помогает отсеять недобросовестные заявки ещё на входе.

Что считается доказательством небрежности

По словам Томаса Диттериха, председателя секции компьютерных наук arXiv, к таким доказательствам относятся:

  • «Галлюцинаторные ссылки» — выдуманные или несуществующие источники, которые генерируют LLM. Например, статья с названием и авторами, но без реального DOI или публикации в журнале.
  • Комментарии или разделы текста, явно сгенерированные LLM и не отредактированные человеком. Признаки:
    • шаблонная, излишне «гладкая» речь без научной глубины;
    • логические противоречия между частями текста;
    • повторяющиеся фразы или структуры предложений.
  • Копирование без проверки:
    • неуместные формулировки;
    • плагиат;
    • предвзятый контент;
    • ошибки, неточности;
    • неверные ссылки;
    • вводящий в заблуждение контент.

Важные нюансы политики arXiv

  • Нет запрета на использование LLM. Авторы могут применять ИИ‑инструменты на любом этапе — от генерации идей до редактирования текста.
  • Полная ответственность авторов. Независимо от того, как был создан контент, авторы обязаны проверять и подтверждать достоверность каждого элемента статьи: данных, формул, ссылок, выводов.
  • Акцент на научную добросовестность. Правило направлено не против технологий, а против практики «копипаста» из LLM без критической оценки.

Контекст изменений

  1. Рост числа некачественных статей. Использование LLM привело к увеличению потока работ с:
    • сфабрикованными цитатами (особенно в биомедицине);
    • некорректными данными;
    • поверхностным анализом.
  2. Статус arXiv. Платформа остаётся препринт‑сервером (статьи публикуются до рецензирования), но стала ключевым каналом распространения исследований в информатике, математике и физике. Поэтому качество контента напрямую влияет на развитие науки.
  3. Организационные изменения. arXiv становится независимой некоммерческой структурой (ранее сотрудничал с Корнеллским университетом 20+ лет). Это позволит:
    • привлекать больше средств на модерацию;
    • внедрять новые инструменты проверки (например, алгоритмы обнаружения сгенерированного текста).

Вывод

Новые правила arXiv — это баланс между открытостью и качеством. Платформа не отвергает ИИ, а требует от учёных сохранять критическое мышление. Ключевые принципы:

  • LLM — инструмент, а не замена научной работе;
  • ответственность за статью всегда лежит на авторе;
  • прозрачность и проверяемость — основа доверия в науке.

Эти меры могут стать образцом для других препринт‑серверов и журналов, сталкивающихся с аналогичными вызовами.

Рейтинг
( Пока оценок нет )
Загрузка ...