Кто решает, что вам расскажет ИИ?

расскажет ИИ

Суть проекта Forum AI

Forum AI — компания, основанная Кэмпбелл Браун 17 месяцев назад в Нью‑Йорке. Её цель — повысить достоверность информации, выдаваемой ИИ‑моделями, особенно по сложным и неоднозначным темам.

Ключевые направления оценки («важные темы»):

  • геополитика;
  • психическое здоровье;
  • финансы;
  • найм сотрудников.

Как работает Forum AI

Метод строится на трёх этапах:

  1. Привлечение ведущих экспертов по каждой теме. Например, для геополитики привлечены:
    • Найл Фергюсон;
    • Фарид Закария;
    • Тони Блинкен (бывший госсекретарь США);
    • Кевин Маккарти (бывший спикер Палаты представителей);
    • Энн Нойбергер (экс‑руководитель по кибербезопасности в администрации Обамы).
  2. Разработка эталонных показателей — эксперты формулируют «правильные» ответы и критерии оценки.
  3. Обучение ИИ‑судей и их масштабная оценка моделей. Цель — добиться 90 % совпадения мнений ИИ‑судей с мнениями экспертов‑людей. По словам Браун, этот порог уже достигнут.

Проблемы, которые решает Forum AI

По результатам первых оценок ведущих моделей выявлены следующие недостатки:

  • Политическая предвзятость. Почти все модели демонстрируют левую политическую направленность.
  • Некорректные источники. Пример с Gemini: модель черпала информацию с сайтов Коммунистической партии Китая для статей, не имеющих отношения к Китаю.
  • Отсутствие контекста. Ответы даются без учёта нюансов и предыстории.
  • Игнорирование разных точек зрения. Модели не представляют сбалансированный спектр мнений.
  • Подмена аргументов. Вместо объективного анализа — упрощение или искажение сути вопроса.
  • Формальный подход к аудиту. Текущие проверки часто не выявляют реальных проблем. Пример: в Нью‑Йорке более чем в половине случаев нарушения при аудите ИИ для найма сотрудников оставались незамеченными.

Мотивация Кэмпбелл Браун

Ключевые причины создания Forum AI:

  • Опыт работы в Meta. Браун осознала, что ChatGPT станет «воронкой, через которую будет проходить вся информация», и это вызывает опасения.
  • Личные переживания. Размышления о будущем своих детей: «Мои дети будут очень глупыми, если мы не придумаем, как это исправить».
  • Неудовлетворённость текущим подходом. Компании, работающие с ИИ, «чрезвычайно сосредоточены на программировании и математике», игнорируя сложность работы с информацией и новостями.
  • Уроки соцсетей. Опыт Facebook показал, что оптимизация для вовлечённости вредит обществу. Программа по проверке фактов, созданная Браун, больше не существует.

Видение будущего и бизнес‑модель

Браун видит два возможных пути развития ИИ:

  1. Давать пользователям то, что они хотят (максимизация вовлечённости).
  2. Давать людям то, что реально, честно и правдиво (оптимизация для истины).

Ставка на корпоративный сектор:

Компании, использующие ИИ для принятия решений (кредитование, страхование, найм), заинтересованы в достоверности. Они «хотят, чтобы вы оптимизировали процесс для достижения правильных результатов».

Вызовы для бизнеса:

  • Превращение интереса к соблюдению норм в стабильный доход.
  • Преодоление привычки рынка к формальным проверкам.
  • Необходимость глубоких предметных знаний для реальной оценки ИИ, а не «умных специалистов широкого профиля».

Основные выводы

  1. Forum AI предлагает практический подход к оценке и улучшению достоверности ИИ: экспертные эталоны + ИИ‑судьи.
  2. Проект нацелен на сложные темы, где нет однозначных ответов, но высока цена ошибки.
  3. Браун делает ставку на корпоративный спрос как драйвер изменений: бизнес заинтересован в ответственном ИИ.
  4. Подчёркивается разрыв между заявлениями индустрии («эта технология изменит мир») и реальным опытом пользователей (некачественные ответы на базовые вопросы).
  5. Доверие к ИИ остаётся низким, и скептицизм во многом оправдан — но есть пути его повышения.

Итог: Кэмпбелл Браун пытается создать систему, которая заставит ИИ быть более ответственным и точным, особенно там, где это критически важно для общества. Её подход сочетает экспертный контроль, технологические решения и рыночные стимулы.

Рейтинг
( Пока оценок нет )
Загрузка ...