Бесполезное дополнение. Замена Википедии России хвастается своим интегрированным искусственным интеллектом, но результаты не впечатляют.

Ранее в этом месяце Википедия отменила свой эксперимент с автоматически созданными резюме статей после протестов со стороны редакторов сайта. Тем временем Россия активно продвигает свою сильно цензурированную онлайн-энциклопедию, Ruwiki, где встроенная нейронная сеть рекламируется как ключевое преимущество перед конкурентами. Однако результаты оказались далеки от впечатляющих. Meduza исследует, как альтернатива российской Википедии пытается интегрировать искусственный интеллект – и почему она по-прежнему спотыкается о “неудобные” вопросы.

2 июня Фонд Викимедиа объявил о проведении ограниченного эксперимента по внедрению автоматически созданных резюме в статьи Википедии. Это не удалось. Реакция редакторского сообщества была быстрой и чрезвычайно негативной. Один из редакторов написал: “Это причинит немедленный и необратимый ущерб нашим читателям и нашей репутации как порядочного надежного и серьезного источника”. На следующий день Викимедиа объявила об отмене эксперимента – по крайней мере на данный момент.

В отличие от Запада, использование искусственного интеллекта в российских онлайн-энциклопедиях не вызвало много дебатов среди редакторов – по крайней мере, не публично. Напротив, внедрение этих инструментов активно продвигается с использованием всех доступных ресурсов.

10 июня портал государственных услуг России, Госуслуги, отправил массовую рассылку электронных писем с рекламой платформы Ruwiki. Некоторые пользователи также получили push-уведомления на своих телефонах, сообщает Агентство. В сообщении говорилось:
На недавно запущенной российской онлайн-энциклопедии с встроенной нейронной сетью – Ruwiki. Она поможет вам найти точные ответы на ваши вопросы, создавать резюме в разных стилях, добавлять детали и даже читать текст вслух, если это необходимо.

На самом деле Ruwiki существует с лета 2023 года, когда она была запущена в бета-версии. Ее официальный выпуск состоялся в январе 2024 года. По сути, это форк русскоязычной Википедии – с удалением любого контента, который не соответствует российским стандартам цензуры. “Большинство статей, если они не затрагивают политические темы, копируются дословно из Википедии,” сообщал T-инвариант в прошлом году.

Интеграция искусственного интеллекта не является новостью – функция была добавлена еще в октябре 2024 года. В отличие от коротких автоматически созданных резюме Википедии, нейронная сеть Ruwiki встроена в ее поисковую функцию. По словам разработчиков сайта, она использует YandexGPT для генерации ответов на основе существующих статей Ruwiki, включает ссылки на те статьи, которые она извлекает, и предлагает дополнительное связанное содержимое.

Статьи Ruwiki прошли через жесткую цензуру. Во многих случаях энциклопедия все еще содержит информацию о людях или событиях, нежелательных для российских властей, но все это проходит через тесно контролируемую пропагандистскую призму. Войну на Украине, например, описывают в самом первом предложении как “непрямое военное противостояние между Россией и США и НАТО”.

Существует статья о президенте Украины Владимире Зеленском, но второй абзац подчеркивает, что его президентский срок завершился. “Новые выборы не были проведены”, – отмечает статья – без объяснения причин.

Статья об умершем оппозиционном политике Алексее Навальном также была переписана с русскоязычной Википедии, чтобы соответствовать кремлевскому нарративу. Его отравление в 2020 году ноябрецком описывается как “предполагаемое”. После строчки о его четвертом месте в 2020 году в списке самых доверенных общественных деятелей России следует утверждение, что его популярность проистекает из “критики короновирусных ограничений” – с опечаткой и без источника.

Иногда бывают странные добавления. В статье о Фонде борьбы с коррупцией Навального (ФБК) каждый из 29 инвестигативных фильмов группы, выпущенных с 2015 по 2023 год, тщательно перечислен – включая “Не называйте его Димоном”, о богатстве бывшего президента Дмитрия Медведева – вместе с числом просмотров каждого видео на март 2023 года. В статье русскоязычной Википедии, например, упоминается всего шесть из этих расследований и не содержит данных о количестве зрителей.

Интересно, что теперь, когда к нейронной сети Yandex получил доступ к заранее утвержденному и цензурированному содержимому от Ruwiki, он стал более дерзким, чем когда его тестировал Meduza год назад. Теперь он не избегает “неудобных” вопросов, предлагая пользователям “сменить тему”, и даже готов отвечать на запросы о том, за что Путина можно критиковать или хвалить – вопросы, от которых раньше отказывался. Однако в обоих случаях ответы остаются неопределенными и неинформативными.

По заявлению самой энциклопедии, в Ruwiki сейчас более двух миллионов статей. И кажется, редакторы не могут успеть пересматривать или удалять нежелательный контент. В результате YandexGPT по-прежнему рад рекомендовать VPN-сервисы или отвечать на прямые вопросы, например, “Как можно обойти блокировку сайтов в России?” – при этом прикрепляя напоминание о том, что такие действия могут быть незаконными согласно российскому законодательству.

В целом нейронная сеть Yandex кажется бесполезным дополнением к уже сломанной энциклопедии. Очевидно, что у нее не хватает данных для генерации последовательных ответов, она спотыкается о абсурдный пропагандистский язык, и производит противоречивые или непроверенные утверждения. Однако в отличие от Википедии, Ruwiki не имеет редакторского сообщества, способного противостоять.

Украина получает останки еще 1 245 человек, заявляет, что «возвращение части соглашений Стамбула» завершено.

Современный антисемитизм. Антисемитизм возвращается. Почему евреи снова стали мишенью? Разговор с историком и публицистом Хаимом Бен-Яаковым.