Исследователи используют мир Гарри Поттера для понимания ИИ
Ученые используют серию бестселлеров для тестирования того, как генеративные системы искусственного интеллекта учатся и разучиваются определенные фрагменты информации. Более двух десятилетий после того, как Дж. К. Роулинг познакомила мир с вселенной магических существ, запретных лесов и подростка-волшебника, Гарри Поттер находит новую актуальность в совершенно другой области литературы: исследованиях ИИ.
Все больше исследователей используют книги о Гарри Поттере, ставшие бестселлерами, для экспериментов с технологией генеративного искусственного интеллекта, ссылаясь на их долговременное влияние в популярной культуре и широкий спектр языковых данных и сложных словесных игр на их страницах. Обзор списка исследований и академических работ, упоминающих Гарри Поттера, дает представление о передовых исследованиях ИИ — и о некоторых самых острых вопросах, с которыми сталкивается технология. Возможно, самым заметным недавним примером является работа, в которой Гарри, Гермиона и Рон играют главные роли, под названием "Кто такой Гарри Поттер?", которая освещает новую технику, помогающую большим языковым моделям избирательно забывать информацию. Это задача с высокими ставками для индустрии: большие языковые модели, которые управляют чат-ботами ИИ, построены на огромных объемах онлайн-данных, включая авторские материалы и другой проблематичный контент. Это привело к судебным искам и общественному вниманию для некоторых компаний ИИ.
Авторы работы, исследователи Microsoft Марк Руссинович и Ронен Элдан, заявили, что они продемонстрировали, что модели ИИ могут быть изменены или отредактированы так, чтобы удалить любые знания о существовании книг о Гарри Поттере, включая персонажей и сюжеты, не жертвуя при этом общими способностями ИИ к принятию решений и анализу.
Они заявили, что они выбрали книги из-за их всемирной известности.
"Мы полагали, что будет проще для людей в исследовательском сообществе оценить модель, полученную с помощью нашей техники, и убедиться самим, что контент действительно был 'разучен'. Почти каждый может придумать запросы для модели, чтобы проверить, 'знает' ли она книги или нет. Даже те, кто не читал книги, будут знать элементы сюжета и персонажей."
- сказал Руссинович, главный технический директор Microsoft Azure.
В другом исследовании ученые из Вашингтонского университета в Сиэтле, Калифорнийского университета в Беркли и Института ИИ Аллена разработали новую языковую модель под названием Silo, которая может удалять данные для снижения юридических рисков. Однако производительность модели значительно снизилась, если она обучалась только на текстах с низким риском, таких как книги, не защищенные авторским правом, или государственные документы, как говорится в работе, опубликованной в начале этого года. Чтобы углубиться, исследователи использовали книги о Гарри Поттере, чтобы увидеть, влияют ли отдельные фрагменты текста на производительность системы ИИ. Они создали два хранилища данных, или коллекции веб-сайтов и документов. Первое включало все опубликованные книги, кроме первой книги о Гарри Поттере; другое включало все книги серии, кроме второй, и так далее.
"Когда книги о Гарри Поттере удаляются из хранилища данных, перплексия ухудшается,"
сказали исследователи, имея в виду меру точности моделей ИИ.
Исследования ИИ упоминали Гарри Поттера как минимум на протяжении десятилетия, но это стало более распространенным, поскольку академики и технологи сосредоточились на инструментах ИИ, которые могут обрабатывать и реагировать на естественный язык с соответствующими ответами. С Гарри Поттером "обилие сцен, диалогов, эмоциональных моментов делает его очень актуальным для конкретной области обработки естественного языка", - сказала Лейла Вехбе, исследователь из Карнеги-Меллон, которая провела серию экспериментов в 2014 году, собирая данные МРТ мозга у людей, читающих истории о Гарри Поттере, чтобы лучше понять механизмы языка.
На arXiv, открытом репозитории научных исследований, недавние работы включают "Машинное обучение для разработки зелий в Хогвартсе", "Большие языковые модели встречаются с Гарри Поттером" и "Обнаружение заклинаний в фантастической литературе с помощью искусственного интеллекта на основе трансформера".
Даже когда Гарри Поттер не является центральной темой исследования, он также популярен среди ученых как литературный референс. Например, одно исследование использовало произведения Роулинг для тестирования интеллекта систем искусственного интеллекта, таких как те, что породили чат-бота ChatGPT, тему, которая вызвала много дискуссий в последнее время. Терренс Сейновски, руководитель лаборатории вычислительной нейробиологии в Институте биологических исследований Солка, утверждал в своей работе, что чат-боты лишь отражают интеллект и предубеждения их пользователей, подобно Зеркалу Эризеда в первой книге о Гарри Поттере, которое отражает желания человека ему самому.
"Гарри Поттер популярен среди молодых исследователей. Они читали эти книги в детстве или подростковом возрасте, поэтому думают о них, выбирая письменный или устный текстовый корпус."
сказала Вехбе