Виртуальный Черчилль: «МегаФон» создал бота знаменитого политика
Компании «МегаФон» и Nlogic создали цифрового Уинстона Черчилля. Британский премьер-министр ответил на вопросы, «дав» полноценное интервью РБК.
Как создавали бот
Разработка этого необычного проекта началась в августе 2021 года. Специалисты «МегаФона» и Nlogiс рассказали РБК, что использовали генеративную модель GPT-3 от компании OpenAI, которую успешно дообучили на основе десятков книг Черчилля.
Однако ответы британского политика больше походили на нагромождения умных слов в попытке уйти от ответа. Кроме того, первая версия бота часто путала факты и ошибалась в датах. Однажды дошло до того, что цифровой Черчилль сделал своих современников участниками битвы при Ватерлоо.
В результате разработчики решили начать все заново и в основу нового подхода положили проверку фактов, сделав упор на то, чтобы искусственный интеллект всегда мог подтвердить свои высказывания ссылкой на конкретную книгу или выступление. Получился лишь хороший поисковик по трудам Черчилля.
Бот снова принялись улучшать: разработчики составили датасет из нескольких тысяч вопросов на самые разные темы: от «Любите ли вы сигары?» до «Когда появится искусственный интеллект?». Виртуальный Черчилль отвечал, а реальные люди отслеживали, на какие вопросы нейросеть смогла ответить хорошо, а на какие не очень.
Постепенно она адаптировалась. В этом помогла технология так называемых сиамских сетей: они на основании данных определяют степень сходства объектов. Также было важно сделать речь цифровой модели британского политика максимально похожей на речь человека.
Для этого разработчики изучили множество интервью с разными политиками. Они отметили, что в ответе на вопрос чаще всего выражается несколько идей, при этом они никогда не перечисляются по пунктам, а связаны вместе в непрерывную речь. Пришлось собрать несколько типов вводных конструкций для разных повествований.
Будущее цифровых технологий
Хотя разработчики прямо говорят, что их виртуальный Черчилль стал скорее игровым проектом, эта технология может найти немало вариантов применения. Уже сейчас она помогает сэкономить время на поиск цитат британского премьер-министра. Также можно создать аналогичные боты и для других исторических личностей.
Но в глобальном смысле эта необычная разработка, по сути, является следующим этапом развития поисковых систем. Привычная модель поиска, когда интересующий вопрос забивается в строку, а в ответ появляются релевантные ссылки, устарела. На смену придут боты, которые смогут не просто обрабатывать запрос, но и самостоятельно отбирать нужные результаты сразу из нескольких источников, а затем составлять из них единый связный текст, как это сделал бы живой ассистент.