"Яндекс" запустил новую версию генератора текстов "Балабоба" на русском и английском языках. Об этом сообщили ТАСС в пресс-службе "Яндекса" во вторник.

"Яндекс запустил двуязычную версию генератора текстов - "Балабоба", теперь он поддерживает и русский, и английский языки. "Балабоба демонстрирует возможности семейства языковых моделей "Яндекса" YaLM, которые компания применяет более чем в 20 сервисах, включая "Поиск" и "Алису", - сказано в сообщении компании.

Так, пользователю достаточно написать несколько слов на русском или английском языках и выбрать один из стилей, а сервис самостоятельно создаст осмысленный текст на любую тему, похожий на тексты из интернета, на которых училась модель. "Чтобы текст получился связным и грамматически правильным, модель генерирует его последовательно по словам и оценивает насколько предсказанное слово корректно", - поясняется в сообщении.

Сервис может написать короткую историю, придумать рецепт, инструкцию или народную мудрость, а в случае если ввести название фильма, то "Балабоба" напишет к нему сюжет. "Тексты можно использовать по своему усмотрению. Например, описать товары в интернет-магазине, найти вдохновение и идеи для рекламы или просто отправить друзьям в соцсети интересные примеры", - добавили в компании.

"Балабоба" генерирует тексты с помощью языковой модели "Яндекса" YaLM, которая решает задачи, связанные с обработкой естественного языка. Например, модели YaLM помогают "Алисе" поддерживать беседу, определяют темы вопросов в "Кью", улучшают описания заказов на "Услугах", генерируют карточки для быстрых ответов в поиске. Также языковые модели YaLM ищут ключевые моменты видео, генерируют рекламные объявления и описания сайтов", - пояснили в "Яндексе".

В компании также отметили, что запоминать правила языка и подбирать подходящие слова сервису позволяют заложенные внутри модели параметры, которые меняются в зависимости от того, правильно или неправильно предсказывается слово.

В свою очередь в семействе языковых моделей YaLM может быть от 1 млрд до 100 млрд параметров. "Самую большую двуязычную модель YaLM 100B на 100 млрд параметров "Яндекс" недавно выложил в открытый доступ. В "Балабобе" используется ее облегченная версия на 3 млрд параметров. Модель обучалась на терабайтах текстов англоязычного и русскоязычного интернета в равной пропорции", - заключили в "Яндексе". 

ТАСС