AI-сервис
Demo ruGPT-3 XL

Генерация текста на любые темы, 1.3 млрд параметров

Лицензия
Apache 2.0
Размер файлов
2.74 GB
Версия
0.1
Бесплатно
Подключить
Сценарии использования
UI-демо
Категории
gpt3rugpt3PyTorchNatural Language GenerationNLP
Разработчик
SberDevices
ОписаниеХарактеристики

Описание

Подключите свое приложение к самой большой нейросети для русского языка ruGPT-3.

Демо модели ruGPT-3 1.3B. Для перехода в swagger нажмите кнопку Подключить.

Модели ruGPT-3, доступные в open source — это:

  • 760 миллионов параметров (ruGPT-3 Large).
  • 1.3 млрд параметров (ruGPT-3 XL).
  • Длина контекста — 2048
  • Перплексия на тестовой выборке — ruGPT-3 Large 13.6, ruGPT-3 XL 12.05

Модели умеют продолжать тексты на русском и частично на английском языках. Для этого пользователю необходимо сформулировать «затравку» - фразу, которую модель допишет.

Нейросеть обучена на более чем 600 Гб открытых данных: википедии, художественной литературе, диалогах, программном коде.

Нейросеть демонстрирует state-of-the-art возможности для русского языка и умеет продолжать любой текст. Результат, который будет получен с помощью применения модели, не может быть предсказан заранее.

Цель этой страницы – удовлетворить исследовательский интерес научного сообщества, а также предложить API ruGPT-3 разработчикам приложений, диалоговых и рекомендательных систем, текстовых классификаторов и т.д.

Примеры "затравок"

В примерах ниже курсивом выделено сгенерированное продолжение.

Диалоговые системы:

system: Добрый день! Чем могу помочь? user: Добрый день! С утра не работает интернет. Тариф 500мбит system: хорошо, сейчас попробуем исправить. Ждите.

Рекомендательные системы с нуля:

"Физик Максим, 28 лет, больше всего любит фильмы: «Улица Сезам», «Матрица».

Тематическая классификация текстов:

Новость: В России выведен на полную мощность самый быстрый в мире суперкомпьютер «Кристофари» Категория: Новости науки, техника и технологии.

Подробнее о ruGPT-3

Демо проекта с UI

GitHub проекта (+ модели)

vc.ru: рассказываем о применимости для бизнеса

Habr (tutorial): Тестируем ruGPT-3 на новых задачах

Habr, статья про обучение модели: Русскоязычная модель GPT-3 Large с 760 миллионами параметров в открытом доступе

Habr, статья про кейсы применения модели: Всё, что нам нужно — это генерация

Вебинар, спикер Татьяна Шаврина: Разбираем кейсы реального применения ruGPT-3

Вебинар, спикер Татьяна Шаврина: Полный цикл дообучения ruGPT-3 на платформе ML Space и примеры рыночных кейсов

Модель ruGPT-3 обучена и развёрнута с помощью платформы ML Space и суперкомпьютера «Christofari» от SberCloud.

Архитектура нейросети ruGPT-3 основывается на решении Generative Pretrained Transformer 3 от OpenAI.

Дисклеймер

При использовании демо модели ruGPT-3 XL ответы формируются на автоматической основе. ООО «Облачные технологии» не несет ответственности за точность, релевантность, корректность информации, полученной пользователем посредством данного демо.

Лицензирование

Модель ruGPT-3 XL и ее исходный код поставляются на основе открытой лицензии Apache 2.0

Apache 2.0

Основные
Размер файлов2.74
Версия0.1