Сервис может содержать контент, не предназначенный для несовершеннолетних, в том числе упоминающий о наркотических средствах, психотропных веществах и их аналогах, незаконное потребление которых причиняет вред здоровью, их незаконный оборот запрещен и влечет установленную законодательством ответственность.
©2025, ООО «Звук» является аккредитованной ИТ-компанией, ОКВЭД 62.01: разработка программного обеспечения. ПО ООО «Звук» состоит в реестре отечественного ПО: №16328 от 23.01.2023. В Сервисе применяются рекомендательные технологии в соответствии с

Правилами

Подкаст Machine Learning Podcast

Machine Learning Podcast

Подкаст  ·  13 ноября  ·  40 мин

#032 MLSpec Сергей Марков. ruDALL-E. Генерация картинок по текстовому описанию

Эпизод подкаста #032 MLSpec Сергей Марков. ruDALL-E. Генерация картинок по текстовому описанию

Слушать эпизод

#032 MLSpec Сергей Марков. ruDALL-E. Генерация картинок по текстовому описанию

Machine Learning Podcast
Это специальный выпуск подкаста, поводом к которому послужила выложенная Сбером в открытый доступ русская версия модели для генерации изображений по текстовому описанию (ruDALLI-E). В гостях Сергей Марков - управляющий директор, начальник управления экспериментальных систем машинного обучения департамента SberDevices, принимавший самое непосредственное участие в создании модели. Поговорили о том, какие сложности возникли на пути создания ruDALLI-E, где брали датасеты для обучения, какая у сети архитектура, какие могут быть возможные применения сети и стоит ли дизайнерам-иллюстраторам уже начинать искать новый род занятий и многом другом интересном! Ссылки выпуска: Сайт проекта (https://rudalle.ru/) Статья на Хабре "ruDALL-E: генерируем изображения по текстовому описанию, или Самый большой вычислительный проект в России" (https://habr.com/ru/company/sberbank/blog/586926/) GitHub ruDALLI-E (https://github.com/sberbank-ai/ru-dalle) Телеграм-бот, с помощью которого можно генерировать картинки по запросу (https://t.me/sber_rudalle_xl_bot) Статья на arxiv.org "Zero-Shot Text-to-Image Generation" (https://arxiv.org/pdf/2102.12092.pdf) Генерация музыки от OpenAI в проекте Jukebox (https://openai.com/blog/jukebox/) Буду благодарен за обратную связь! Поддерживайте подкаст на Patreon (https://www.patreon.com/machinelearningpodcast) Оставляйте ваши комментарии там, где можно. Например, в Apple Podcasts. Они помогут сделать подкаст лучше! Напишите что вам было понятно, что не очень, какие темы раскрыть, каких гостей пригласить, ну, и вообще в какую сторону катить этот подкаст :) Подписывайтесь на телеграм-канал "Стать специалистом по машинному обучению" (https://t.me/toBeAnMLspecialist) Телеграм автора подкаста (https://t.me/kmsint) Со мной также можно связаться по электронной почте: kms101@yandex.ru Также теперь подкаст можно найти на YouTube (https://www.youtube.com/channel/UCzvfXLNpB2Bbf32dc7a8oDQ?) и Яндекс.Музыке https://music.yandex.ru/album/9781458