Сбер выпустил новую версию своей нейросети Kandinsky 2.1, следует из сообщения организации.
Отмечается, что новая модель Kandinsky 2.1 была дополнительно обучена на 170 млн пар «текст – изображение» высокого разрешения к уже имеющемуся набору в 1 млрд пар «текст – изображение». Нейросеть способна за несколько секунд создавать высококачественные изображения по их текстовому описанию на естественном языке. Она также может смешивать несколько рисунков, изменять их по текстовому описанию, генерировать изображения, похожие на заданное, дорисовывать недостающие части картинки и формировать изображения в режиме бесконечного полотна (inpainting/outpainting). Модель понимает запросы на 101 языке (включая русский и английский) и умеет рисовать в различных стилях.
Нейросеть разработали и обучили исследователи Sber AI при поддержке ученых из Института искусственного интеллекта AIRI на объединенном датасете Sber AI и компании SberDevices.
В новой версии Kandinsky кардинально улучшена генерация изображений в высоком разрешении: лица, сложные объекты и так далее. Благодаря этому новая модель содержит 3,3 млрд параметров вместо 2 млрд в Kandinsky 2.0.
В июне 2022 года Сбер выпустил первую версию своей нейросети Kandinsky. Тогда особенностью сервиса была работа на русском языке. Вторая версия появилась в ноябре того же года.
«Цифровая трансформация с каждым годом охватывает всё больше организаций. К этим изменениям подталкивают новые геополитические и экономические реалии. Благодаря внедрению цифровых технологий повышать эффективность и снижать затраты можно даже тогда, когда кажется, что всё уже оптимизировано», – заявляет Наталья Гаркуша, директор Центра подготовки руководителей и команд цифровой трансформации ВШГУ РАНХиГС.
«Ускоренное внедрение технологий искусственного интеллекта - один из важнейших трендов на сегодняшний день. В ближайшие 10 лет нам предстоит внедрить эти технологии во всех без исключения отраслях экономики, в социальной сфере и государственном управлении», – считает Александр Зорин, заместитель директора Центра подготовки руководителей и команд цифровой трансформации ВШГУ РАНХиГС.
«Развитие систем генеративного искусственного интеллекта (ГИИ) будет продолжаться экспоненциально. До конца 2023 года мы увидим появление в общем доступе новых моделей, которые на порядок превышают по объёму существующие. На базе текстовых ГИИ будут активно развиваться частные модели для отдельных проблемных областей. В первую очередь это будут модели, натренированные на корпусах статей из баз данных Scopus, WoS, PubMed. Но появятся и модели, для нормативно-правовой и нормативно-технической документации, причём с учётом национальной специфики стран-регуляторов», – отмечает Роман Душкин, директор по науке и технологиям Агентства Искусственного Интеллекта; член Российской Ассоциации Искусственного Интеллекта; преподаватель курса «Введение в искусственный интеллект и разговорные боты» РАНХиГС.
«Запуск новой версии нейронной сети, которую сейчас активно развивает Сбер, является хорошим результатом планомерной цифровизации компании. Надо отметить, что Сбер уже давно стал одним из самых мощных игроком на рынке цифровых услуг: они активно развивают цифровые сервисы и системы искусственного интеллекта. Сейчас в отдельное направление выделились нейронные сети, которые уже в третьей итерации наращивают свои мощности.
Разработка программных комплексов с элементами интеллектуальных систем позволяет серьезно увеличить эффективность деятельности компании. Это касается и вопросов прогнозирования, и оценки рисков, и значительной части рутинной работы, которая может быть переложена на цифровых помощников. И, безусловно, программные комплексы, которые сейчас, возможно, решают не самые прикладные задачи, в конечном счете в рамках системы обучения будут иметь очень важные практические возможности. Особенно в контексте объединения визуальных образов и семантических смыслов - фактически это глубокая работа над распознаванием естественного языка. Именно в этом направлении сейчас работают ведущие IT-гиганты, которые имеют доступ к большим массивам данных. И Сбер не исключение. На мой взгляд, это является хорошим ориентиром и достаточно серьезной заявкой на лидерство в цифровой среде.
Отдельно хочу отметить, что крупные российские IT-компании (такие, как Сбер, Яндекс, Mail.ru Group) создают в стране необходимую среду для цифровизации, делают цифровые сервисы привычными для граждан, что вносит свою лепту в повышение качества жизни. Нельзя не упомянуть здесь и роль сервиса “Госуслуги”, который на сегодняшний день является одним из лучших форматов взаимодействия общества и государства в цифровом формате», – комментирует новость Азамат Тлисов, директор Северо-Кавказского института-филиала РАНХиГС.