Генератор изображений JanusPro7B превосходит OpenAI и Stability AI.
Компания DeepSeek, занимающаяся искусственным интеллектом, презентовала новый набор мультимодальных моделей ИИ, которые, по отзывам пользователей, превосходят DALLE 3 от OpenAI. Модели, доступные для загрузки на платформе Hugging Face, принадлежат к новому семейству под названием JanusPro. Их размер варьируется от 1 до 7 миллиардов параметров, и модели с большим количеством параметров показывают высокую эффективность.
JanusPro распространяется под лицензией MIT, что позволяет использовать модель в коммерческих целях без ограничений. Компания охарактеризовала JanusPro как «новую авторегрессионную структуру», способную как анализировать, так и создавать новые изображения. Самая крупная модель из этого семейства, JanusPro7B, демонстрирует превосходство над DALLE 3 и такими решениями, как PixArtalpha, Emu3Gen и Stable Diffusion XL от Stability AI, в двух оценочных тестах — GenEval и DPGBench.
Хотя большинство моделей JanusPro могут обрабатывать только изображения с разрешением до 384 x 384, их производительность остаётся впечатляющей, учитывая компактные размеры. Это делает JanusPro одним из сильнейших кандидатов на звание одной из самых универсальных мультимодальных моделей. DeepSeek подчеркивает, что простота, высокая гибкость и эффективность новой модели соответствуют или даже превосходят результаты специализированных моделей.
JanusPro7B является улучшенной версией предыдущей модели Janus. Среди усовершенствований можно отметить:
- Обновлённые процессы обучения: модель обучалась на 72 миллионах качественных синтетических изображений, сбалансированных с реальными данными.
- Повышенное качество данных: новые методы обработки и увеличения объёма данных способствуют более детализированным результатам.
- Увеличенный размер модели: это гарантирует стабильность и высокий уровень генерации изображений.
Новое поколение моделей DeepSeek может быть использовано в дизайне, рекламе, медиа и индустрии развлечений. Возможность создания качественных изображений по текстовым запросам делает JanusPro незаменимым инструментом для профессионалов.
С выпуском JanusPro7B компания прокладывает путь для конкуренции с такими гигантами, как OpenAI и Stability AI, а успех DeepSeek в разработке языковых и визуальных моделей искусственного интеллекта ставит под сомнение лидерство США.
Примерно год назад Google приостановила работу над Gemini, полагая, что оно выдаёт крайне сомнительные результаты, особенно в отношении исторических фотографий. Для подтверждения этой точки зрения достаточно было взглянуть на изображения американских сенаторов позапрошлого века.
Читайте также
ИТ-рынок России в 2024 году: итоги и перспективы. Аналитика IT-World
Эксперты ИТ-рынка оценили прошедший 2024 год как время вызовов и возможностей. Что было наиболее значимым в ушедшем году и чего ожидать отечественному ИТ-рынку в новом году? Основные события и вероятные тренды на рынке информационных технологий разбирал IT-World.
Другие статьи
Генератор изображений JanusPro7B превосходит OpenAI и Stability AI.
Компания DeepSeek, занимающаяся искусственным интеллектом, представила новый комплект мультимодальных моделей ИИ, которые, согласно отзывам пользователей, превосходят DALLE 3 от OpenAI.
