Новости
#мультимодальность
21 августа 2025 г. в 18:25:35
Google запускает режим AI в странах Ближнего Востока и Северной Африки, предлагая пользователям новый уровень поиска с использованием искусственного интеллекта. Функция доступна на английском языке, с поддержкой других языков в будущем.
21 июля 2025 г. в 06:10:13
Представлен новый подход к многомодальному разумению, CDMRNet, который использует динамическое причинное моделирование и квантовую эволюцию состояний для улучшения точности и устойчивости в сложных сценариях.
18 июля 2025 г. в 14:01:02
Создан новый многомодальный набор данных для обучения моделей глубокого обучения, направленных на обнаружение и анализ синдрома обструктивного апноэ сна. Этот ресурс поможет улучшить диагностику и эффективность лечения данного расстройства.
12 июля 2025 г. в 09:15:13
Представлен новый подход к адаптивному планированию и оптимизации устойчивости в глобальных логистических сетях с использованием многомодального глубокого обучения с подкреплением и технологий Интернета вещей (IoT). Исследование демонстрирует значительное снижение операционных затрат и улучшение уровня обслуживания.
5 июля 2025 г. в 01:55:18
Gemma 3n, новая версия мобильного AI, теперь доступна с инновационными техниками, повышающими эффективность и производительность, включая перезагрузку параметров и поддержку мультимодальных возможностей.
4 июля 2025 г. в 03:20:51
Ожидается, что новый флагманский модель OpenAI GPT-5 появится этим летом. Эксперты предсказывают, что он может стать прорывом в области ИИ или же очередным шагом без значительных изменений.
1 июля 2025 г. в 12:30:17
Alibaba представила Qwen VLo — новый инструмент генерации изображений, который позволяет пользователям создавать и редактировать изображения на основе текстовых подсказок и загруженных картинок.
27 июня 2025 г. в 02:00:35
Google представил Gemma 3n — новое поколение AI-моделей, оптимизированных для мобильных устройств, доступное для разработчиков.
15 июня 2025 г. в 17:55:40
В мире технологий активно обсуждаются "фронтирные модели" искусственного интеллекта, которые представляют собой передовые системы с широкими возможностями. Эти модели способны обрабатывать текст, изображения, видео и аудио, открывая новые горизонты для AI.
15 июня 2025 г. в 01:50:16
Разработана новая многомодальная система, предсказывающая выживаемость пациентов с неоперабельной гепатоцеллюлярной карциномой, получающих иммунотерапию. Система сочетает в себе данные КТ и клинические показатели, обеспечивая более точные прогнозы.
12 июня 2025 г. в 12:20:16
Компания Anthropic представила обновление для своего чат-бота Claude 4, добавив поддержку мультимодальности, что позволяет ему обрабатывать текстовые и визуальные запросы одновременно.
30 мая 2025 г. в 19:50:20
Технологический директор OpenAI поделилась мыслями о будущем ChatGPT и его использовании в образовании, а также о новом устройстве, разработанном Джони Айвом.