Новости
#набор_данных
12 июля 2025 г. в 16:00:30
Представлен новый многофункциональный набор данных SmellyCode++, предназначенный для обнаружения "запахов" кода в Java-проектах. Он включает 107,554 образцов с многоуровневыми аннотациями, что значительно улучшает реализм обнаружения и может быть использован для настройки языковых моделей.
9 июля 2025 г. в 19:25:32
Представлен новый многомодальный набор данных MMDental, который включает 3D изображения зубов и медицинские записи 660 пациентов. Это первый и крупнейший набор данных такого рода, который поможет в развитии искусственного интеллекта в стоматологии.
21 июня 2025 г. в 20:35:35
Представлен новый набор данных PACHQA, содержащий квантово-химические свойства хлорированных полициклических ароматических углеводородов (Cl-PAHs), который может быть использован для улучшения моделей машинного обучения в химии.
19 апреля 2025 г. в 19:05:14
Представлен новый набор данных EuroCropsML для классификации типов сельскохозяйственных культур в Европе, который включает 706683 помеченных данных по 176 классам культур. Этот набор данных предназначен для тестирования алгоритмов машинного обучения и доступен для общественности.
11 марта 2025 г. в 08:30:31
Представлен новый набор данных BINS, который поможет в развитии технологий управления сетями на основе намерений (IBN). Он включает описания бизнес-намерений пользователей и корреляции между ними и сетевыми срезами, что значительно упростит автоматизацию сетевого управления.
5 марта 2025 г. в 18:35:41
Создан новый открытый набор данных MADRID, который включает вручную аннотированные изображения с дронов для автоматического определения береговой линии. Этот набор данных поможет в исследованиях по охране прибрежных зон и экосистем.
15 февраля 2025 г. в 22:05:17
Представлен новый набор данных DeepFlood, который включает высококачественные изображения для точного картирования и сегментации затопленных территорий, что значительно улучшает методы оценки ущерба от наводнений.
10 февраля 2025 г. в 06:25:19
Исследователи из Университета Вашингтона представили REALEDIT — новый набор данных для редактирования изображений, основанный на реальных запросах пользователей Reddit. Это позволяет моделям ИИ значительно улучшить качество редактирования, соответствуя реальным потребностям пользователей.
4 февраля 2025 г. в 02:05:20
Исследователи из Johns Hopkins создали крупнейший в мире набор данных для анализа органов брюшной полости, который поможет радиологам быстрее и точнее выявлять опухоли и другие заболевания с помощью искусственного интеллекта.
20 января 2025 г. в 08:00:53
Кембриджский юридический корпус представляет собой уникальный набор данных для исследований в области юридического ИИ, охватывающий более 320,000 дел с 16 века до настоящего времени, что открывает новые горизонты для анализа и автоматизации в праве.
17 января 2025 г. в 08:25:14
Новый набор данных для 6D-позы роботов улучшает точность их работы в реальных условиях, открывая новые горизонты для автоматизации в промышленности.
30 декабря 2024 г. в 22:30:23
Китайская компания AgiBot представила крупнейший в мире набор данных для обучения гуманоидных роботов, который включает более миллиона примеров повседневных задач, таких как уборка и организация вещей.