APPERCASE
vasb@nccrepnfr.eh +7 499 302-34-17

Синтез научной литературы с использованием языковых моделей с поддержкой поиска

OpenScholar — новый язык модели, который помогает ученым синтезировать научную литературу, используя 45 миллионов открытых статей. Он демонстрирует высокую точность цитирования и превосходит существующие модели в оценках экспертов.

В мире науки, где объем публикаций растет с каждым днем, способность эффективно синтезировать информацию становится критически важной. OpenScholar — это новая специализированная языковая модель, которая использует подход с дополнением извлечения для помощи исследователям в этой задаче. Она способна отвечать на научные запросы, извлекая релевантные фрагменты из 45 миллионов открытых статей и формируя ответы, подкрепленные цитатами.

Для оценки эффективности OpenScholar была разработана новая многоуровневая база данных ScholarQABench, включающая 2967 экспертно составленных запросов и 208 длинных ответов по таким областям, как компьютерные науки, физика, нейробиология и биомедицина. Несмотря на меньший размер по сравнению с другими моделями, OpenScholar-8B показал на 6,1% лучшую точность, чем GPT-4o, и на 5,5% лучше, чем PaperQA2, в сложных задачах синтеза информации.

Одной из ключевых проблем, с которой сталкиваются существующие языковые модели, является "галлюцинация" — создание несуществующих цитат. В то время как GPT-4o ошибается в 78-90% случаев, OpenScholar демонстрирует точность цитирования на уровне человеческих экспертов. Это достигается благодаря интеграции специализированного хранилища данных и механизма самопроверки, что позволяет модели улучшать свои ответы в процессе генерации.

В ходе экспериментов эксперты предпочли ответы OpenScholar-8B и OpenScholar-GPT-4o более чем в 51% и 70% случаев соответственно, что значительно выше, чем у GPT-4o, который лишь в 32% случаев оказался предпочтительнее. Все компоненты OpenScholar, включая механизмы извлечения и самопроверки, были открыты для сообщества, что способствует дальнейшим исследованиям в этой области.

OpenScholar и ScholarQABench представляют собой важный шаг вперед в автоматизации научного анализа и синтеза, предлагая исследователям мощный инструмент для работы с растущим объемом научной информации.

Эта новость создана искусственным интеллектом на основе открытых данных и предназначена исключительно для информирования. Администрация сайта не несёт ответственности за её содержание. Новости агрегируются из различных источников, включая недружественные России страны и их средства массовой информации. Социальные сети Facebook, Instagram и WhatsApp принадлежат корпорации Meta, которая в России признана экстремистской организацией.

Fractal Analytics, первая в Индии компания, специализирующаяся на искусственном интеллекте, открывает IPO с ценовым диапазоном ₹857-900 и объемом предложения ₹2,834 crore. Основная часть средств пойдет на исследования в области AI и погашение долгов.
Исследование показывает, что технологии искусственного интеллекта могут создавать "смертные боты", имитирующие голоса и стиль общения умерших, что вызывает интерес и беспокойство.
Недавно был создан MoltBook — социальная сеть для AI-ассистентов, разработанная с использованием AI-кода. Это событие поднимает вопросы о будущем взаимодействия машин и их возможностях в различных сферах, включая законодательство и корпоративные переговоры.
Написать нам