В Международном институте информационных технологий в Хайдарабаде (IIITH) разработали мощный инструмент на основе искусственного интеллекта, который упрощает процесс извлечения информации из документов. Этот AI-инструмент был протестирован на документах Совета по ценным бумагам и биржам Индии (SEBI) и может быть адаптирован для использования в таких областях, как здравоохранение, научная литература и технические руководства.
Исследователи создали многоуровневую структуру под названием Applied Semantics Extraction and Analytics (ASEA), которая поддерживает множество сценариев, включая извлечение ответов на вопросы, предсказание нарушений регуляций и упрощение юридических документов. Профессор Камал Карлапалем отметил, что структура использует генеративный AI для базовых уровней и прикладную семантику для более сложных задач.
Также были разработаны трансформерные модели машинного обучения для задач обработки естественного языка (NLP). Эти модели, традиционно неэффективные в специализированных областях, таких как право и медицина, были доработаны для повышения производительности на основе данных SEBI.
С помощью этого инструмента команда IIITH продемонстрировала, как можно не только анализировать и извлекать информацию, но и визуально отслеживать изменения между версиями документов. Этот подход может быть применен в различных сферах, открывая новые горизонты для автоматизации и анализа данных.