APPERCASE
vasb@nccrepnfr.eh +7 499 302-34-17

От неразборчивых текстов к читаемым записям: ИИ меняет доступ к историческим данным

Современные технологии ИИ помогают преобразовать сложные исторические материалы в читаемые форматы, открывая доступ к ценным ресурсам для исследователей и любителей истории.

В последние годы искусственный интеллект (ИИ) активно внедряется в цифровые библиотеки, и исследователи из Вирджиния Тек решили использовать его для улучшения доступа к историческим коллекциям. Их цель — преобразовать сложные материалы, такие как рукописные письма, газеты и топографические карты, в машинно-читаемые форматы. Это позволит значительно упростить взаимодействие пользователей с этими ценными ресурсами.

Вирджиния Тек разработала облачное решение для управления огромными коллекциями, достигающими 40 терабайт. Однако, процесс оцифровки архивных материалов сталкивается с множеством трудностей, включая неразборчивый почерк и сложные макеты. Для решения этих проблем команда использовала технологии оптического распознавания символов (OCR) и продвинутые ИИ-инструменты, такие как Pytesseract и AWS Textract, для улучшения качества извлечения текста.

Исследование охватывало три уникальные коллекции: письма Силаса Степпа, газеты из Музея Монтгомери и цифровые топографические карты. Каждый из этих наборов данных требовал индивидуального подхода для эффективного извлечения текста и создания кратких аннотаций.

Результаты показали, что интеграция ИИ значительно улучшила читаемость рукописных писем и повысила точность извлечения текста. Например, для писем Силаса Степпа были внедрены пороговые значения уверенности для исправления ошибок, что позволило значительно повысить надежность извлеченного текста.

Эти достижения открывают новые горизонты для цифровизации библиотек и разработки инструментов учета, что может значительно улучшить доступность исторических документов по всему миру. В будущем исследователи планируют продолжить работу над улучшением процессов извлечения текста и генерации метаданных, что сделает цифровые библиотеки еще более удобными для пользователей.

Эта новость создана искусственным интеллектом на основе открытых данных и предназначена исключительно для информирования. Администрация сайта не несёт ответственности за её содержание. Новости агрегируются из различных источников, включая недружественные России страны и их средства массовой информации. Социальные сети Facebook, Instagram и WhatsApp принадлежат корпорации Meta, которая в России признана экстремистской организацией.

SoftBank представил Telco AI Cloud, который преобразует телекоммуникационную сеть в инфраструктуру для искусственного интеллекта, интегрируя мощные GPU-центры и технологии AI-RAN для реального времени.
Бывший CEO Indeed Крис Хайамс считает, что риски, связанные с ИИ, не исходят от самой технологии, а от людей, которые её развивают. Он подчеркивает необходимость ответственного подхода к внедрению ИИ в общество.
Компания Procurement Sciences получила авторизацию FedRAMP для своей платформы, предназначенной для государственных подрядчиков, в партнерстве с Knox Systems, что позволит использовать AI-технологии с высоким уровнем безопасности.
Написать нам