В последние годы искусственный интеллект стал неотъемлемой частью нашей жизни, и его развитие требует огромных объемов данных. В этом контексте Harvard Law School запустила Институциональную Инициативу Данных (IDI), которая направлена на улучшение доступа к материалам публичного домена для обучения ИИ. На официальной презентации 12 декабря директор Лаборатории инноваций библиотеки, Джонатан Зиттрейн, и исполнительный директор IDI, Грег Лепперт, рассказали о планах по расширению доступности данных, включая тексты почти миллиона книг, оцифрованных в Harvard Library.
Зиттрейн отметил, что библиотеки и другие учреждения, хранящие знания человечества, должны обеспечивать доступ к информации как для людей, так и для машин. Это позволит использовать данные для обучения ИИ, что, в свою очередь, поможет создать более разнообразные и качественные модели. Лепперт добавил, что текущие наборы данных для обучения ИИ часто ограничены по масштабу и качеству, что приводит к недостаточному представлению различных групп и идей.
IDI стремится решить эту проблему, обеспечивая доступ к обширным наборам данных, таким как материалы из проекта Caselaw Access, который охватывает 360 лет американского прецедентного права. В рамках инициативы также планируется выпустить около миллиона книг, оцифрованных в ходе проекта Google Books.
Кроме того, IDI активно сотрудничает с другими библиотеками и учреждениями, такими как Бостонская публичная библиотека, чтобы расширить доступ к данным и создать сообщество, способствующее обмену знаниями. Лепперт подчеркнул, что AI-компании уже сейчас получают выгоду от исторических инвестиций в публичные знания, и важно, чтобы эти данные использовались для блага всего человечества.
Таким образом, Институциональная Инициатива Данных от Harvard Law School открывает новые горизонты для обучения ИИ, обеспечивая доступ к богатым ресурсам и способствуя более справедливому и разнообразному представлению данных в будущем.