Microsoft заключила сделку с HarperCollins, которая позволит использовать каталог нон-фикшн книг для обучения нового ИИ. За каждую книгу авторы получат по $2500, а HarperCollins — такую же сумму. Это соглашение не затрагивает существующие контракты и касается только ранее опубликованных нон-фикшн произведений.
Авторы должны согласиться на участие в программе, иначе их книги не будут включены в обучающий набор. Microsoft выбирает, какие книги использовать, и обещает, что не более 200 последовательных слов или 5% текста будет использовано для обучения. Также в соглашении прописано, что текст не будет собираться с пиратских сайтов.
Эта сделка важна, так как большие модели ИИ требуют обширных наборов данных для обучения. Доступ к каталогу HarperCollins значительно увеличивает объем доступной информации для Microsoft. Это первый случай, когда условия подобной сделки стали известны, что задает новый стандарт для других компаний в сфере ИИ.
Интересно, что новый ИИ не будет использоваться для генерации книг, и его назначение пока не раскрыто.