Tabnine, известный поставщик решений для ИИ-кодирования, анонсировал новую функцию, призванную защитить компании от случайного добавления кода с ограничениями лицензии в их кодовую базу. Функция Code Provenance and Attribution проверяет сгенерированный ИИ-код на соответствие публичным репозиториям GitHub, выявляя совпадения и указывая тип лицензии оригинального кода.
Согласно информации от Tabnine, эта функция поможет командам разработчиков лучше понимать, соответствует ли сгенерированный ИИ-код их стандартам и требованиям. В условиях, когда современные языковые модели, такие как Claude 3.5 и GPT-4, значительно улучшили производительность приложений ИИ, важно учитывать, что они обучаются на огромных объемах данных, включая код с ограничениями на использование. Это создает риск нарушения интеллектуальной собственности.
Tabnine уже предлагал модель, соответствующую лицензиям, обученную только на коде с разрешениями, но новая функция позволит пользователям использовать и другие модели, такие как Claude от Anthropic, GPT-4 от OpenAI и Command R+ от Cohere. Code Provenance and Attribution также поддерживает другие разработки, включая исправление кода, генерацию тестов и реализацию задач из Jira.
Компания планирует расширить эту функцию, добавив возможность проверки кода на соответствие конкретным репозиториям, например, коду конкурентов. Также будет внедрена функция цензуры, которая удаляет совпадающий код до того, как разработчик его увидит.
На данный момент функция доступна в рамках частного предварительного просмотра для всех клиентов Tabnine Enterprise. Tabnine также проведет вебинар 9 января в 11:00 по восточному времени, чтобы подробнее рассказать о новых возможностях.