Raspberry Pi продолжает удивлять своей универсальностью, и один из пользователей GitHub, Симоне Марцулли, решил создать локального AI-агента, который работает исключительно на этом устройстве. Его цель была проста: обеспечить полную безопасность пользовательских данных, не передавая их на внешние сервисы. Это решение особенно актуально в наше время, когда конфиденциальность становится важным аспектом.
Созданный им AI-агент, названный Max Headbox, представляет собой экранного помощника, который реагирует на голосовые команды. Для этого Симоне использовал анимацию лица, созданную в GIMP, и настроил систему так, чтобы она реагировала на произнесенное "wake word". Кроме того, он добавил сенсорный интерфейс, позволяющий пользователю управлять записью голосовых команд простыми касаниями экрана.
Max Headbox использует открытые языковые модели, такие как Qwen3 1.7b для принятия решений и Gemma3 1b для эмоциональной реакции на команды. Учитывая ограничения по аппаратному обеспечению Raspberry Pi, Симоне тщательно подбирал модели, чтобы обеспечить баланс между производительностью и выразительными возможностями.
Если вы хотите попробовать создать своего собственного Max Headbox, Симоне подробно описал весь процесс на GitHub. Вам понадобятся Raspberry Pi 5 (подходят модели с 8 и 16 ГБ), USB-микрофон и экран от GeeekPi. Также потребуется установить несколько основных компонентов, таких как Ruby 3.3.0, Node 22, Python 3 и Ollama. Для управления голосом используется Vosk API для распознавания "wake word" и faster-whisper для быстрой и точной транскрипции речи.
Создание собственного AI-компаньона на базе Raspberry Pi — это отличный проект для тех, кто любит DIY и хочет погрузиться в мир технологий.