Lambda, известная своим предложением графических процессоров (GPU) по запросу, сделала шаг вперед, запустив Lambda Inference API. Этот новый API позволяет компаниям внедрять AI-модели и приложения в продукцию, не беспокоясь о вычислительных ресурсах. Lambda утверждает, что их сервис является самым доступным на рынке, что делает его привлекательным для разработчиков и предприятий.
По словам представителя компании, платформа полностью вертикализирована, что позволяет передавать значительные экономические выгоды пользователям. В отличие от других провайдеров, таких как OpenAI, Lambda не накладывает ограничения на масштабирование и не требует общения с менеджерами для начала работы. Разработчики могут получить API-ключ и начать использовать сервис всего за пять минут.
Lambda Inference API поддерживает передовые модели, включая Llama 3.3 и 3.1 от Meta, Hermes-3 от Nous и Qwen 2.5 от Alibaba. Цены начинаются от $0.02 за миллион токенов для небольших моделей и доходят до $0.90 за миллион токенов для более крупных. Модель оплаты "плати за то, что используешь" исключает необходимость в подписках и ограниченных планах.
Lambda имеет более десяти лет опыта в поддержке AI-технологий с помощью своей инфраструктуры на базе GPU. Компания зарекомендовала себя как надежный партнер для предприятий и стартапов, предлагая решения, которые позволяют максимально эффективно использовать как старые, так и новые AI-чипы.
С запуском нового API Lambda закрывает цикл разработки AI, предоставляя пользователям простой способ развертывания моделей. Платформа также планирует расширение на мультимодальные приложения, включая генерацию видео и изображений.
Lambda Inference API ориентирован на широкий круг пользователей, от стартапов до крупных предприятий, и нацелен на отрасли, активно внедряющие AI, такие как медиа и разработка программного обеспечения. Компания подчеркивает свою приверженность безопасности и конфиденциальности данных пользователей, гарантируя отсутствие хранения или передачи пользовательской информации.
С новым сервисом Lambda стремится привлечь внимание бизнеса, предлагая доступные решения для развертывания и обслуживания AI-моделей, что открывает новые возможности для использования AI в различных сферах. API уже доступен, а подробная информация о ценах и документации представлена на сайте компании.