Google Cloud анонсировал важное обновление для своей платформы Kubernetes, которое значительно сокращает время, необходимое для создания новых пулов узлов. Это улучшение направлено на устранение задержек, часто возникающих при масштабировании вычислительных ресурсов, что критически важно для предприятий, работающих с большими распределенными нагрузками.
Обновление касается Google Kubernetes Engine (GKE) и его функции автоматического создания узлов, которая позволяет автоматически формировать пулы узлов в зависимости от требований ожидающих подов. Это особенно важно для поддержания высокой доступности в динамичных условиях, где ресурсы должны быть доступны мгновенно.
Проблемы с масштабированием часто возникают из-за необходимости создания новых компонентов инфраструктуры в облачной среде. Когда кластер требует новый тип узла, которого нет в текущем пуле, система должна отправить запросы к API Compute Engine для выделения ресурсов, настройки сетевого взаимодействия и присоединения узлов к кластеру. Этот процесс может вызвать задержки, что негативно сказывается на отклике приложений, особенно в моменты резкого увеличения нагрузки.
Чтобы решить эти проблемы, Google оптимизировал взаимодействие между управляющей плоскостью GKE и вычислительной инфраструктурой. Новые улучшения позволяют более эффективно группировать запросы и снижать накладные расходы на взаимодействие между различными облачными сервисами. Это позволяет быстрее переводить новые узлы в состояние готовности, что особенно полезно для пользователей, использующих гетерогенные кластеры с различными типами машин для разных задач.
Хотя GKE уже давно предлагает автоматическое масштабирование, эти улучшения приближают его к возможностям таких инструментов, как Karpenter, который был разработан AWS и теперь является проектом с открытым исходным кодом. Karpenter часто упоминается за свою способность быстро выделять узлы, обходя некоторые традиционные абстракции, используемые стандартным автоскейлером Kubernetes.
С улучшением скорости автоматического создания пулов узлов Google стремится предоставить пользователям нативный опыт, который соответствует или превосходит отклик сторонних альтернатив, не требуя от них управления дополнительными контроллерами. Это обновление является частью более широкой инициативы по улучшению метрики "Время до готовности", которая измеряет время от момента, когда под запланирован, до момента, когда он фактически работает на узле.
Разработчики и команды DevOps могут ожидать, что эти изменения будут автоматически развернуты в поддерживаемых версиях GKE. В условиях жесткой конкуренции среди облачных провайдеров акцент смещается с простой паритетности функций на глубокую оптимизацию производительности, что делает GKE более привлекательным выбором для высокопроизводительных вычислений и приложений, чувствительных к задержкам.