27 окт. 2012 г.

Отрицательный опыт стабильности GAE


Для старта проекта решил выбрать GAE как простую неадминистрируемую платформу. Проект еще не запущен, но для статистики ping-admin проверяет работу ресурса раз с интервалами от раз в 5 минут до раз в час в течение последних 2 месяцев (58 дней).

Мониторинг заметил два сбоя. В первый раз это было значительное увелиение времени отдачи страницы (с 0.5 секунд до 30 с лишним секунд без изменения кода и накопления данных - проект еще не запущен).

Второй раз сегодня, в GAE случилась общая проблема, которую они поправили и разбираются, сайт фактически был недоступен больше 3 часов, на большенство запросов отдавал 500-ю ошибку, но могу случайно выдать и обычную страницу (1 из 10-15 раз).

Итого по мониторингу даунтайм за последние 2 месяца составил 1 час, на самом деле минимум 4 часа (особенности настройки мониторинга могут значительно занижать даунтайм).

При этом сегодняшняя проблема была общая для платнформы и даже премиум-аккаунты не могли обратиться за поддержкой, т.к. сайт appengine и все его формы тоже не работали.

Для себя принял решение - что этот проект всё же запущу на GAE, чтобы готовую вещь не переделывать и в момент когда станет понятно что проект начинает зарабатывать деньги слезать с GAE и переходить на собственные сервера или на Amazon.

Дальнейшие проекты уже сразу виртуальном хостинге, VDS или своих серверах, чтобы в момент проблемы можно было что-то сделать для поднятия системы (например быстро переехать в другое место).

Комментариев нет:

Отправить комментарий