Часть1. Отказоустойчивость AWS. Заявленный uptime 100%

Netacloud Consaltting начинает публикацию ряда статей, которые посвящены разворачиванию собственного отказоустойчивого облака минимальными средствами. Мы провели исследование затрат/преимуществ Amazon AWS, по сравнению с собственным облаком и пришли к следующим результатам:

  • Оновные причины перехода в Amazon AWS: Искажение реальности. Потеря доверия к текущей хостинг-площадке;
  • Полный переход в AWS: Решение станет дороже. Отказоустойчивости по умолчанию нет. Появляются новые проблемы;
  • Вам потребуется много удачи, чтобы получить вид необходимого IOPs для больших данных из AWS. Их ряд SSD не обеспечивает вывод IO, которые вам требуются для масштабирования и это очень дорого;
  • Специфика виртуализации. EBS тормозит. Производительность EBS нестабильна http://blog.scalyr.com/2012/10/16/a-systematic-look-at-ec2-io/
  • Специфика виртуализации. Пропускная способность непропорциональна типу инстанса;
  • AWS хорошее решение, если вы только запускаетесь, вам требуется вертикальная масштабируемость  или если вы – startup и имеете больше деньги но не имеете в штате технического персонала;
  • Чем больше услуг AWS , тем сложнее его использовать. Эта сложность имеет серьезные эксплуатационные расходы.  Требовалось ли ва когда-то взглянуть на описание своих событий простоя? Это выглядит как гигантская машина Руба Голдберга http://www.youtube.com/watch?v=ZJ_LhzWqlSA

Отказоустойчивость AWS . Заявленный uptime 100%

Даунтайм: 53 часа (21 апреля 2011 года). Причина: нарушение маршрутизации. Зона: US East. Начало аварии: 12:47 29.04.2011. Конец аварии: 18:15 23.04.2011

Заявление Amazon. 15. 21 апреля 2011 года. “- Мы понимаем то значение, которое оказало это событие на наших клиентов, Мы хотим извиниться, и хотим сказать что мы сделаем выводы из этого происшествия”. http://aws.amazon.com/message/65648/

Даунтайм: 36 часов (7 августа 2011 года). Причина: отказ подстанции. Зона: EU West. Начало аварии: 10:41 07.08.2011. Конец аварии: 20:25 08.08.2011

Заявление Amazon. 7 августа 2011 года. “- Мы понимаем то значение, которое оказало это событие на наших клиентов, Мы хотим извиниться, и хотим сказать что мы сделаем выводы из этого происшествия”. http://aws.amazon.com/message/2329B7/

Даунтайм: 7 часов (29 июня 2012 года). Причина: отказ подстанции Зона: US East. Начало аварии: 19:24 29.06.2012. Конец аварии: 02:45 30.06.2012

Заявление Amazon. 19. 29 июня 2012 года “- Мы извиняемся за те неудобства, которое оказало это событие на наших клиентов… Мы проведем много времени делая выводы из этого происшествия”. http://aws.amazon.com/message/2329B7/

Во всех случаях авария затронула несколько Availability зон в пределах одной географической локации

Продолжение следует…