Uptime day 8 апреля 2017
Первая конференция сообщества специалистов, которые занимаются оперативным реагированием на проблемы с веб-проектами, организуют мониторинг своих проектов и отказоустойчивую архитектуру.

Фотографии — Степан Легачёв.
Изобретая колесо: как мы писали свой мониторинг
Евгений Потапов, генеральный директор ITSumma
Каждый веб-разработчик когда-то хотел сделать свой фреймворк. Каждый админ хотел написать свой мониторинг. Шестилетняя история разработки нашей собственной системы мониторинга, причины ее создания, каким образом мы обеспечиваем хранение данных, отказоустойчивость и масштабирование. Шишки, которые мы набили. Чем наша система отличается от стандартных систем.
Стриминг мониторинга
Станислав Осипов
— рекламные платформы; особенности R'n'D и Ops в рекламе.
— три кита, на которых Zabbix можно превратить в полезный для восприятия инструмент.
— табличка, патч и отчетность — отстрел Ops managers обратно на орбиту.
— все не как у людей: стриминг самочувствия системы.
— каналы (SMS, Tg, Sl, Ml), потоки/группы.
— а теперь все вместе: Zabbix, New Relic, Jenkins и другие.
Как обычно происходит внедрение мониторинга с нуля
Николай Сивко, сооснователь Okmeter
Многие клиенты Okmeter не представляют, что именно им нужно от мониторинга. В процессе общения с такими клиентами у нас сформировался более-менее общий алгоритм покрытия проекта мониторингом от ошибок оборудования до бизнес-метрик. Правильные метрики, правильная работа с алертами и т.д.
Мониторинг, когда не тестируешь
Иван Круглов, senior developer Booking.com
Эффективная техподдержка 24×7: инструкция по применению
Юлия Синянская, руководитель команды технической поддержки Parallels
Как Parallels удалось построить поддержку для корпоративных клиентов, имея готовые наработки, но при этом обладая ограниченными ресурсами. Поиск и найм сотрудников, процесс адаптации и обучение, сменный график, оценка эффективности.
Как устроен мониторинг в Badoo
Илья Аблеев, руководитель отдела мониторинга Badoo
Представьте горящий стул, горящий стол в горящем доме. Примерно так выглядит обычный день в отделе мониторинга или дежурных админов в любой IT-компании. И мы — не исключение, но мы научились справляться с температурой горения и поделимся нашим опытом.
1. Что такое Badoo: особенности архитектуры и отдела эксплуатации.
2. Зачем нужен независимый отдел мониторинга и чем он занимается.
3. Как устроен отдел: количество людей/смен; что делают люди в свободное время, чтобы не выгореть
4. Инструменты: что используется для анализа проблем, как не потеряться в потоке событий и не пропустить важные инциденты.
Как жить в облаке почти без админов: мониторинг и эксплуатация сотен виртуальных машин силами трех человек
Александр Демидов, директор направления облачных сервисов Битрикс24
1. Почему Битрикс24 и другие сервисы 1С-Битрикс живут в облаке, как мы администрируем всю нашу инфраструктуру и как справляемся с сотнями виртуальных машин и сервисов силами трех человек. Как коммуницируем с разработчиками и QA, как деплоим, да и вообще — как живем и развиваемся.
2. Мониторинг — наше всё! Распределенная система real-time мониторинга (был nagios, стал shinken), аналитика, автоматизация, работа с инцидентами.
3. Бонус — на какие самые серьезные грабли мы наступали за пять лет, прошедших с запуска «Битрикс24», и как научились их обходить.
Стать участником Uptime.Community
Оставьте почту и получите анкету участника. Мы рассылаем участникам сообщества календарь мероприятий и интересное в блоге раз в две недели.