События

В далекой-далекой галактике 700 млн лет назад родилось нейтрино, рассказавшее нам о гибели звезды из-за черной дыры

28.02.2021 02:15:32 |

Автор: admin

Случилось это во время уничтожения звезды черной дырой, рядом с которой эта звезда оказалась. В итоге образовалось высокоэнергетическое нейтрино, которое стало настоящим подарком для земной науки. Один из важных выводов, которые можно сделать подобные явления являются природными ускорителями и генераторами элементарных частиц, причем очень мощными.

Пройдя безумные по нашим меркам расстояния, нейтрино в октябре 2020 года достигло Южного Полюса, где и было зарегистрировано детектором элементарных частиц. Эта сложная система размещена прямо подо льдом, она служит для обнаружения высокоэнергетических частиц, приходящих к нам издалека. Спустя несколько месяцев телескоп в Калифорнии смог увидеть вспышку света в той самой галактике, о которой говорится в заголовке, и откуда пришло нейтрино.

Ученые считают, что эти два события тесно связаны. С высокой степенью вероятности можно говорить о том, что черная дыра уничтожила оказавшуюся рядом звезду. Ну а проявления этой встречи мы увидели и зарегистрировали. Вполне может быть, что именно такие события являются источником потоков космических частиц сверхвысокой энергии, над происхождением которых ученые уже много десятилетий ломают головы.

Происхождение высокоэнергетических нейтрино является научной загадкой. В основном, потому, что сами нейтрино не так-то просто поймать и изучить, заявил один из авторов исследования, Сьерт ван Велзен из Нью-Йоркского университета.

Нейтрино самая распространенная частица во Вселенной, которая чрезвычайно редко взаимодействует с любым видом материи. Каждую секунду через нас проходит множество этих частиц, никак не реагируя на происходящее. Айзек Азимов назвал нейтрино призрачной частицей атома именно поэтому.

И как раз потому, что нейтрино редко взаимодействует с материей, эти частицы очень трудно обнаружить. Но если уж есть взамодействие, то оно дает много информации. В частности, можно получить некоторые подсказки о далеких, очень далеких системах. Эти подсказки, вместе с результатами наблюдения при помощи доступных нам инструментов, позволяют расширить объем знаний о Вселенной.

Большая часть нейтрино, которые проходят через Землю, генерируются Солнцем. Но есть и частицы, которые попадают к нам очень издалека. Вот как это нейтрино из галактики, которая находится от нас на расстоянии многих световых лет. По словам исследователей, нейтрино начало свой путь из галактики в созвездии Дельфин.

Звезды умирают из-за черных дыр не так часто, но астрономы уже наблюдали это явление. Происходит оно после того, как блуждающая звезда подходит достаточно близко к черной дыре и оказывается в гравитационной ловушке. В итоге звезду просто разрывает на части, и большая часть ее материи поглощается соседом.

Событие, которое получило номер AT2019dsg, спровоцировано воздействием сверх-массивной черной дыры, масса которой в 30 млн раз больше массы Солнца. Сверхмассивная черная дыра Млечного Пути, к слову, тяжелее Солнца лишь в 4 млн раз. Этот объект прекрасно виден в рентгеновском диапазоне, также его можно обнаружить и при помощи радиотелескопов. Само событие называется событие приливного разрушения и хорошо известно ученым. Событие приливного разрушения (tidal disruption event, TDE) представляет собой астрономическое явление, которое происходит, когда звезда приближается достаточно близко к горизонту событий сверхмассивной чёрной дыры и разрывается на части приливными силами чёрной дыры, претерпевая спагеттификацию.

Идея черной дыры, засасывающей расположенную поблизости звезду, звучит как научная фантастика. Но именно это и происходит во время приливного разрушения, заявил Томаса Веверса (Thomas Wevers) из Института астрономии Кембриджского университета после регистрации одного из таких разрывов.

В 2018 году ученые объявили о получении первого в истории астрономии изображения последствий разрыва звезды черной дырой, масса которой составляет 20 млн масс Солнца. Событие зафиксировано в регионе Arp 299, который находится в 150 млн световых лет от Земли. Осенью 2020 года астрономы зафиксировали еще одно такое явление, результаты исследования опубликованы в журнале Nature Astronomy.

^{Станция по обнаружению нейтрино на Южном Полюсе
Земли}
Вероятность обнаружения нейтрино высокой энергии составляет 1 к 500. И сейчас астрономы зафиксировали первую в истории частицу, которая образовалась в результате события приливного разрушения. Обнаружение нейтрино указывает на существование природного генератора элементарных частиц возле аккреционного диска. А комбинированный анализ данных с радио, оптических и ультрафиолетовых телескопов дает нам дополнительные доказательства того, что TDE действует как гигантский ускоритель частиц, заявил автор исследования.

Примечательно во всем этом еще и то, что исследование проводилось с учетом сразу нескольких источников информации о событии детекции частицы и непосредственных наблюдений за определенным регионом Вселенной. Комбинированные наблюдения мощный инструмент в руках астрономов. Так, если бы ученые просто зафиксировали нейтрино, это практически ничего не дало бы науке. Обнаружение события приливного разрушения примечательно, но, как уже говорилось выше, не является чем-то исключительным. А вот обнаружение события с последующей поимкой нейтрино многое дало науке ведь теперь становится понятно, откуда берутся высокоэнергетические частицы, пусть не все, но хотя бы часть.

Ученые надеются на то, что в будущем удастся увидеть не только верхушку айсберга, образно говоря, но и весь айсберг, то есть астрономы смогут понять, откуда берутся частицы высоких и сверхвысоких энергий. Для этого сейчас строится новое поколение телескопов, которые позволяют отслеживать регионы с TDE и изучать последствия таких событий. Кроме того, создание мощного детектора нейтрино IceCube увеличит количество поимок нейтрино высоких энергий минимум в 10 раз.

DOI: Nature Astronomy, 2021. 10.1038/s41550-020-01295-8

DOI: Nature Astronomy, 2021. 10.1038/s41550-021-01305-3

Подробнее..

Категории: Астрономия , Научно-популярное , Физика , Блог компании selectel , Чёрные дыры , Наука , Нейтрино , События

DevOps-дайджест от Рексофт

09.12.2020 16:05:25 |

Автор: admin

Привет, Хабр!

Предлагаем подборку свежих статей, подкастов, докладов и грядущих событий для DevOps-специалистов от команды Рексофт. Собрали всё самое интересное за последние несколько недель.

Статьи

1. Обзор инструментов для chaos engineering в Kubernetes

Материал в двух частях от специалистов из компании Флант. Они описывают и сравнивают Open Source-утилиты для запуска управляемого хаоса в кластере Kubernetes. В первой части специалисты рассказали о появлении самой дисциплины chaos engineering, а также рассмотрели kube-monkey, chaoskube и Chaos Mesh.

Читать первую часть

Во второй статье список пополнится обзором Litmus Chaos, Chaos Toolkit, мини-подборкой из хаос-игр и пятью другими вариантами, заслуживающих внимания инженеров, заинтересованных в проверке инфраструктуры на устойчивость.

Читать вторую часть

2. Не паникуйте: Kubernetes и Docker

Начиная с версии v1.20, Kubernetes отказывается от Docker как от исполняемой среды контейнеров. Но не паникуйте. Не все так страшно, как представляется на первый взгляд. Перевод статьи, которая призвана ответить на шумиху вокруг грядущего релиза K8s, в котором поддержка Docker будет объявлена устаревшей.

Читать перевод

3. Red Hat борются с системной несправедливостью и расизмом в коде и документации

Red Hat продолжают бороться с использованием в коде и документации неполиткорректных или оскорбляющих слов. Вендор выпустил специальный фреймоворк, чтобы помочь другим компаниям выявлять у себя такие слова. В частности, рекомендовано заменить термины master/slave и blacklist/whitelist.

Конечно, в IT есть проблемы и посерьезнее, да и вообще, для русскоязычного сегмента, новость может выглядеть комично. Однако, похоже, что инициатива будет только расширяться и влиять на всю отрасль. К движению уже присоединились IBM, Linux Foundation, Cisco и ряд других крупных компаний.

Читать новость (на английском)

4. DevOps и SRE технологии и инструменты 2021 года

Небольшая, но очень ёмкая подборка технологий и инструментов, на которые DevOps и SRE-специалистам необходимо обратить пристальное внимание в 2021 году.

Читать подборку (на английском)

Подкасты

1. SRE vs DevOps

Кто такой Site Reliability Engineer (SRE), зачем он нужен и чем отличается от DevOps или простого системного администратора? Как SRE взаимодействуют внутри команды и вне её, как работает эта культура в разных странах? На эти и многие другие вопросы отвечают эксперты SRE Google и и другие спикеры в очередном выпуске подкаста Linkmeup.

Слушать подкаст

2. Зачем IT в благотворительности

Казалось бы, в благотворительности нет места разработке, да и бюджеты на IT там не предусмотрены. Однако именно технологический подход помогает фонду Нужна помощь собирать по миллиону рублей в день на решение социальных проблем. Технический директор фонда и тимлид проекта Если быть точным рассказали, как в фонде создают IT-инфраструктуру для благотворительности по всей России, и что происходит с разработкой, если о твоем сайте упомянул Иван Ургант.

Слушать подкаст

События

Вебинар Docker Swarm vs K8s. Уйти нельзя остаться. Когда, кому и зачем переходить на Kubernetes со Swarm

10 декабря Mail.ru Cloud Solutions проведут вебинар, на котором сравнят функциональность и ограничения Docker Swarm и Kubernetes. Спикеры разберутся почему лучше перейти на K8s или наоборот, остаться на Swarm. Расскажут, как упростить свой путь в овладении технологией Kubernetes с помощью облачных сервисов с гарантированной доступностью, которые автоматизируют операции Life Cycle. В конце вебинара на вопросы ответит ведущий DevOps Mail.ru Cloud Solutions.

Зарегистрироваться на вебинар

Доклады

DevOps без полномочий

Видео и расшифровка доклада с DevOps Moscow 2020. Спикеры рассказали, как простой исполнитель без больших полномочий может положительно влиять на энтерпрайзные процессы между Dev и Ops. Что кому говорить, как мотивировать и как работать с возражениями. За час выступления спикеры рассмотрели все возможные способы влияния без реальных полномочий, пожалуй, кроме парапсихологических практик и гипноза.

Читать материал и смотреть видео

Подробнее..

Категории: It-инфраструктура , Kubernetes , Системное администрирование , Дайджест , Devops , Подборка , Подкасты , Девопс , Девопс-инструменты , События

Способы взаимодействия сервисов друг с другом. Пулингпуш. Достоинстванедостатки. Выбор

28.04.2021 18:07:33 |

Автор: admin

Не всегда более производительное решение - решение, требующее меньше ресурсов при своей работе, - является лучшим. Часто сопутствующие факторы являются более значимыми: предсказуемость поведения при сбоях, скорость восстановления работоспособности после сбоев и т.п. Рассмотрим это на примере систем межсервисного взаимодействия.

Курьер доставил заказ. По смене статуса заказа надо уведомить заинтересованные стороны об этих событиях.
Клиент отправляет сообщение в чат поддержки. Нужно уведомить сервисы поддержки о поступивших данных от клиента.
Построение отчёта завершено. Ожидающий отчёт пользователь может его загрузить. Надо его уведомить об этом.

Знакомые/типовые ситуации. Одному сервису надо уведомить другой (другие) о происшедших событиях.

Давайте немного усложним:

Сервер - находится в нашей юрисдикции. Мы следим за тем, чтоб ресурсов ему на всё хватало. Добавляем ноды в кластер и т.п.

Заинтересованные в событиях стороны - находятся "где-то". На серверах клиентов. Которые экспериментируют, экономят на железе. Используют программные решения, не предназначенные для нагрузки, и т.п.

Какие способы уведомления есть?

Активность со стороны сервера

Это, в общем-то, типовое решение. Сервер держит список заинтересованных сторон. По мере появления событий выполняет HTTP-запросы к клиентам.

Подвариант этого решения: Websocket. Сервер отправляет события в сокеты всем подписанным сторонам.

Повторы, обработка ошибок

Рано или поздно любой TCP/HTTP-канал сталкивается с недоступностью другой стороны. Что делать после возникновения ошибки? Повторять запросы? Что делать с вновь поступающими запросами? Ждать, пока успешно выполнятся предыдущие?

Рассмотрим виды ошибок:

Сетевые
Устранимые (после повтора могут исчезнуть) HTTP (500, 502, 504, и т.п.)
Неустранимые (4xx)

Получив неустранимую ошибку, клиент может только записать её в лог. То есть, если полная остановка доставки сообщений не приемлема, то, получив неустранимую ошибку, типовым решением будет считать, что "уведомление доставлено", и переходить к доставке следующих уведомлений. Вероятно, это единственный нормальный путь.

Идя по этому пути, надо постоянно и внимательно следить за мониторами таких ошибок. Анализировать трафик на тему "почему возникла неустранимая ошибка?" и "можно ли жить дальше с этой ошибкой".

Но это не самая большая проблема.

Более интересными являются проблемы:

повторов
500-х ошибок

500-е ошибки

Мы выполняем запрос-передачу данных для сервера X. Происходит 500-я ошибка. Что это?

Возможны два варианта:

Сервис-приёмник данных по какой-то причине именно сейчас не работает (перегружается, переключается БД итп). В этом случае повтор запроса в дальнейшем приведёт нас к успеху.
В сервисе допущена ошибка, приводящая к 500. В этом случае, сколько бы повторов мы ни сделали, до исправления кода в приёмнике ситуация не изменится.

То есть, по повторяемости запросов ошибки у нас делятся на три вида:

Те, которым повтор поможет (сетевые, устранимые 500-ки).
Те, которым повтор не поможет, но выглядят как те, которым поможет (неустранимые 500-ки).
Те, которым повтор не поможет (например 40x-ки).

Разрабатывая политику повторов, помимо указанной проблемы, имеем ещё множество других проблем:

Как часто повторять запросы?
Не будем ли мы "укладывать" внешний сервис, повторяя запросы?
Не будем ли сами "укладываться", если одна из внешних систем по какой-то причине имеет некорректный TCP-стек (iptables DROP)?

Если посмотреть на систему повторов запросов, то обнаружится, что практически в каждом случае она выбирается индивидуально.

Подытожим:

Если сервис, генерирующий событие, и занимается доставкой его до заинтересованных сторон, то имеем

плюсы:

минимальный лаг доставки
минимальная нагрузка на хранилище сообщений;

минусы:

необходимость повторов в случае неуспеха доставок
необходимость ведения реестра, кому что доставлено и кому что нужно доставить
двусмысленность некоторых ошибок: непонятно, можно (нужно) ли повторять, или нет
зависимость от стека TCP на стороне клиентов (iptables -j DROP занимает слот отправки вплоть до таймаута)
система повторов может быть причиной DDoS для клиентских сервисов.

Также есть некоторое количество организационных минусов:

После того, как клиент прекратил де-факто работу (тут два варианта: сервера выключены, сервера не выключены), система продолжает доставлять ему уведомления.

Вебсокет в режиме клиент-сервер

Часть описанных проблем решает постоянное соединение, инициируемое клиентом. Однако именно часть.

Необходимость повторов и двусмысленность ошибок - снимаются. Однако, необходимость ведения реестра, кому и что нужно доставить (если мы говорим о системе сообщений "без потерь") остаётся. Зависимость от стека TCP на стороне клиента снижается, но не до нуля. Система также может быть причиной DDoS для клиентских сервисов.

Пулинг

Достоинства пулинга

Если у клиента проблемы со связью, нагрузкой - он просто не делает запросы
После того, как клиент отключается (организационный момент), - он перестаёт делать запросы
Максимально быстрое восстановление работоспособности после факапов.

Недостатки пулинга

минимальный лаг доставки сообщений равен интервалу пулинга, который обычно выбирается ненулевым
множество сервисов пулящих один создают существенно бОльшую нагрузку, нежели случай с активным сервисом. Сервисы, для которых нет сейчас никаких сообщений, всё равно создают нагрузку на подсистему доставки сообщений.

Ещё один неочевидный, организационный недостаток пулинга: часто способ получения новой порции данных связан со структурой хранения данных.

Если говорить о межсервисном взаимодействии (невысокое количество клиентов), то получается, что пулинг клиентом - наиболее выгодное решение. Почему?

отсутствие двусмысленности, описанной выше
наиболее быстрое восстановление работоспособности после сбоя
максимальная независимость от сетевого стека TCP на клиенте
нет необходимости хранить/майнтенить список клиентов.

Лаг доставки

Для чего вводят интервал пулинга? Каждый клиент, делающий 1 запрос за данными в секунду, - это 1RPS нагрузки. Почему нельзя пулить, не используя интервал (делать запрос сразу после получения результатов предыдущего)? Потому что обычно запрос за данными является сравнительно дорогим. А дорогим он является потому, что, как правило, некорректно спроектирован.

Как правило, запросы для пулинга формулируются как "есть ли данные для меня; если есть, то какие?". Такие запросы (в случае, если они некорректно спроектированы) зачастую имеют следующие проблемы:

запрос неиндексирован
при перегрузках количество данных в ответе может расти, или время выполнения запроса ухудшаться.

В случае, если получение очередной порции данных сопровождается простой выборкой из BTREE индекса, то и ответ на вопрос "есть ли данные?", как правило, сравнительно бесплатен. Об индексах поговорим ниже.

А сейчас давайте рассмотрим алгоритм работы традиционного пулера.

Первичная инциализация пулера. index := 0. index - это обобщённая переменная, указывающая на позицию запрашиваемых данных.
Выполняется запрос limit данных с позиции index.
Обрабатываем полученные данные
index := index + 1
Пауза соответствующая интервалу
Перейти к шагу 2

Если рассматривать этот алгоритм, то видим, что переменная index и есть то, что связывает нас со структурой хранения данных.

Такой алгоритм, как правило, используют новички и... приводят себя к трудноустранимой проблеме: запросы с большими значениями index сделать индексируемыми крайне сложно. Почти невозможно.

Почему разработчик попадает в такую ситуацию? Потому что проектирует БД и API отдельно друг от друга. А нужно посмотреть на все компоненты в целом и на влияние их друг на друга.

Проблема состоит в том, что в БД, как правило, данные хранятся в виде плоских таблиц. Когда мы получаем очередную порцию данных с одними и теми же условиями фильтрации, то приходится делать что-то вроде следующего:

SELECT    *FROM    "table"WHERE    "somefield" = $1LIMIT    100OFFSET    $2

То есть, index из алгоритма пересчитывается в смещение ($2). Такой запрос из БД имеет всё более ухудшающийся план выполнения по мере роста смещения (которое растёт с ростом index).

Как сделать план независящим от положения смещения? Использовать вместо смещения выборку из индекса:

SELECT    *FROM    "table"WHERE    "id" > $1ORDER BY    "id"LIMIT    100

В этом случае алгоритм клиента должен поменяться таким образом, чтобы каждой итерации цикла использовать значение index, взятое от предыдущего шага. Перепишем алгоритм:

Первичная инициализация. index := 0
Выполняем запрос limit данных, передавая в запрос index
Вычисляем новое значение index, как максимум от id в ответе
Обрабатываем данные
Пауза, соответствующая интервалу
Перейти к шагу 2

В системе с такой архитектурой, как правило, уже нет существенных препятствий к снижению интервала до минимальных значений (вплоть до нуля).

Но давайте ещё порефлексируем над архитектурой. Что плохого в ней?

Алгоритм привязан к структуре данных
Выполняется практически полностью на стороне клиента
Вследствие предыдущей проблемы сложно, например, централизованно модифицировать его на иную работу после факапов/проблем.
Пользователь может сам подставлять в index произвольные значения. Иногда это может быть нежелательно или приводить к багам, которые разработчику сервера сложно понять.

Давайте ещё раз модифицируем алгоритм. Заменим index на state и управлять им будем с сервера:

Первичная инициализация. state := null.
Выполняем запрос limit данных, передавая в запрос значение state
В каждом ответе, помимо данных, сервер возвращает new_state. state := new_state
Обрабатываем данные
Пауза-интервал
Перейти к шагу 2

Что мы получили? Гибкость.

Переменная state определяется только сервером и не обязана быть привязанной к числу смещения. При желании в этой переменной можем хранить JSON со многими полями.
При желании можем ограничить возможности пользователя "хачить" запросы (использовать другие значения index, помните выше мы об этом говорили?). Этого можно достичь, например криптоподписывая state.

Если в переменной state хранится не только позиция окна, а, например, и значения фильтров и криптоподпись, то эту переменную имеет смысл называть курсором. Переименуем переменную ещё раз и избавимся от постоянных задержек:

Первичная инициализация. cursor := null, filters = значения_фильтров.
Выполняем запрос limit данных, передавая в запрос значение cursor, filters.
В каждом ответе, помимо данных, сервер возвращает cursor. cursor := response.cursor
Обрабатываем данные
Если данные были, перейти к шагу 2
Пауза-интервал
Перейти к шагу 2

Таким образом, получаем алгоритм, минимизирующий число запросов, если данных для клиента нет, и запрашивающий данные с максимальной производительностью, если таковые имеются.

Рекомендации по работе с курсорами:

Поскольку хранением курсора между запросами озадачен клиент, то имеет смысл хранить в курсоре и версию ПО сервера. В этом случае можно написать дополнительный код, обеспечивающий обратную совместимость (конвертацию форматов курсоров).
Во избежание трудных багов весь набор фильтров, полученных в первом запросе, хорошо хранить в курсоре и в последующих запросах игнорировать параметры фильтрации не из курсора. Перфекционисты могут даже выделить инициализацию курсора в отдельный запрос.
Во избежание введения в соблазн пользователей использовать в своём коде какие-то данные из курсора, лучше не использовать человекочитаемую строку в значении курсора. JSON, пропущенный через base64-кодирование (и криптоподписанный) подходит идеально.

Пример. Изменение алгоритма после сбоя.

Любая система гарантированной доставки сообщений из точки А в точку B в случае факапов будет накапливать пул недоставленных сообщений. После восстановления работоспособности будет период времени, когда приёмник данных сильно отстаёт от источника.

В случае, если порядок доставки сообщений возможно нарушать, то обработчик запроса с курсором может (продетектировав значительное отставание) начать возвращать два потока данных: тот, на который подписан клиент, и тот же, но с более актуальными данными.

То есть, limit делим, например, пополам. Половину limit'а заполняем данными из обычного курсора. А во второй половине начинаем передавать данные, начиная от id, с небольшим отставанием.

Таким образом, пользователи, запросившие отчёт прямо во время факапа, продолжат его ждать (и дождутся). А пользователи, запросившие отчёт после факапа, получат его с небольшой задержкой.

Пример алгоритма серверной стороны, включающего второй поток в случае сильного отставания, приведён на рисунке.

Пофантазировав, схему можно дополнить не одним, а несколькими фолбеками.

Курсорная репликация

Описанные курсоры можно использовать для репликации данных с сервиса на сервис.

Часто один сервис должен иметь у себя кеш/реплику части данных другого сервиса. При этом требований синхронности к этой реплике нет. Поменялись данные в сервисе A. Они должны максимально быстро поменяться и в сервисе B.

Например, мы хотим реплицировать табицу пользователей с сервиса на сервис.

Для такой репликации можно использовать что-то готовое из инструментария баз данных, а можно сделать небольшой "велосипед". Предположим, что пользователи хранятся в БД PostgreSQL. Тогда делаем следующее:

создаём дополнительный столбик SERIAL/BIGSERIAL в таблице users, назовём его lsn (Last sequence number).
модифицируем изменяющие пользователей запросы, чтобы на каждое изменение записи пользователя значение lsn устанавливалось бы из растущей последовательности
строим по полю lsn (уникальный) BTREE индекс.

В этом случае обновление записи пользователя будет выглядеть примерно так:

UPDATE   "users"SET   "name" = $1,   ...   "lsn" = DEFAULT /* последовательность */WHERE   "user_id" = $21

А запрос для работы курсора будет выглядеть как-то так:

SELECT    *FROM    "users"WHERE    "lsn" > $1ORDER BY    "lsn"LIMIT    $2

Каждое обновление пользовательской записи будет перемещать её в конец списка lsn. При этом общий размер отставания никогда не превысит размер таблицы пользователей.

Итоги

Почти во всех случаях, когда применяется активная система уведомлений зависимых сервисов, её можно заменить описанной курсорной подпиской.
При этом проблемы доступности клиентов, настроек, работоспособности TCP-стека останутся у клиентов
Максимально быстрое и простое восстановление после простоя/сбоев. Отсутствие двусмысленностей в кодах ошибок.

Подробнее..

Категории: Программирование , Микросервисы , Архитектура , Выбор , Push-уведомления , События , Межсерверное взаимодействие , Пулинг

Хакатоны Зима 2020

04.01.2021 14:06:43 |

Автор: admin

Это продолжение моего обзора по хакатонам 2020 года - первая часть тут

AGRO HACK

Линк на хакатон - https://agro-code.ru/

[ Короткий хакатон прошедший 11.12 13.12 ]

Недавно мы с друзьями поучаствовали в хакатоне Агрокод, прошедший в течении выходных с 11 по 13 декабря. Хакатон проводил Россельхозбанк. В хакатоне мы участвовали командой из 5 человек.

Хакатон включал в себя несколько различных заданий-треков. Среди заданий были следующие:

Разработка приложения для повышения урожайности космической клубники
Рекомендательный сервис по размещению культур на сельскохозяйственных полях
Определение заболоченных и переувлажненных участков сельскохозяйственных угодий
Нейросеть для обнаружения заболеваний листьев яблони по фотографии
Разработка полетного задания для группировки сельскохозяйственных дронов

Мы выбрали задание Нейросеть для обнаружения заболеваний листьев яблони по фотографии.

На этот хакатон мы решили собрать команду. Основная причина в том, что кроме модели с машинным обучением надо было создать веб интерфейс. Для этого понадобилось больше специалистов. Изначально нас было всего два человека Владимир @vovaekb90 и я. Мы специалисты только в машинном обучении. Поэтому мы пригласили в команду еще двух человек Никиту @NickTheBuilder и Илью @Sopherdjin, они отвечали за реализацию веба фронт и бекенда. Критерий оценки был 80% за точность модели и 20% за веб интерфейс который использовал эту модель. На совещании команды мы решили добавить специалистов по машинному обучению и я пригласил в команду Антона @med_phisiker . Мы назвали команду Berserkers AI и приняли участие в хакатоне. Нам понравилась организация этого мероприятия. Перед началом хакатона был общий стрим в зуме с ответами на вопросы по задаче и по данным. Это сильно помогло нам на начальном этапе работы. Оказалось организаторы трека упростили задачу и нас ждала бинарная классификация определения больного или здорового дерева по фотографии листа. В первый вечер Антон предложил нам модель на Pytorch для классификации фотографий.

Для улучшения точности модели мы использовали ступенчатое уменьшение лернинг рейта в процессе обучения. Мы перепробовали 5-7 моделей пред обученных сетей и лучшую точность нам дал Efficient Net.

Изначально нам дали размеченный датасет состоящий из 2к картинок.Нам пришла идея расширить датасет. Путем добавления данных с Kaggle и других датасетов использованных в научных работах со схожей тематикой. Теоретически это должно было улучшить наш результат. Изначально это казалось идеальным решением,но при обсуждении с командой мы вспомнили что это может запросто ухудшить наш результат. Тестовый дататест был у организаторов. Нам дали только сабсет этих данных и он отражал генеральную совокупность всех данных. Был слишком большой риск что модель будет учиться на данных с другим распределением. Мы пробовали добавлять 5%,10%,15% новых данных, но это не давало нам прироста. Результат становился даже немного хуже. Поэтому мы решили больше работать с аугментацией данных.

Что касается веб интерфейса Никита и Илья писали его на React. Мы использовали модульный подход. Команде создающей веб мы дали дамп модели, что бы они не простаивали и создавали веб. Пока команда по машинному обучению тюнила модель, команда с вебом создавала веб, пусть и на бейзлайновом дампе модели. За несколько часов до финальной презентации, мы просто отдали финальную модель команде с вебом. Они просто заменили старую модель на последнюю версию.

На протяжении всего хакатона мы проходили чек- поинты на которых менторы направляли наши усилия на эффективное решение задачи. Не смотря на то, что хакатон был онлайн организаторы позаботились о питании команд. Это было здорово и показало класс организации. Каждому участнику были даны купоны на Яндекс еду или ДоДо пицу из расчета 3 приема пищи за день.

Конкуренция была очень серьезная. На хакатон по нашему треку было отобрано 10 команд, которые показали отличные результаты. Вот списки команд - https://agro-code.ru/results/

При финальном оглашении результатов оказалось что две команды заняли первое место. К сожалению это был не мы. Наша команда заняла 3 место среди 9 команд дошедших до финала. Основным критерием была точность и 5 лидирующих команд выдали fscore 0.99 на тестовой выборке. Окончательный результат определили тысячные доли.

Всей нашей команде понравился этот хакатон интересной задачей и великолепной организацией. Продолжение следует

Подробнее..

Категории: Хакатоны , Хакатон , Машинное обучение , Нейросети , Питон , События

	Русский
	English

События

В далекой-далекой галактике 700 млн лет назад родилось нейтрино, рассказавшее нам о гибели звезды из-за черной дыры

DevOps-дайджест от Рексофт

Статьи

1. Обзор инструментов для chaos engineering в Kubernetes

2. Не паникуйте: Kubernetes и Docker

3. Red Hat борются с системной несправедливостью и расизмом в коде и документации

4. DevOps и SRE технологии и инструменты 2021 года

Подкасты

1. SRE vs DevOps

2. Зачем IT в благотворительности

События

Вебинар Docker Swarm vs K8s. Уйти нельзя остаться. Когда, кому и зачем переходить на Kubernetes со Swarm

Доклады

DevOps без полномочий

Способы взаимодействия сервисов друг с другом. Пулингпуш. Достоинстванедостатки. Выбор

Активность со стороны сервера

Повторы, обработка ошибок

500-е ошибки

Вебсокет в режиме клиент-сервер

Пулинг

Достоинства пулинга

Недостатки пулинга

Лаг доставки

Пример. Изменение алгоритма после сбоя.

Курсорная репликация

Итоги

Хакатоны Зима 2020

AGRO HACK

Категории

Последние комментарии