Автоматы

"Кто ни разу не ошибался в индексировании цикла, пусть первый бросит в деструкторе исключение."

Древняя мудрость

Циклы ужасны. Циклы сложно читать вместо того, чтобы сразу понять намерение автора, приходится сначала вникать в код, чтобы понять, что именно он делает. В цикле легко ошибиться с индексированием и переопределить индекс цикла во вложенном цикле. Циклы сложно поддерживать, исправлять в случае ошибок, сложно вносить текущие изменения, и т.д. и т.п.

В конце концов, это просто некрасиво.

Человечество издревле пытается упростить написание циклов. Вначале программисты подметили часто повторяющиеся циклы и выделили их в отдельные функции. Затем они придумали ленивые итераторы, а потом и диапазоны. И каждая из этих идей была прорывом. Но, несмотря на это, идеал до сих пор не достигнут, и люди продолжают искать способы улучшить свой код.

Данная работа ставит своей целью пролить свет на отнюдь не новую, но пока что не слишком распространённую идею, которая вполне способна произвести очередной прорыв в области написания программ на языке C++.

Так как же писать красивый, понятный, эффективный код, а также иметь возможность параллелить большие вычисления лёгким движением пальцев по клавиатуре?

Содержание

Существующие модели
Базовые понятия
1. Определение 1: свёртка
2. Определение 2: ядро свёртки
Идеология
Я птичка, мне такое сложно, можно я сразу код посмотрю?
1. Простой пример
2. constexpr
Многопоточность
Сравнительная таблица
Ссылки

Существующие модели

Основные на текущий момент способы избавления от циклов это алгоритмы из стандартной библиотеки и ленивые итераторы и диапазоны из библиотек Boost.Iterator, Boost.Range и range-v3.

range-v3 частично попали в стандартную библиотеку C++20, но, во-первых, попали они туда в достаточно усечённом виде, а во-вторых, соответствующих реализаций на текущий момент пока нет.

Стандартные алгоритмы прекрасны, и помогают избаваться от циклов, но, к сожалению, только в самых простых случаях, посколько несколько таких алгоритмов невозможно скомбинировать в единое вычисление. Для каждого шага придётся хранить промежуточный результат. А это и перерасход по памяти, и сложности с выводом типов для промежуточных результатов, то есть усложнение кода.

Именно из-за этого появились ленивые итераторы и диапазоны в сторонних библиотеках, а в C++17 появились гибриды семейства std::transform_reduce.

Ленивые итераторы и диапазоны решают многие проблемы. Но они сами не лишены своих собственных проблем. В частности, поскольку они отделены от схемы вычислений (они определяют только операции над отдельными элементами последовательности), их сложно параллелить. А стандартные алгоритмы уже с C++17 имеют параллельные версии, способные более эффективно использовать многоядерные архитектуры.

Возникает вопрос: можно ли объединить преимущества обоих подходов одновременно? Оказывается, можно. Об этом и пойдёт речь далее.

Базовые понятия

Для того, чтобы двинуться далее, необходимо разобраться с тем, что такое свёртка.

Определение 1: свёртка

Свёртка это вычислительный процесс, производимый над некоторой последовательностью значений по правилу, задаваемому ядром свёртки.

Результат свёртки значение, полученное последовательным применением ядра свёртки к текущему значению и очередному элементу последовательности.

Определение 2: ядро свёртки

Ядро свёртки это действие, производимое на каждом шаге свёртки. Применяется к текущему значению свёртки и очередному элементу последовательности.

Свёртка

На этом рисунке изображена свёртка последовательности $\{x_0, x_1, x_2\}$ с ядром $inline$ и начальным значением $inline$ . $inline$ результат свёртки.

В стандартной библиотеке свёртка представлена алгоритмами std::accumulate и std::reduce.

Идеология

Итак, для того, чтобы понять основную идею данного подхода, нужно обратить внимание на несколько известных фактов.

Факт 1: каждый цикл можно представить в виде свёртки

И действительно:

Контекст программы перед началом цикла начальное значение;
Набор индексов, контейнер, диапазон и т.п. последовательность элементов;
Итерация цикла применение двуместной операции (ядра свёртки) к текущему значению и очередному элементу последовательности, в результате чего текущее значение изменяется.

auto v = 0;                   // Начальное значение: v_0for (auto i = 0; i < 10; ++i) // Последовательность: [x_0, x_1, ...]{    v = f(v, i);              // Двуместная операция, изменяющая                              // значение: v_{i + 1} = f(v_i, x_i)}

Иначе говоря, для того, чтобы выразить любой цикл, достаточно базиса из одной единственной операции свёртки. А все остальные операции например, стандартные алгоритмы, можно выразить через неё.

Пример 1: отображение через свёртку

template <ForwardIterator I, OutputIterator J, UnaryFunction F>J transform (I begin, I end, J result, F f){    // Начальное значение  это выходной итератор.    auto initial_value = result;    // Ядро свёртки.    auto binary_op =        [] (auto iterator, auto next_element)        {            // Записываем в текущий итератор результат отображения...            *iterator = f(next_element);            // ... и возвращаем продвинутый итератор.            return ++iterator;        };    // Свёртка.    return accumulate(begin, end, initial_value, binary_op);}

Пример 2: фильтрация через свёртку

template <ForwardIterator I, OutputIterator J, UnaryPredicate P>J copy_if (I begin, I end, J result, P p){    // Начальное значение.    auto initial_value = result;    // Ядро свёртки.    auto binary_op =        [p] (auto iterator, auto next_element)        {            if (p(next_element))            {                *iterator = next_element;                ++iterator;            }            return iterator;        };    // Свёртка.    return accumulate(begin, end, initial_value, binary_op);}

Аналогичным образом выражаются и все остальные последовательные алгоритмы. Любознательный читатель может проделать это в качестве упражнения.

Факт 2: большинство циклов расладываются на простые составляющие

Если присмотреться, то станет понятно, что большинство циклов типовые. Они раскладываются на простые составляющие:

Преобразование;
Фильтрация;
Группировка;
Подсчёт;
Суммирование;
Запись в массив;
...
и т.д.

Это значит, что нужно подобрать достаточно выразительный базис операций, чтобы их комбинациями покрыть подавляющее большинство возможных циклов, а также научиться легко и удобно составлять эти комбинации с точки зрения программного кода.

Факт 3: каждую свёртку можно представить в виде автомата

По определению, автомат это система, которая может пребывать в различных состояниях, а переход между этими состояниями происходит при произведении на систему определённого воздействия.

Так, если рассматривать свёртку как автомат, то состояния этого автомата это совокупность возможных значений переменной, а воздействие это применение ядра свёртки к текущему значению переменной и очередному элементу последовательности.

Важно:

В данной модели рассматривается обобщение автоматов, когда есть не только входные символы, под действием которых происходит переход между состояниями, но и выходные символы, сопутствующие этому переходу.
На диаграмме входной символ рисуется над стрелками переходов, а выходной под стрелкой.

Кроме того, наш автомат может обладать памятью.

Автомат

Пример 1: автомат для отображения

Например, так будет выглядеть автомат для отображения (transform, или map в функциональном программировании).

Автомат для отображения

Здесь $inline$ входной символ, $inline$ функция преобразования.

Данный автомат имеет одно состояние и один переход. Каждый входной символ $inline$ он преобразует с помощью функции $inline$ , и результат этого преобразования подаёт на выход. После этого возвращается в исходное состояние.

Пример 2: автомат для фильтрации

Автомат для фильтрации

Здесь $inline$ входной символ, $inline$ предикат, $\epsilon$ обозначение пустого символа.

Данный автомат имеет одно состояние и два перехода. Один переход реализуется тогда, когда входной символ $inline$ удовлетворяет предикату $inline$ . В этом случае на выход подаётся сам символ $inline$ . В случае, если символ $inline$ не удовлетворяет предикату, на выход подаётся пустой символ $\epsilon$ (то есть ничего не подаётся). В обоих случаях автомат возвращается в исходное состояние.

Факт 4: автоматы комбинируются

Если у автомата есть выход, то, очевидно, этот выход можно подать на вход другому автомату.

Композиция автоматов

Таким образом, имея набор из нескольких автоматов, каждый из которых задаёт одну операцию преобразования, можно составлять достаточно сложные преобразования.

Снова к свёртке

Чтобы получить нужную нам свёртку, в конец цепочки мы поставим автомат, который представляет собой ядро свёртки.

Цепочка с ядром в конце

Далее заметим, что все автоматы, кроме последнего, как бы подготавливают данные для него, поэтому можно мысленно схлопнуть все автоматы в последний. Получим ядро свёртки. А это и есть тело цикла, который мы и хотели записать.

Схлопнули

Итак, мы разложили цикл на простые составляющие и представили с помощью свёртки. В теории всё прекрасно, но как же это будет выглядеть в коде?

Код

На основе изложенных выше идей разработана библиотека Проксима.

Простой пример

#include <proxima/compose.hpp>#include <proxima/kernel/sum.hpp>#include <proxima/reduce.hpp>#include <proxima/transducer/stride.hpp>#include <proxima/transducer/take_while.hpp>#include <proxima/transducer/transform.hpp>#include <cassert>int main (){    const int items[] = {1, 2, 3, 4, 5};    const auto kernel =        proxima::compose        (            proxima::transform([] (auto x) {return x * x;}),   // 1. Каждый элемент возведён в квадрат;            proxima::stride(2),                                // 2. Берутся только элементы с номерами,                                                               //    кратными двойке (нумерация с нуля);            proxima::take_while([] (auto x) {return x < 10;}), // 3. Элементы берутся до тех пор, пока                                                               //    они меньше десяти;            proxima::sum                                       // 4. Результат суммируется.        );    const auto x = proxima::reduce(items, kernel);    assert(x == 10); // 1 * 1 + 3 * 3}

constexpr

Можно отметить, что код из примера может быть выполнен на этапе компиляции:

#include <proxima/compose.hpp>#include <proxima/kernel/sum.hpp>#include <proxima/reduce.hpp>#include <proxima/transducer/stride.hpp>#include <proxima/transducer/take_while.hpp>#include <proxima/transducer/transform.hpp>int main (){    constexpr int items[] = {1, 2, 3, 4, 5};    constexpr auto kernel =        proxima::compose        (            proxima::transform([] (auto x) {return x * x;}),   // 1. Каждый элемент возведён в квадрат;            proxima::stride(2),                                // 2. Берутся только элементы с номерами,                                                               //    кратными двойке (нумерация с нуля);            proxima::take_while([] (auto x) {return x < 10;}), // 3. Элементы берутся до тех пор, пока                                                               //    они меньше десяти;            proxima::sum                                       // 4. Результат суммируется.        );    constexpr auto x = proxima::reduce(items, kernel);    static_assert(x == 10); // 1 * 1 + 3 * 3}

Большая часть Проксимы может быть выполнена на этапе компиляции.

Многопоточность

Одна из ключевых особенностей описываемой модели состоит в том, что она легко поддаётся параллелизации.

В Проксиме существует механизм, с помощью которого очень легко распараллеливать вычисления. Это делается с помощью фиктивного преобразователя pipe, который выполняет роль "разделителя потоков":

proxima::reduce(values,    proxima::compose    (        proxima::for_each(hard_work), // | Поток 1                                      // ----------        proxima::pipe,                //            Разделитель потоков                                      // ----------        proxima::for_each(hard_work), // | Поток 2                                      // ----------        proxima::pipe,                //            Разделитель потоков                                      // ----------        proxima::for_each(hard_work), // | Поток 3        proxima::sum                  // | Поток 3    ));

Запись выше означает, что будут созданы три потока, и в каждом из них будет выполняться только часть работы над очередным элементом последовательности.

Чтобы показать эффективность такого разбиения, рассмотрим пример (полный код лежит на Гитлабе).

В нём будем замерять разницу между распараллеленной в три потока свёрткой, обычной свёрткой и простым циклом. Для имитации "тяжёлых" вычислений сделаем функцию, которая просто засыпает на несколько микросекунд. И сгенерируем набор случайных чисел, которые и будут определять время засыпания.

auto hard_work (std::int32_t time_to_sleep){    std::this_thread::sleep_for(std::chrono::microseconds(time_to_sleep));}const auto proxima_crunch_parallel =    [] (auto b, auto e)    {        return            proxima::reduce(b, e,                proxima::compose                (                    proxima::for_each(hard_work),                    proxima::pipe,                    proxima::for_each(hard_work),                    proxima::pipe,                    proxima::for_each(hard_work),                    proxima::sum                ));    };const auto proxima_crunch =    [] (auto b, auto e)    {        return            proxima::reduce(b, e,                proxima::compose                (                    proxima::for_each(hard_work),                    proxima::for_each(hard_work),                    proxima::for_each(hard_work),                    proxima::sum                ));    };const auto loop_crunch =    [] (auto b, auto e)    {        auto sum = typename decltype(b)::value_type{0};        while (b != e)        {            hard_work(*b);            hard_work(*b);            hard_work(*b);            sum += *b;            ++b;        }        return sum;    };

Если сгенерировать 1000 случайных засыпаний в диапазоне от 10 до 20 микросекунд, то получим следующую картину (показано время работы соответствующего обработчика чем меньше, тем лучше):

proxima_crunch_parallel | 0.0403945proxima_crunch          | 0.100419loop_crunch             | 0.103092

И чем "жирнее" будут вычислительные функции, тем больше будет отрыв многопоточной версии. Например, если взять случайные засыпания в диапазоне от 100 до 200 микросекунд, то картина будет следующей:

proxima_crunch_parallel | 0.213352proxima_crunch          | 0.624727loop_crunch             | 0.625393

То есть почти в три раза быстрее, как было бы при идеальном разложении на три потока.

Сравнительная таблица

Библиотека	STL (алгоритмы)	Boost	range-v3	Проксима
Компонуемость	Нет	Да	Да	Да
Вывод типов	Плохо	Средне	Средне	Хорошо
Параллелизация	Почти*	Нет	Нет	Да
Совместимость	Boost	STL	STL	Всё
Расширяемость	Сложно	Нормально	Сложно	Легко
Самостоятельность	Да	Да	Да	Не совсем
constexpr	Частично	Нет	Частично**	Да***
Модель	Монолитная	Ленивая	Ленивая	Неленивая

*) Параллелизация в STL ещё не везде реализована.

**) constexpr диапазонов, видимо, будет лучше, когда они попадут в STL.

***) constexpr Проксимы зависит от STL. Всё, что своё уже constexpr. Всё, что зависит от STL, будет constexpr как только в STL оно будет таковым.

Привет, Хабр! Я аспирант Университета ИТМО и вхожу в научную группу, которая занимается использованием искусственного интеллекта в медицине. Этим занимаются многие, но у нас есть, в том числе, и своя фишка использование автоматных моделей в медицине. Я хочу немного рассказать об этом.

Системы поддержки принятия решений (СППР) (англ. Decision Support System, DSS) набирают популярность в современной медицине. Основной целью таких компьютерных систем является помощь людям, принимающим решение в сложных условиях для полного и объективного анализа предметной деятельности.

Медицинские СППР в статьях называют CDSS, добавляя слово clinical и получая Clinical Decision Support System Клиническая система поддержки принятия решений. Данные системы направлены, в первую очередь, на помощь в назначении процедур и лекарств при лечении и реабилитации пациентов.

В медицинских процессах довольно большой объем действий строго ограничен клиническим протоколом. Понять ~~и простить~~ его довольно сложно не только обычному человеку, но и не очень опытному медперсоналу. Поэтому задача о структурировании этого протокола для упрощения взаимодействия с ним является довольно востребованной.

На картинке фрагмент клинического протокола из официального документа Министерства здравоохранения РФ Клинические рекомендации: рассеянный склероз с интересным названием Алгоритм ведения пациента с обострением РС.

Если кому-то интуитивно понятно, что нужно делать в случае, когда после применения плазмафереза есть эффект, то он определенно что-то знает об этой жизни и не только. То есть основная проблема этих протоколов в том, что почти у каждой стрелочки возникает вопрос а что, если не так?. В силу этой проблемы в сыром виде использовать клинические протоколы без непосредственного участия высококлассного специалиста не представляется возможным.

Понятно, что можно повысить эффективность медицинских процессов, если ради толкования строго регламентированных процессов не придется каждый раз дергать врача и, например, выдачу лекарств переложить на младших медработников, которым будет помогать СППР. На всякий случай поясню: во многих клинических процессах даже выбор лекарств строго зависит от численных результатов анализов, и врач не может просто взять и назначить что-то другое, просто потому что захотел.

Теперь, зная масштаб проблемы, вернемся к автоматным моделям. Данный пост рассчитан на то, чтобы показать, почему использование автоматных моделей при разработке СППР на самом деле не только оправдано, но и интуитивно логично.

Начнем с самого простого: в автомате есть множество состояний и множество переходов, ровно также и у пациента есть состояние. В предыдущем предложении слова состояние ни что иное, как омонимы. Более того, человек не может быть одновременно и жив, и мертв, а значит, что, как и в случае с автоматом, состояние в момент времени у человека ровно одно. Почему бы их не попытаться сопоставить друг другу?

Так как автоматную модель мы собираемся использовать в СППР, да еще и для реализации клинического протокола, использовать имеет смысл именно Детерминированные Конечные автоматы. Давайте рассмотрим свойства такой модели и убедимся, что они очень похожи на необходимые свойства требуемой системы.

Как оказалось, просто загуглить свойства детерминированного конечного автомата не получается, так как в явном виде их никто не формулирует возможно, потому что эти свойства слишком очевидны, возможно, никому не интересны. Тем не менее, выделим два довольно полезных для обсуждаемой темы:

Условия переходов из каждого состояния ортогональны физически.
Функции логической дизъюнкции, описывающие такие переходы, тождественно равны единице.

Давайте разберемся, что нам это дает. В случае с первым условием пациент, например, не может одновременно находиться в разных стадиях обострения. Или нельзя, например, одновременно дать пациенту лекарство и не дать. Второе свойство гарантирует, что весь спектр действий, предложенных в текущем состоянии, покрывает множество всех вариантов полностью, что поможет избежать ситуации, описанной ранее про после применения плазмафереза есть эффект, то есть, независимо от входной последовательности автомата/работы с пациентом, мы всегда будем знать следующее состояние.

Ну и финальный явный плюс применения автоматной модели это, конечно же, огромное многообразие средств верификации, которые, в свою очередь, при правильном применении дают гарантию того, что если модель автомата составлена верно, то после интеграции в систему она будет работать корректно всегда.

В заключение хочется отметить, что, несмотря на описанные предпосылки, интеграция автоматной модели не настолько простой процесс, как хотелось бы. Например, необычные случаи течения болезни не всегда описаны в клиническом протоколе и требуют умственной деятельности со стороны специалиста, однако все глупые вещи можно с чистой совестью оставить для СППР!