Русский
Русский
English
Статистика
Реклама

Байес

Как перейти к байесовским доверительным интервалам, не потеряв понимание классического частотного вывода

20.01.2021 16:09:28 | Автор: admin

Много слов уже сказано о доверительных интервалах для оценки параметра в байесе и частотке. Существуют десятки объяснений, но ни одно из них не показывает "на пальцах", чем отличаются механизмы создания этих интервалов. Так вот давайте еще и я попробую объяснить вам так, чтобы вы больше никогда не конфузились при их упоминании.

В частотном анализе, о чем вы наверняка слышали, есть одна проблема: мало кто понимает, как правильно интерпретировать классические частотные доверительные интервалы (confidence intervals). В связи с чем часто их путают с байесовскими (credible intervals).
Информация ниже содержит the nuts and bolts построения обоих доверительных интервалов (которые почему-то не описываются в книгах и форумах), а также минусы использования этих методов.

Частотка

В учебниках по статистике пишут так: "У вас есть точечная оценка некоторого параметра. Теперь подставьте ее в формулу для доверительного интервала. Вот ваш интервал. Верьте ему с вероятностью 0.95, что бы это не значило." До обнаружения существования байесовского вывода вопросов и не возникало, да? А теперь, чтобы понять разницу в мышлении, приходится разбираться по-новой и в частотке.

Предлагаю рассмотреть пример оценки неизвестного параметра абстрактного распределения. Допустим, имеем какое-то произвольное распределение с некоторой дисперсией 2и матожиданием . У есть конкретное значение (обозначим его на рисунке), но представим, что мы не знаем, где оно находится. Перед нами стоит задача оценить, чему же равно .
Как полагается по центральной предельной теореме, берем из генеральной совокупности выборку размера n и рассчитываем ее среднее арифметическое X. Если проделывать эту операцию множество раз, значения X будут иметь нормальное распределение N(, 2/n). Изобразим это на графике.

Теперь будем рассуждать так. Если мы получаем много разных значений X, то положение мы можем определить (потому что получим нормальное распределение по ЦПТ). Но если у нас будет только одно значение, что делать? Тогда придется выбрать интервал вокруг полученного X, в пределах которого должно находится истинное значение . Другими словами, если мы построим интервал (-2; 3), то с какой-то вероятностью ожидаем, что Бог нам скажет "О да, настоящее = -1, ваш интервал содержит истинное значение". Но проблема в том, что если X равно уж очень екстремальному значению, тогда какой бы широкий интервал мы не выбрали, все равно может оказаться за его пределами. Так что делать?

Так как мы читерим и на самом деле видим, где находится наш параметр , давайте рассуждать с его позиции. хочет, чтобы как можно больше выборочных средних его включили в свой интервал. Поэтому будет требовать, чтобы хотя бы 95% X давали правильный интервал. А точнее так: пусть все значения X, которые больше 2.5% квантиля и меньше 97.5% квантиля, дают интервалы, в которых точно содержится . А те, которые дальше от , так и быть, дают неправильные интервалы. Такое вот требование выставляет параметр .

Теперь рассуждаем от лица X, которые мы получили эмпирически. X не знает, где находится , но очень хочет, чтобы его интервал содержал . Он знает, что ему нужно попасть в нужные квантили, чтобы показывать правильный интервал. Где же тогда может находиться ?

Начинаем перебирать все значения с их перцнтилями. Напомню, что 95% интервал вокруг равен 2 * std (в нашем примере std = /n^0.5, но не будем запутываться). Как видим, X не попадает в некоторые перцентили(красные на рисунке), а в некоторые попадает(зеленые) - вот для этих наша оценка должна выдавать правильный интервал. Отсюда, границы нашего интервала формируются самыми критичными значениями , при которых X еще содержится в 2 * std. Тогда и расстояние от X до границ интервала равны 2 * std.

Теперь мы готовы сказать: имея некоторое эмпирическое наблюдение, которое взято из нормального распределения, мы можем построить доверительный интервал X 2 * std.

5% интервалов не содержат истинное значение неизвестного параметра5% интервалов не содержат истинное значение неизвестного параметра

Наконец, можем сделать вывод.
Доверительный интервал в частотной статистике строится индивидуально для каждого эксперимента. В 95% случаев эти интервалы содержат истинное значение оцениваемого параметра. Однако, к сожалению, в 5% случаев(в 5 из 100 экспериментов) мы указываем вовсе неправильный диапазон значений.
Собственно, этот факт и дизморалит. Обычно задача стоит провести только 1 эксперимент и дать какую-то оценку неизвестному параметру. Этот 1 опыт может оказаться в тех самых 5% и мы дадим просто безсмысленную оценку параметру.

Байес

Как ни странно, Байес оказывается более интуитивным в интерпретации доверительных интервалов.

Байесовский доверительный интервал - такой, который содежит значение неизвестного параметра с вероятностью 95%. То есть мы так же получаем разные выборочные данные X, но теперь по ним строим единственный интервал. Получая новые данные, мы можем апдейтить модель, тем самым сужая диапазон значений, в которых почти точно находится наш параметр. Таким образом, ключевое отличие credible interval от confident interval в том, что мы имеем дело не просто с фиксированным (хоть и неизвестным) значением параметра, а с целым распределением его предполагаемых значений.

Однако такой подход накладывает дополнительные условия. Нужно выбирать априорное распределение неизвестного параметра. Оно информативно, если мы заранее можем предположить, где находятся более вероятные значения, или же неинформативно(можем взять даже равномерное распределение, если не беремся ничего предполагать).
Переходим к конкретике. Допустим, мы думаем, что параметр ~ N(0, 6). Как видите на рисунке ниже, это довольно слабое априорное распределение. Далее мы получаем первое наблюдение X и для каждого возможного значения строим функцию правдоподобия. Функция правдоподобия определяет, насколько возможно получить именно такую оценку X, если бы она была взята из распределения с таким-то или таким-то параметром . У нас это распределение N(, 2/n) (по ЦГТ, как обсуждалось ранее).
Например, очень вероятно значение 2 считается очень вероятным, однако если бы оно было истинным, то мы бы маловероятно получили X (потому что они находится достаточно далеко друг от друга). Чтобы уравновесить эти выводы для всех возможных значений , мы перемножаем по теореме Байеса likelihood и priors. Таким образом, получили апостериорную оценку вероятности, что = 2. Проделываем это с каждым вероятным значением .

оо

Теперь, имея апостериорное распределение параметра , мы выделяем самый маленький интервал, в котором содержится 95% вероятностных значений параметра (HPDI) и называем его доверительным. Вуаля.

Сок байесовского подхода в том, что если мы получаем несколько значений X, мы можем апдейтить наш интервал, подкрепляя его эмпирическими данными. А проблема тут в том, что если истинное значение будет экстремальным, то мы нашим интервалом просто его не покроим, потому что оно маловероятно.


Итак, мы закрыли тему доверительных интервалов для непрерывных величих. Искренне надеюсь, что эти умозаключения безошибочны, однако открыта к любой критике.

Если вас интересуют также интервалы для дискретных значений, рекомендую внимательно прочитать пример с печеньем, описанный в ответе на форуме StackExchange.

Подробнее..

Recovery mode Байесовская модель для принятия очень прикладного решения в американском футболе

16.02.2021 20:15:11 | Автор: admin

В американском футболе атакующей команде дается 4 попытки, чтобы пройти 10 ярдов и тогда команда имеет право продолжить атаковать (владеть мячом). И очень часто, перед розыгрышем 4-ой попытки, тренерам приходится решать - попытаться добрать оставшееся до минимальных 10 ярдов с риском не дойти и отдать сопернику мяч в текущей точке поля, либо сразу пробить ногой по мячу, запнув мяч подальше, обезопасив так себя в защите. Чтобы облегчить принятие этого решения и повысить его эффективность в этой статье мы построим байесовскую модель.

Необходимаяподготовка:базовыезнаниятеоремыБайсаиуверенныезнанияправилитерминологииамериканскогофутбола.

Термины американского футбола из статьи

Правила американского футбола (видео)

  • Попытка - базовый розыгрыш, начинается по команде квотербека, заканчивается через несколько секунд после остановки игрока с мячом.

  • Тачдаун - ситуация, когда атакующая команда донесла мяч до зачетки соперника - противоположного края поля.

  • Пант - пробитие по мячу ногой с целью отвести мяч как можно дальше от своей зачетки.

  • Владение - в американском футболе на поле одновременно владеть мячом может только одна команда. Владением называется время, когда команда владеет мячом и пытается набрать очки.

  • Пик-сикс - результативное действие в защите. Когда удается в защите перехватить мяч и занести тачдаун.

  • Линия скриммиджа - текущее положение мяча перед попыткой.

Задача

Выбратьбитьпантилиигратьна4-ой попыткевситуации"4иjярдов"напозицииполявiярдовотсвоейзачетки.

События

Изпостановкизадачиследует,чтомыдолжнырассматриватьдвавладения(своеготекущегоиследующегозатекущим,котороеполучаетсоперник).Завремяэтихдвухвладенийможетпроизойти4события,полностьюописывающиезначимыеивозможныерасклады(можетпроизойтинесколькособытий):

  • еслииграем4-уюпопытку:

    • A:нашакомандазанесеттачдаунпоитогамдвухвладений

    • B:нашакомандапропуститтачдаунпоитогамдвухвладений(включаяответныйтачдауннанашзанесенный)

  • еслибьемпант:

    • C:нашакомандапропуститтачдаунпоитогамдвухвладений

    • D:нашакомандазанесеттачдаунпоитогамдвухвладений(пик-сикс)

Решение

Общаяидея

Такимобразом,задачасводитсяксравнениючетырехвероятностей:

  • P(A):вероятностизанестипрямойтачдаунпривыборесыграть4-уюпопытку,

  • P(B):вероятностипропуститьтачдаунпривыборесыграть4-уюпопытку,

  • P(C):вероятностипропуститьтачдаунпривыборепанта,

  • P(D):вероятностизанеститачдаунпривыборепанта.

Ивыбор,играть4-уюпопыткуилинетсводитсякрешениюнеравенства:

P(A) - P(B)?P(C) - P(D)

События,которыевлияютнавероятностивлевойчастинеравенства,являются:занесенныйипропущенныетачдауныпоитогамдвухвладений,атакженабранныйпервыйдаунпоитогамрозыгрыша4-ойпопытки.

Этисобытиястатистическизависимы,будемиспользоватьформулуБайеса.Задачаможетбытьописанаивтерминахобычнойтеориивероятности(идажесведетсякней),нодлятого,чтобыпоказатьполнотузависимостейвероятностей,будемиспользоватьтеоремуБайеса.

Событиямивправойчастинеравенстваявляютсяпропущенныйтачдаунизанесенныйтачдаунпоитогамдвухвладений,атакжеколичествоярдов,накотороенашакомандаотодвинетсоперникаприпанте.Последнеесобытие(ярды,накоторыебудетотодвинуталинияскриммиджапослепанта)мыпримемзаконстантуивозьмемсреднеезначениеизстатистики.Такимобразом,этисобытиястатистическинезависимы,поэтомубудемиспользоватьздесьобычныебезусловныевероятности.

Розыгрыш4-ойпопытки

Вероятностьзанеститачдаунприрешениииграть4-уюпопытку,илиP(A),зависитоттого,будетлиуспешной4-аяпопытка.Атакжезависитоттого,какуспешнонашакомандареализуетситуациюпервогодауна,наконкретномучасткеполя,втачдаун.Этивероятностиполностьюописываютвсевозможныеисходы,исамоеудобное,могутбытьвзятыизнакопленной(длясобственнойкоманды)статистики:

  • P(X):статистическаявероятностьпройтиjярдовзаоднупопытку,

  • P(A|X):статистическаявероятностьзанеститачдаунсi-тогоярдаполя(изситуации1-10).

Здесьмыпренебрегаемвозможныминабраннымиярдамина4-ойпопыткеидляпростотыпринимаемiкактекущуюотметкувторогомаркера.

ПереходяктерминамтеоремыБайесамыполагаемP(A|X)апостериорнойвероятностьюприусловиисобытияXP(A)полагаемискомуюаприорнуювероятность.

ТакимобразомбазоваяформулатеоремыБайеса:

P(A|X)=(P(X|A)*P(A))/P(X)

гдеP(X|A)-этовероятностьреализовать4-уюпопыткуприусловии,чтонашакомандазанесеттачдаун,аэто,согласноздравомусмыслу,равноединице.Такимобразом,нашаискомаяаприорнаявероятность:

P(A)=P(A|X)*P(X)

ВитогеP(A)мысчитаемпростымперемножениемвероятностипройтиjярдовнавероятностьзанестисi-тогоярдаизситуации1-10.Обевероятностиберемизстатистики.

Вероятностьпропуститьтачдаунприрешениииграть4-уюпопытку,илиP(B),-этосуммадвухаприорныхвероятностей:

  • P(Y):вероятностипропуститьтачдаунпринеудачномрозыгрыше4-ойпопытки(сместаеёрозыгрыша,изситуации1-10дляатакисоперника).Причемвероятностьнеудачногорозыгрыша4-ойпопыткиравен1-X.

  • P(Z):вероятностипропуститьтачдаунвслучаеудачногорозыгрыша4-ойпопытки,например,присменевладениянаследующихдрайвахидажепосленашеготачдаунавответномвладениисвозвратаначальногоудара.

Этидвевероятностиаприорные,тоестьмыдолжныучестьвероятностьудачногорозыгрыша4-ойпопытки.Тоестьвслучаенеудачногорозыгрыша4-ойпопытки:

P(Y)=P(Y|(1-X))*P(1-X)

ивслучаеудачногорозыгрыша4-ойпопытки:

P(Z)=P(Z|X)*P(X)

Дляупрощения,примемзаP(Z|X)простуюстатистическуювероятностьпропуститьтачдаунпослепробитияначальногоудара.Ещенемногоупрощаямыможемсвестивероятностьпропуститьпосленачальногоудараквероятностипропуститьс30+kярдов,тоестьсместа,кудамывсреднемотдвигаемпантомсместапробитияначальногоудара.

Этивероятностиполностьюописываютвсевозможныеисходы,исамоеудобное,могутбытьвзятыизнакопленной(длясобственнойкоманды)статистики.

Такимобразом,опятьжеиспользуютеоремуБайеса:

P(B)=P(Y|(1-X))*P(1-X)+P(Z|X)*P(X)

Аобщийущерб(мыведьнаходимсяужевуязвимойситуацииприигре4-ойпопыткиисчитаем,вкакомслучаеущерббудетменьшим)отрешенияиграть4-уюпопытку:

P(A|X)*P(X)-P(Y|(1-X))*P(1-X)-P(Z|X)*P(X)

Смыслвыражениясводитсякподсчетуразницывероятныхтачдауновзадвавладения.

Пант

Прирозыгрышепантамыфактическиотказываемсяотсвоейпопытки(издвухрассматриваемыхнами)иподсчетсводитсяквероятномуущербуприигренашейкомандывзащите.

Дляэтогонамнужнознатьоткудасоперникначнетсвоевладенияивероятностьпропуститьтачдаун.Дляупрощениявероятностьзанеститачдаунпривладениисоперника(пик-сикс)будемсчитатьравнонулю.ТакимобразомP(D)=0.

Альтернативноможновзятьэтозначениеизстатистики

Дляупрощениямыбудемсчитать,чтонашакомандаприпантеотодвигаетсоперниканаодноитоже,среднеерасстояние.Итак,изнакопленнойстатистикимыберем:

  • k:среднееколичествоярдов,накотороенашакомандаотодвигаетсоперникапробитиемпантасучетомвозврата,

  • P(С):статистическаявероятностьпропуститьтачдаунсi+kярдаполя(изситуации1-10).

Стоитобратитьвнимание,чтоP(С)беретсядляi+kярда,тоестьдлятекущейпозициинаполеплюссреднееколичествоярдовпослепанта.

Итог

Дляпринятиярешенияотом,стоитлииграть4-уюпопыткуилипробиватьпантнадосравнитьвозможныйущерб(сучетомивозможнойпользы)отпервогорешенияивозможныйущерботвторого.Причем,вседанныемыможемвзятьизнакопленнойстатистики.Ктомужевнимательныйчитательзаметит,чтоP(Y|(1-X)),P(Z|X)иP(C)сутьодноитоже,толькоберутсядляразныхiилипозицийнаполе.

P(A|X)*P(X)-P(Y|(1-X))*P(1-X)-P(Z|X)*P(X)?P(C)

Таким образом, имея статистику розыгрышей собственной команды и указав текущее положение команды на поле перед 4-ой попыткой (количество ярдов до первого дауна и положение линии скриммиджа) можно оценить шансы и выбрать наиболее эффективный исход.

Для демонстрации идеи я написал скрипт в jupiter notebook, где можно поиграться с показателями и положением на поле, плюс графики, показывающие распределение шансов в случае панта или игры 4-ой попытки.

Надеюсь, тема не настолько ультра узкая, чтобы вообще никому не была полезной. Но для себя было интересно поупражняться в практическом, до почвенного уровня, применении Байесовских моделей. Если где-то ошибся - пишите, внесу изменения или дополнения в статью.

Копирайт на обложку

Картинка обложки взята здесь: Design вектор создан(а) freepik - ru.freepik.com

Подробнее..

Категории

Последние комментарии

  • Имя: Макс
    24.08.2022 | 11:28
    Я разраб в IT компании, работаю на арбитражную команду. Мы работаем с приламы и сайтами, при работе замечаются постоянные баны и лаги. Пацаны посоветовали сервис по анализу исходного кода,https://app Подробнее..
  • Имя: 9055410337
    20.08.2022 | 17:41
    поможем пишите в телеграм Подробнее..
  • Имя: sabbat
    17.08.2022 | 20:42
    Охренеть.. это просто шикарная статья, феноменально круто. Большое спасибо за разбор! Надеюсь как-нибудь с тобой связаться для обсуждений чего-либо) Подробнее..
  • Имя: Мария
    09.08.2022 | 14:44
    Добрый день. Если обладаете такой информацией, то подскажите, пожалуйста, где можно найти много-много материала по Yggdrasil и его уязвимостях для написания диплома? Благодарю. Подробнее..
© 2006-2024, personeltest.ru