ПЛО. Контбеты: применение схемы переменных соотношений

  1. Гад

    Гад

    Сообщения: 850
    Симпатии: 144
    После достижения определённой точки в своём покерном развитии— вы научились оценивать руки и приобрели технические навыки необходимые для игры — следующим большим шагом вперёд становится понимание того, каким образом вы можете влиять на поведение своих оппонентов так, чтобы вам было легче играть против них. Т.е. следующий шаг основывается главным образом на психологии.

    Изучите подкрепление по схеме переменных соотношений.

    Подкрепление по схеме переменных соотношений обычно определяется как предоставление подкрепления после того, как желательное действие было выполнено случайное количество раз. Возьмём, например, игровой автомат. Игрок бросает в автомат однодолларовый жетон. Как вы и ожидаете, в большинстве случаев игрок поставит $1 и проиграет, что, конечно же, очень хорошо для казино. Но если игрок будет постоянно проигрывать свой $1, он в конце концов бросит играть или потеряет все деньги и никогда не станет играть снова. Поэтому иногда автомат будет вознаграждать игрока, выплачивая ему то $1, то $5.

    Кроме того, в очень редких случаях игрок будет получать очень большой выигрыш в форме джекпота.

    Сумма всех выигрышей будет меньше суммы проигрышей. Так казино зарабатывает деньги на длинной дистанции. Но обещания большого приза вместе с менее крупными, но более частыми выигрышами, обычно достаточно для того, чтобы казино удалось подкрепить желательное поведение игроков – постоянные ставки размером в $1.

    Это приводит нас к обсуждению различных схем подкрепления.

    Схемы подкрепления:
    Переменные vs. Фиксированные
    Есть две основные схемы подкрепления: схема переменных соотношений и схема фиксированных соотношений.

    Давайте начнём с последней схемы, которая является основной. При схеме фиксированных соотношений подкрепление предоставляется через фиксированные интервалы. Предположим, например, что вы менеджер казино и хотите, чтобы игровой автомат выдавал игроку выигрыш в 20 процентах случаев или каждый пятый спин. Таким образом, игрок будет проигрывать $1 четыре раза подряд, а при пятом спине каждый раз получать выигрыш.

    Эту схему подкрепления можно обозначить следующим образом:
    Игровой автомат: схема фиксированных соотношений
    Проигрыш Проигрыш Проигрыш Проигрыш Выигрыш
    Проигрыш Проигрыш Проигрыш Проигрыш Выигрыш
    Проигрыш Проигрыш Проигрыш Проигрыш Выигрыш
    Проигрыш Проигрыш Проигрыш Проигрыш Выигрыш
    Проигрыш Проигрыш Проигрыш Проигрыш Выигрыш

    Если мы внесём в наше обозначение схемы размер проигрышей и выигрышей, то она примет следующий вид:
    Игровой автомат: схема фиксированных соотношений с размером выигрышей
    -$1 -$1 -$1 -$1 +$2
    -$1 -$1 -$1 -$1 +$10
    -$1 -$1 -$1 -$1 +$1
    -$1 -$1 -$1 -$1 +$4
    -$1 -$1 -$1 -$1 +$1

    При таком сценарии игрок каждые 25 спинов будет выигрывать $18 (за пять выигрышных спинов) и проигрывать $20, в общей сложности теряя $2. Для казино такая схема представляет возвращение игроку 92 процентов его средств и прибыль в виде оставшихся 8 процентов.

    Всё это выглядит великолепно, но у этой схемы существует большая проблема: Никто никогда не будет играть в игру, у которой такая схема выигрышей (подкрепления)!

    Хорошо, может быть “никто” и “никогда” являются небольшими преувеличениями, но смысл остаётся верным, так как у игрока не займёт много времени понимание того, что этот автомат выдаёт выигрыш только после каждого пятого спина. В результате, он перестанет играть.

    Использование схемы переменных соотношений решит эту проблему.

    Схема переменных соотношений (СПС)
    Схема переменных соотношений использует заранее установленный процент подкрепляемых действий, но предоставляет подкрепление случайным образом. Вернёмся к примеру с игровым автоматом. Снова предположим, что вы менеджер казино и хотите, чтобы автомат выдавал выигрыш в 20 процентах случаев или в среднем каждый пятый спин.

    Теперь ваша схема подкрепления будет выглядеть следующим образом:
    Игровой автомат: схема переменных соотношений
    Проигрыш Проигрыш Проигрыш Проигрыш Выигрыш
    Проигрыш Выигрыш Проигрыш Проигрыш Проигрыш
    Проигрыш Проигрыш Выигрыш Проигрыш Проигрыш
    Выигрыш Проигрыш Проигрыш Проигрыш Проигрыш
    Проигрыш Проигрыш Проигрыш Выигрыш Проигрыш

    С учётом размера выигрышей и проигрышей эта схема примет следующий вид:
    Игровой автомат: схема переменных соотношений с размером выигрышей
    -$1 -$1 -$1 -$1 +$2
    -$1 +$10 -$1 -$1 -$1
    -$1 -$1 +$1 -$1 -$1
    +$4 -$1 -$1 -$1 -$1
    -$1 -$1 -$1 +$1 -$1

    Математическое ожидание остаётся тем же: за 25 спинов игрок так же будет терять $2, давая казино 8-процентную прибыль. Но этот сценарий с намного большей вероятностью позволит достичь желаемого результата – добиться того, чтобы клиент продолжал играть. В отличие от схемы с фиксированными соотношениями схема переменных соотношений предполагает наличие серий выигрышей (например, два выигрышных спина подряд) и отсутствие спинов, при которых игрок уверен в своём проигрыше.

    Это происходит по причине того, что схема переменных соотношений не определяет точный момент выигрышей, а только их среднюю частоту.

    Подкрепление по схеме переменных соотношений актуально при контбетах в ПЛО

    Вы хотите воспрепятствовать чек-рейзам оппонентов, когда вы взяли инициативу в розыгрыше до флопа, и побудить их делать ставки на флопе с сильными руками и чеки - со слабыми. Для этого вы должны подкреплять модели поведения «без чек-рейза» и «ставка с сильной рукой, чек со слабой», время от времени делая чек в позиции (частота зависит от оппонента).

    Схему с подкреплением в 20 процентах случаев можно обозначить следующим образом:

    Контбеты: Схемы переменных соотношений (только иллюстрация)

    Ставка Ставка Ставка Ставка Чек
    Ставка Чек Ставка Ставка Ставка
    Ставка Ставка Чек Ставка Ставка
    Чек Ставка Ставка Ставка Ставка
    Ставка Ставка Ставка Чек Ставка

    Обратите внимание на то, что эта схема представлена исключительно с целью иллюстрации. Я не утверждаю, что 20 процентов – это магическое число.

    Каким точно образом вам нужно применять эту схему в игре? Ответ в картах.

    СПС на практике: Встроенная в карты рандомизация
    Нужно сделать важное замечание: рандомизация вашей игры не означает, что вы предпринимаете те или иные действия случайным образом. Это не означает, что вы смотрите на свои часы и принимаете игровое решение, основываясь на позиции секундной стрелки.

    Ключ к рандомизации вашей игры заключается в том, что вы просто не играете каждый раз одним и тем же образом на одном и том же флопе, при этом по меньшей мере создавая видимость того, что вы почти при любом флопе можете получить сильную руку.

    Эта видимость связана с выбором стартовых рук, который мы обсудим немного позже. Но существует встроенный механизм для рандомизации своей игры. Он заключается в том, что флопы сами по себе являются случайными. Другими словами, каждый раз выпадает новый флоп, так как именно это должно происходить, когда вы берёте из колоды три случайные карты. При этом для каждого флопа у нас есть особое решение, зависящие от того, какие карты у вас на руках.

    Возьмём, например, флоп 9 7 3. Ситуация стандартна; вы открываете розыгрыш рейзом с баттона и только большой блайнд коллирует. SPR [отношение стека к банку] больше 8. На флопе ваш оппонент делает чек. У вас одна из рук, с которой вы могли бы открыть розыгрыш на баттоне.

    Как вы сыграете?

    Я бы сыграл следующим образом:

    Некоторые из решений довольно очевидны, тогда как другие зависят от оппонента. Например, я почти наверняка буду ставить с сильными руками: J 10 9 8 даёт мне старшую пару с 13-карточным натсовым врапом и флеш-дро; 10 10 9 9 - старший сет; а A A J 2 – оверпару и натсовое флеш-дро. С этими руками я не сброшусь на чек-рейз.

    Скорее всего я сделаю чек с рукой K Q J 10, которая даёт мне натсовый гатшот без флеш-дро,оверкарты, а также возможность получить врап на тёрне благодаря 9 (опорной карте). У этой руки большая потенциальная ценность, которую я потеряю, если столкнусь с чек-рейзом, на который мне придётся сбрасываться. Я также вероятно сделаю чек с K Q J 2, которая даст мне ненатсовое флеш-дро, так как у этой руки есть некоторая ценность, которую я потеряю, если столкнусь с чек-рейзом.

    Розыгрыш двух других рук— A K Q 9, которая даст мне старшую пару с оверкартами, и 7 6 5 4, которая даст мне среднюю пару со слабым врапом — в большой степени зависит от оппонента. Я бы сделал ставку с этими руками против более слабых, более предсказуемых оппонентов, но мог бы предпочесть чек против более искусного оппонента для того, чтобы проконтролировать размера банка.

    Вы можете видеть, как переменные соотношения изменяются в зависимости от оппонентов, так как я бы сделал ставку пять раз из семи против слабого оппонента, но только 3 раза против сильного оппонента. Также вы можете видеть, как наша игра на каждом флопе естественным образом рандомизируется картами, которые находятся у нас на руках.


    Ссылка на оригинал http://www.cardplayer.com/cardplaye...5/articles/19122-variable-ratio-reinforcement
    http://www.cardplayer.com/cardplaye...betting-applying-variable-ratio-reinforcement
     
    Последнее редактирование модератором: 19 окт 2016
Загрузка...
Похожие темы - ПЛО Контбеты применение Форум Дата
Без лоха и жизнь плоха Интересные факты и истории 28 сен 2016
В Рио-де-Жанейро китайская пловчиха попалась на допинге Новости спорта 12 авг 2016
Полет на плоту "Кон-Тики" Поговорим за жизнь 15 июл 2016
Слияние Получите вплоть до $10,000 Full Tilt 4 июн 2016
RiverStars и ПЛО8 Дневники, марафоны, пари 28 фев 2016