«Ну чё, опять утрёмся и выразим обеспокоенность, сделаем жест доброй воли»?…

«Ну чё, опять утрёмся и выразим обеспокоенность, сделаем жест доброй воли»?...

Так, дорогие друзья, есть одна тема, нытьё по которой красной нитью тянется через весь телеграм уже который год, и которую мы до сих пор не затрагивали.

Это тема внешних дипломатических коммуникаций нашей с вами Федерации, которые, как правило, неяркие, не дерзкие, зеркальные и «ну чё, опять утрёмся и выразим обеспокоенность, сделаем жест доброй воли»?

Сразу хотели бы предупредить, что размотка будет нудноватой, у нас немного лиричное настроение, поэтому если вместо скучного чтива вам сейчас хочется скорее экспресс-анализа по военке и геополитике – смело закрывайте нас и открывайте какой-нибудь соседний канал, где вам впридачу к стандартной концентрированной кукарекурсии толкнут финку НКВД. Куда надо.

По поводу принципа унылой зеркальности во внешних коммуникациях – давайте зайдём издалека.

На сегодняшний день одним из лучших, пожалуй, способов моделирования и поиска оптимальной стратегии в любой человеческой интеракции – будь то межличностная, межгрупповая или даже межгосударственная – является применение игровой теории. 

Если вы уже закатили глаза, мол, ну, вот, опять Орда со своей игровой теорией, то совершенно напрасно: математические расчёты выбора оптимальных стратегий, которые позволяют в перспективе добиться желаемого результата, очень внимательно изучают и экономисты, и политологи, и даже преподаватели поведенческой эволюции в таких шарагах как Стэнфорд (на минуточку, один из лучших вузов мира по подготовке психологов и психотерапевтов).

Если с теорией игр вы до этого текста не сталкивались, то кратко: любая ваша интеракция – от общения с родственниками до общения с органами власти – может быть рассмотрена как игровой процесс, в котором есть фиксированное (любого количества) число участников, их конкретные интересы и инструменты достижения цели, а также условный приз, который участники будут стремиться получить в ходе взаимодействия.

Говоря проще, когда мама с папой промеж себя решают, кто завтра поведёт ребёнка в детский сад, они участвуют в своеобразном игровом процессе, стремясь прийти к результату, который больше удовлетворит одну из сторон, или в равной степени удовлетворит обе стороны (что тоже само по себе является выгодой). Или хотя бы в равной степени не удовлетворит ни одну из сторон, чтобы никому не было особо обидно.

Когда популярный блогер Вася требует от государства немедленных решений того или иного вопроса в соответствии с его оригинальным видением подходящего рецепта, он также участвует в своеобразной игровой интеракции, при которой предполагаемым призом может быть как итоговое решение проблемы, так и рост числа подписчиков Васи, если ему удалось поднять достаточный по уровню децибел публичный хай. 

В последнем случае обозначенную проблему поведение блогера, вероятно, не решит, но, регулярно привлекая внимание к своей персоне, Васе, возможно, удастся в будущем заработать на квартиру в Москве. Тоже, согласитесь, неплохо.

И это лишь самый базовый уровень, на котором игровая теория рассматривает интеракции между взаимодействующими участниками эволюционного забега. Подобным моделированием, разумеется, занимаются и крупные предприятия, которым необходимо продвинуть свой товар или услугу на рынке, и целые государства, которым необходимо на высшем уровне взаимодействовать с бессчётным количеством партнёров разной степени хитрости. Во всяком случае, на Западе этому процессу отводятся прям солидные бюджеты и много времени.

Так вот.

В теории игр есть много любопытных умозрительных задачек, но одной из главных, одной из самых базовых, пожалуй, является «дилемма заключённого», сформулированная ещё в пятидесятых годах прошлого столетия американскими математиками – Мерилом Фладом и Мелвином Дрешером.

Классическую форму возьмём прям из википедии, простите:

Двое преступников — А и Б — попались примерно в одно и то же время на сходных преступлениях. Есть основания полагать, что они действовали по сговору, и полиция, изолировав их друг от друга, предлагает им одну и ту же сделку: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается за помощь следствию, а второй получает максимальный срок лишения свободы (10 лет). 

Если оба молчат, их деяние проходит по более лёгкой статье, и каждый из них приговаривается к полугоду тюрьмы. Если оба свидетельствуют друг против друга, они получают минимальный срок (по 2 года). Каждый заключённый выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой. Что произойдёт?

Разумеется, что произойдёт, никто не знает, это умозрительная задача, но!

Если мы будем исходить из того, что оба заключённых подходят к вопросу максимально рационально – и знают, что их визави также будет действовать максимально рационально – то лучшей стратегией для каждого из них будет сдать второго человека.

При таком раскладе, если ты сдал напарника, то ты либо выходишь на свободу за сделку со следствием, либо получаешь не максимальный срок, если твой подельник тебя сдал.

Да, если никто никого не сдаст, то оба выйдут из тюрьмы в кратчайший срок, но и риск для каждого залететь на 10 лет тоже весьма неиллюзорен – и в данном случае сильно перевешивает потенциальную выгоду.

Поэтому наиболее математически верным решением подобной задачи является – сдать сообщника.

Ну и чё за пурга, как это всё относится к внешним дипломатическим коммуникациям?

Как финка НКВД к телеграм-каналу военблогера, дорогие друзья, давайте не будем бежать вперёд паровоза, ща всё разложим.

Классическая версия дилеммы заключённого, по сути, рассказывает о любой почти интеракции между людьми, группами людей или целыми структурами вплоть до государства, потому что позволяет размотать их через призму «честного» и «нечестного» (на самом деле оптимального и неоптимального) поведения в одном раунде.

Условно: если государство А идёт навстречу государству Б, но то в ответ кидает государство А через бедро – это вполне стандартная дилемма заключённого, которую вы можете натянуть на любой российский «жест доброй воли» или любую зерновую сделку, которой наша с вами Федерация за последние девять месяцев огорчила уже не одного блогера.

Потому что стандартный блогер живёт именно одним раундом. Случилось событие – он отбомбился, дальше ждёт следующего, чтобы отбомбиться точно так же, сам по себе событийный процесс у него бьётся на довольно короткие отрезки и не предполагает какой-либо долгосрочной стратегии.

Однако.

По прошествии десятилетий классическая дилемма заключённого, разумеется, была много раз пересмотрена и дополнена, потому что наши с вами жизненные интеракции одним раундом не ограничиваются. И пересматривали её (в основном америкацы) именно с целью создания оптимальных долгосрочных стратегий.

То есть.

Если государство А пошло навстречу государству Б, но то в ответ начало козлить и обмануло оппонента – какой в подобном случае должна быть дальнейшая стратегия государства А при бесконечно возможном количестве раундов?

В семидесятых годах прошлого столетия американский экономист Роберт Аксельрод чёрт знает откуда достал какую-то допотопную ЭВМ и загнал в неё пресловутую задачку, чтобы вычислить оптимальную стратегию взаимодействия для двух игроков в бесконечно длинном количестве раундов. 

В процессе программирования он опросил огромное число своих умных (без иронии) друзей-математиков, экономистов, разных нобелевских лауреатов и жидорептилоидов, чтобы те сформулировали собственные сценарии решения. И когда их получил, пустил всё по циклическому алгоритму – при таком раскладе все долгосрочные стратегии посражались друг с другом, чтобы выявить победителя по параметру оптимальности.

И победившая в этом замесе долгосрочная стратегия – которая в длинном забеге перемолола вообще все остальные – сегодня в английском языке известна как tit-for-tat. На русский оно неточным образом переводится как «око за око», но правильнее было бы её назвать «ты мне, я — тебе».

У неё очень простой принцип – принцип зеркальности.

Страна А совершает честный поступок. Страна Б отвечает обманом. В следующем раунде оптимальной стратегией для страны А будет являться обман. Если страна Б продолжает отвечать обманом, то страна А делает то же самое. Если страна Б внезапно отвечает честно, то страна А тоже отвечает честно. И точно так же оно работает, если страны поменять местами.

Эта вот зеркалка, с точки зрения математического расчёта (поначалу там прогнали всего лишь сотни тысяч возможных исходов, но более поздние обкатки на ЭВМ помощнее давали такой же результат), является оптимальной долгосрочной стратегией поведения двух игроков, в каждом раунде выбирающих между условной «правдой» и условным «обманом» по отношению друг к другу.

Именно принцип зеркальности. Мы без понятия, честно, насколько осознанно он был выбран нашим внешнеполитическим ведомством, но именно с точки зрения математического расчёта эта стратегия в долгосрочной перспективе побеждает любую другую (разумеется, при наличии достаточной ресурсной базы и воли для продолжения игры).

В чём её фишка.

Во-первых, она изначально имеет моральное преимущество: вы начинаете с кооперации с другим игроком. Во-вторых, она по умолчанию зеркально отвечает, если оппонент не подыгрывает. В-третьих, она позволяет обоим игрокам вернуться в конструктивное русло после совершённой ошибки. В-четвёртых, она доступна для понимания даже самому популярному блогеру. Другими словами, она задаёт понятную систему координат, в которой просто ориентироваться, если участник желает вернуться к кооперации.

А что же с жестами доброй воли?

Многих это удивит, но и спонтанные жесты доброй воли в эту математическую модель органично вписываются, хоть и не являются её обязательным атрибутом – но тут, пожалуй, чуть туже фиксаторные ремни затяните.

У этой оптимальной долгосрочной стратегии есть одна большая уязвимость. Допустим, одна из сторон неверно истолковала получаемый сигнал – может, в результате ошибки при передаче сигнала, может, в результате ошибки интерпретации, но:

Допустим, участник А сыграл честно, а участник Б истолковал эту честность неверно – и в полном соответствии с оптимальной стратегией ответил аналогичным образом. Вот эта вот потеря одного сигнала переворачивает всю партию вверх тормашками и вводит обоих игроков в заблуждение, при котором каждый считает оппонента коварным ублюдком.

Чтобы избежать схода партии с рельс одна из сторон периодически может делать жест доброй воли, чтобы удостовериться, что противоположная сторона правильно считала предыдущие сигналы. Иными словами, если где-то в прошлом партия пошла не в ту сторону из-за ошибки коммуникации, то оптимальным ответом рационального игрока на жест доброй воли будет ответный шаг навстречу. 

Если же оппонент хроническое невменько, то небольшой жест доброй воли на усмотрение игрока ему не особо много стоит. И взамен он получает подтверждение, что все сигналы до сих пор считывались корректно – или где-то произошла неверная интерпретация.

Еще раз: мы без понятия, является ли метод зеркальности со спорадическими вкраплениями жестов доброй воли осознанной внешнеполитической стратегией, но именно она с математической точки зрения является лучшей в противостоянии 1 на 1. Россия против США или Россия против Запада – это уже каждый пусть масштабирует как сердцу угодно.

Полагаем, в обратку опять набегут с обличениями: «Вам денег занесли, чтобы отмазать власть или вы реально настолько упоротые?!», поэтому сразу отвечаем – Да.

Мы всего лишь описали одну из математических моделей социальных интеракций с нормальным масштабированием, простите, что без НКВДшной финки или тайных советников, которые недавно ушли из ЦБ и теперь их телеграм-канал всем запрещает читать лично Набиуллина.

Если описывать эту модель совсем простым языком, то она, по сути, является принуждением оппонента к игре по правилам путём регулярной дрессировки методом зеркальности. Что в случае нашей с вами Федерации особенно удобно, если учесть наличие ресурсной базы, вооружения и политической воли на участие в бесконечно длинной череде раундов.

Наша страна именно что может позволить вести себе долгую игру с не нулевой суммой – это когда ситуативная победа или поражение не является окончанием партии, как многие блогеры, ко-ко-конечно, сегодня полагают.

И нет, эта игра также не заканчивается подписанием перемирий или любой другой формой «договорняка», на подобных этапах она просто переходит на другой уровень – обычно с целью аккумуляции необходимого ресурса для последующих горячих фаз противостояния.

Просто смиритесь, дорогие друзья, это долгий процесс, в котором мы с вами закончимся задолго до окончания партии. И финок НКВД в разных телеграм-каналах, авторы которых имеют патриотические черепа исключительно правильной формы, вы ещё на жизнь вперёд насмотритесь.

[Орда] – родная, злобная, твоя