Продолжение моего исследования на коленках. Начало тут.
Кому лень читать прошлый пост, может просто просмотреть картинки. Главный его тезис сводился к такому: давайте быстренько создадим сервис, при помощи которого любой желающий смог бы вносить информацию об исторически значимых людях, их взаимоотношениях, о местах, где эти люди обитали и событиях, в которых участвовали, об источниках всех этих сведений. Но так, чтобы информация вносилась не в виде текста, а в виде структурированных связей. И чтобы у этой системы был приятный интерфейс.
Поскольку за прошедшие пару месяцев отчего-то такой сервис никем создан не был (хотя и не могу сказать, что в этом направлении нет вообще никаких подвижек см., например, ybogdanov.github.io/history-timeline/ ), я, от нечего делать, продолжил исследовать википедию - на этот раз английскую - на предмет вытаскивания из нее этих самых структурированных связей, хоть как-то, но описанных в ее многочисленных текстовых шаблонах.
читать дальше
Английская википедия хороша своим масштабом - свыше 5 миллионов статей. В то же время заполнение шаблонов, как мне показалось, осуществляется более неряшливо, чем в русской вики, а сами шаблоны намного менее унифицированы (возможно это из-за большего количества их видов).
К примеру, графа “дети” в разных шаблонах может определяться следующими ключевыми полями: ‘issue', 'offspring', 'children', 'daughter', 'son', а также производными этих слов (даже в виде ‘childrens’) и некоторыми иными экстравагантными вариантами.
Повторю вкратце метод, что я использую. В английской википедии в шаблонах описания персоны иногда бывают указаны другие персоны, связанные с первой следующими отношениями: 1) супруг/супруга, 2) родитель, 3) ребенок, 4) родственник, 5) учитель, 6) ученик, 7) предшественник (по властным полномочиям), 8) преемник, 9) человек, оказавший влияние на данного 10) человек, на которого было оказано влияние данным лицом. В том случае, если про этих персон имеется своя статья (а тогда они отмечены соответствующей вики-ссылкой), можно заглянуть в нее и вытащить указанные связи и здесь. Ну и, понятно, что так можно двигаться вглубь, выхватывая все встречающиеся цепочки связей, пока они, наконец не иссякнут.
Я решил на этот раз не ограничиваться родственными связями и вытащил все те, что были описаны выше.
То что последует далее - не более чем мои сумбурные попытки поиграть с этой информацией, посмотреть, что в ней может быть интересного с точки зрения наивного дилетантского интереса. И, конечно, следует помнить, что ни о какой стопроцентной достоверности никаких заключений речи быть не может - все выполнено в рамках информации содержащейся в дампе английской википедии от 4 февраля 2016. Если там, например, нет сведений о детях Пушкина, представленных в специальном шаблоне описания персоны, то, увы, и мне про них ничего не известно. Я не буду повторять этот дисклеймер всякий раз перед каким-либо громким заявлением: и так все ясно.
Прошлая попытка началась с того, что я вручную пытался провести цепочку знакомств между Сократом и Пушкиным. Получилось более 130 человек. Посмотрим теперь, что об этом думает английская вики.
Какая минимальная возможная связь существует в ней между Сократом и Пушкиным, учитывая все заданные там типы связей?
Связь вышла такой:
С первого взгляда кажется, что это ошибка, по крайней мере это явно не связь знакомств. Никто из этих людей друг друга никогда не видел, хотя бы потому, что годы жизни ни у кого из них не пересекаются. На самом же деле ничего странного нет, просто связь протянулась через оказываемое последовательное влияние одних людей на других.
Лукиан (в русской вики - Лукиан Самосатский) (120-180 н.э.) был, скорее, идейным противником Сократа, но ведь нельзя же сказать, что тот совсем на него не повлиял? Оставим эту связь на совести того, кто ее прописал в английской википедии. Далее, этого Лукиана все в унисон называют “Вольтером классической древности” (например, Энгельс и Герцен), да и сам Вольтер пишет про Лукиана в своих произведениях: так что тут тоже - зачет. Последнее звено - самое, на мой взгляд, надежное. Пушкин и рисовал Вольтера, и переводил, и, говорят, зачитывался им еще до поступления в Лицей.
Состоялись бы Лукиан без Сократа, Вольтер без Лукиана, а Пушкин без Вольтера в том виде, что мы их знаем? Этот вопрос будет мною раскрыт в серии следующих двенадцати постов.
Уберем теперь призрачную связь через идейное влияния и попробуем снова протянуть ее через знакомства. Если наивно предположить, что все предшественники и преемники по властным полномочиям видели друг друга (а это, конечно, далеко не всегда так), а также, что все родители видели своих детей (это кажется уже менее наивным), то можно на основе англовики выстроить и новую цепочку знакомств между Сократом и Пушкиным, и она будет состоять всего из 90 человек.
Небольшое допиливание пришлось делать по краям, т.к. ни у Сократа, ни у Пушкина не было властных полномочий и детей/родителей, прописанных в шаблонах. Видно, что цепочка сократилась на 50 человек за счет лишь ее оптимального автоматизированного построения, по сравнению с той, что я выстраивал вручную. И это, конечно, далеко не теоретический предел ее краткости.
Ведь сейчас получается, что в среднем, каждому новому человеку-звену удается протянуть связь на дополнительные 30 лет: так что еще есть куда расти. Вот, например, Ахматова протянула связь-знакомство от Гумилева до Бродского на 40 лет. И это, видимо, далеко не предел. Но, правда, расти теперь можно лишь в сторону расширения наших знаний: добавлению связей, формализации других вариантов взаимоотношений между людьми. Кратчайший же путь на основе текущих данных не укоротить.
Теперь перейдем к следующим пунктам.
А что если вытащить из вики кластеры, где люди связаны между собой лишь супружескими узами? Ну, мало ли, кто-то бывает сперва в браке с одним человеком, потом с другим, а тот в свою очередь с третьим, который когда-то встречался с четвертым и т.д. Мне, вот, интересно, насколько бывают длинными подобные цепочки.
Оказывается бывают они очень длинны и запутаны. Особенно в сериалах. Персонажи мыльных опер описываются в вики наравне с обычными людьми. (Да, я еще объединял этой связью и людей, имеющих общих детей, даже если они в браке не состояли).
Лидером по числу участников стала цепочка брачных связей из сериала “The Bold and the Beautiful” - ровно 100 человек. Можете посмотреть картинку тут: https://goo.gl/1qcoit . Построил я картинки и для сериалов “Days of Our Lives” (64 персонажа) https://goo.gl/IbzZi7 , “General Hospital”, который выступил в командном зачете с сериалом “All My Children” (51 человек) https://goo.gl/9gZkSc . Если посмотреть на эти графики, то можно с удивлением обнаружить, что в брачных связях бывают замкнутые цепочки (петли, циклы), порой, весьма продолжительные. Минимальная подобная петля состоит из четырех человек - вот например подобная из сериала “The Bold and the Beautiful”.
Две девушки были поочередно замужем за двумя парнями. (Ну и не только за ними, конечно. Это же всего лишь фрагмент).
Обычно же брачные петли в сериалах намного длиннее. Подумав, я отнес их наличие к буйной фантазии сценаристов, которые, при относительном постоянстве основных персонажей, должны на протяжении десятков лет придумывать все новые сюжетные ходы. Подумав еще немного, я понял, что, при некоторых допущениях, петля может состоять и из трех человек. Но таких сюжетных ходов я пока не обнаружил.
Жизнь от сериалов не слишком отстает. Хотя шесть из первых десяти самых крупных брачных кластеров - родом из телеящика, второе место (81 человек) - занимает брачный союз актеров, режиссеров а также певцов и примкнувшим к ним писателей (уже вполне реальных).
Вот этот кластер https://goo.gl/fdmKSQ :
Несколько лет назад мой друг написал пост samon.livejournal.com/20626.html, в котором он пытался разобраться во взаимоотношениях Вуди Аллена, Мии Ферроу, Фрэнка Синатры и нескольких других известных личностей. Пост выдержан в том духе, что, дескать, куда ни ткни - всюду выйдет сплошная Санта-Барбара. Он и не предполагал, что случайным образом ткнул в самую большую зафиксированную в вики брачную сеть реально существующих людей. При этом вытащил на поверхность лишь самую незначительную ее часть. Сразу после этой находки, я поспешил сообщить ему, что в реальности все не так и плохо, что ему просто не повезло, и что если он будет пробовать тыкать в другие места, то вряд ли сможет найти сходный по запутанности сюжет.
С другой стороны эта цепочка вовсе и не Санта-Барбара даже. Ведь теперь-то мы можем довольно точно оценить уровень переплетений судеб, и решить, когда у нас Санта-Барбара, а когда - нет. И становится ясно, что Санта-Барбарой здесь совсем не пахнет. Посмотрите как мелко она выглядит https://goo.gl/TCu3L4 :
Всего каких-то 10 человек на картинке. Делит жалкое 90-е место с еще 22 кластерами подобной величины. Кластер же, где “Вуди Аллен и все-все-все” - это что-то среднее между “The Bold and the Beautiful” и “Days of Our Lives”. Или восемь целых и одна десятая по шкале Санта-Барбары, если хочется мерить именно Санта-Барбарами.
Сейчас-то я понимаю, что тот незначительный фрагмент, который откопал Миша, как раз с Санта-Барбарой и сравним. И, в общем-то, он прав был в том своем заключении. Но этим соображением я пока с ним не поделился.
Вернемся снова к этом кластеру https://goo.gl/fdmKSQ .
Удивительным в нем является разрыв по дате рождения между самыми разнесенными его представителями. Самый пожилой участник - это президент Columbia Pictures Harry Cohn, родившийся в 1891. Умер он в 1958, за 12 лет до рождения самой молодой в этой брачной цепочке Soon-Yi Previn. Последняя жена Вуди Аллена родилась в 1970 через 79 лет после рождения Гарри Кона.
Замечу, правда, что для такого семимильного шага вовсе не нужно иметь сотню человек. Например у Элизабет Тейлор, которая также присутствует в этом кластере, разница в возрасте между крайними мужьями - 43 года (Майкл Тодд - 1909 г.р. и Ларри Фортенски - 1952 г.р.)
Я специально изобразил этот кластер так, чтобы самый старший представитель оказался крайним слева, а самая молодая - почти что в самом правом краю, чтобы долго их не искать. Хотя эти схемы и выглядят, как иерархии, никакой иерархии по времени в них нет. Не следует воспринимать этот кластер, как идущий из прошлого и набирающий обороты в будущем. Скорее, это много разрозненных ветвей, пик соединения которых произошел где-то в 1950-х. В среднем же, это люди, родившиеся в период с 1915 по 1935, причем, около 70% к настоящему времени уже умерло.
Сравнивая брачные кластеры сериалов и брачные кластеры, возникающие среди реальных людей (последние обычно состоят из представителей богемы: политиков, миллионеров, актеров, гонщиков - ну т.е. тех, кто попадает в википедию), мне к какому-то моменту перестала казаться такой уж буйной фантазия сценаристов (которые, кстати, тоже нередки в этих супружеских цепочках).
Единственное мое предположение о существенном различии, которое сходу возникло, было таким: в реальной жизни в брачных кластерах не встречается циклов. И я был в этом практически убежден, пока не дошел до 8 по размеру кластера, который описывает нетривиальные взаимоотношения правящей элиты Гавайских островов (43 человека). https://goo.gl/NDeVGV
Оказывается обычай время от времени дарить и передаривать своих супруг своим родственникам и друзьям - нормальное дело для этого королевства. Короли и королевы могли иметь множество жен / мужей, и с этими ресурсом проблем у них, видимо, не было.
Мне пришлось откинуть свою первую гипотезу об отсутствии циклов в брачных кластерах у обычных людей и предложить вторую: сценаристы голливудских мыльных опер много времени проводят на Гавайях. Ее я пока не сумел ни доказать, ни опровергнуть.
Чтобы закончить разговор о брачных кластерах, приведу еще один пример из греческой мифологии. https://goo.gl/ICGXJm
Здесь множественные супружеские связи объясняются в том числе и большой вариативностью мифов, которые вики пытается честно фиксировать.
Следующая, такая же весьма актуальная тема, которую мне пришло в голову исследовать - это вопрос наследования власти. Допустим существует монархическая династия, ну т.е. та, где власть передается последовательно от родителя к ребенку. Сколько поколений, в среднем, удается так продержаться? Каковы шансы на то, что династия на каком-то этапе прервется?
Для этих целей я взял всех людей, объединенных связью “предшественник”-”преемник” и оставил только тех из них, которые были объединены еще и связью “родитель”-”ребенок” (добавив сюда случаи, когда должность к ребенку попадает не сразу, а через супругу / супруга предшествующего правителя). И разобрал получившиеся связные фрагменты по их длине. Следует отметить, что сама должность могла видоизменяться при наследовании. Например крупный правитель множества земель мог делить их между несколькими детьми, которые наследовали лишь часть и т.д.
Дольше всех удавалось продержаться французским королям. Две из трех самых крупных цепочек за ними. Правда первую из них нельзя назвать целиком французской. Начала она во Франции с Валуа, а закончилась уже своей боковой веткой, перешедшей в династию Габсбургов https://goo.gl/RO7Fl2 . Русская вики про последнего представителя династии Карла II (короля Испании) пишет так: последний представитель дома Габсбургов на испанском престоле, из-за дурной наследственности отличался чрезвычайной болезненностью. Смерть Карла положила конец правящей династии в стране и привела к Войне за испанское наследство, по результатам которой на престол взошли французские Бурбоны.
Неплохой результат показали и Капетинги https://goo.gl/CpX9m4 . Про последнего представителя написано следующее: “Иоанн I Посмертный родился через несколько месяцев после смерти отца, 15 ноября 1316 года, и сразу был провозглашён королём, однако король-младенец умер уже через пять дней сразу после крещения”. И далее: “Наследование трона вызвало династический кризис, поскольку на протяжении трёх с лишним столетий подобных сложностей с престолонаследием не возникало — со времён Гуго Капета среди Капетингов власть всегда без затруднений переходила от отца к старшему сыну”.
Сходная по продолжительности Османская империя, где родственное наследование протянулось через 16 поколений, выглядит скучнее https://goo.gl/TuFalS Закончилась она Ахмедом I, который умер от тифа. “Смерть Ахмеда I привела к дилемме, которая никогда не возникала ранее в Османской империи: несколько шехзаде, живших в Топкапы, получили право на трон”.
Я с трудом оторвал себя от чтения статей вики про последних членов правящих родов и построил график зависимости количества существовавших династий от их длины.
Первый столбец на графике указывает количество династий, закончившихся на правнуках: т.е. тех, которые протянулись на три поколенческих интервала. Видно, что число зафиксированных династий, с ростом протяженности длины их существования, измеренной в поколениях, убывает где-то по экспоненте.
Можно примерно оценить и вероятность сохранения наследования на каждом этапе. Если уже существует династия “родоначальник - сын - внук”, то вероятность того, что она перейдет и к правнуку - примерно 45%. К праправнуку от правнука - 54%, далее вероятность будет постепенно расти до 65%, где и зафиксируется, а после 9 поколения начнет падать. Но к этим данным нельзя уже относиться серьезно - слишком мало остается династий, перешедших рубеж 9 поколений - всего 17 штук.
Я бы сказал так. Если уже существует династия, которая продержалась пару сотен лет, то вероятность того, что очередной ее отпрыск станет последним в ней - процентов сорок. Довольно неплохой результат. Больше шансов прервать династию совсем на раннем этапе. И вот этот факт нам надо постоянно помнить, мне кажется.
Более того, контекстный анализ статей показывает, что если мочить династию на позднем этапе, обязательно всплывут многочисленные шехзаде, мечтающие взобраться на трон.
Задался я, конечно, и вопросом, а какие самые длинные нединастические цепочки передачи власти были в прошлом? Может это линия солдатских императоров Рима или что-нибудь еще. Но, на удивление, оказалось, что к этому вопросу не так просто подступиться. Связь предшественник-преемник даже за вычетом всех династий, задает гигантский кластер на 40 тысяч человек и множество более мелких. Беглый анализ мелких показывает, что, в основном, это всякие последовательности глав религиозных конфессий. Надо как-то разбивать гигантский кластер. Уверен, что те полтора человека, которые до этого места дочитают, посоветуют мне в комментариях, как это лучше сделать.
Последнее, что я сегодня рассмотрю - это еще один огромный кластер на 6000 человек, объединяющий научных руководителей и их учеников.
Вот так выглядит его маленький фрагмент:
Кластер заметно растянулся по горизонтали - на самом деле он в 45 раз шире приведенного фрагмента, но тут я привел самую высокую его часть.
Вот эта верхушка в сильно усеченном виде: https://goo.gl/TNnX18
Самым верхними учителями оказались итальянский врач и гуманист Nicolo Leoniceno / Николо Леоничено (1428-1524) и итальянский математик Niccolò Fontana Tartaglia / Никколо Тарталья (1499-1557) (один из предполагаемых авторов алгоритма решения кубических уравнений). В англовики он указан научным руководителем Ostilio Ricci, студентом которого был Галилео Галилей.
Тарталья, кстати, в детстве пострадал, когда одна загибающаяся ветвь Валуа пыталась оттяпать кусок Италии.
Но, по-моему, я уже перебрал норму: оставшиеся 143 графика, которые в этот пост не поместились, буду пытаться распихивать по комментам.
Кому лень читать прошлый пост, может просто просмотреть картинки. Главный его тезис сводился к такому: давайте быстренько создадим сервис, при помощи которого любой желающий смог бы вносить информацию об исторически значимых людях, их взаимоотношениях, о местах, где эти люди обитали и событиях, в которых участвовали, об источниках всех этих сведений. Но так, чтобы информация вносилась не в виде текста, а в виде структурированных связей. И чтобы у этой системы был приятный интерфейс.
Поскольку за прошедшие пару месяцев отчего-то такой сервис никем создан не был (хотя и не могу сказать, что в этом направлении нет вообще никаких подвижек см., например, ybogdanov.github.io/history-timeline/ ), я, от нечего делать, продолжил исследовать википедию - на этот раз английскую - на предмет вытаскивания из нее этих самых структурированных связей, хоть как-то, но описанных в ее многочисленных текстовых шаблонах.
читать дальше
Английская википедия хороша своим масштабом - свыше 5 миллионов статей. В то же время заполнение шаблонов, как мне показалось, осуществляется более неряшливо, чем в русской вики, а сами шаблоны намного менее унифицированы (возможно это из-за большего количества их видов).
К примеру, графа “дети” в разных шаблонах может определяться следующими ключевыми полями: ‘issue', 'offspring', 'children', 'daughter', 'son', а также производными этих слов (даже в виде ‘childrens’) и некоторыми иными экстравагантными вариантами.
Повторю вкратце метод, что я использую. В английской википедии в шаблонах описания персоны иногда бывают указаны другие персоны, связанные с первой следующими отношениями: 1) супруг/супруга, 2) родитель, 3) ребенок, 4) родственник, 5) учитель, 6) ученик, 7) предшественник (по властным полномочиям), 8) преемник, 9) человек, оказавший влияние на данного 10) человек, на которого было оказано влияние данным лицом. В том случае, если про этих персон имеется своя статья (а тогда они отмечены соответствующей вики-ссылкой), можно заглянуть в нее и вытащить указанные связи и здесь. Ну и, понятно, что так можно двигаться вглубь, выхватывая все встречающиеся цепочки связей, пока они, наконец не иссякнут.
Я решил на этот раз не ограничиваться родственными связями и вытащил все те, что были описаны выше.
То что последует далее - не более чем мои сумбурные попытки поиграть с этой информацией, посмотреть, что в ней может быть интересного с точки зрения наивного дилетантского интереса. И, конечно, следует помнить, что ни о какой стопроцентной достоверности никаких заключений речи быть не может - все выполнено в рамках информации содержащейся в дампе английской википедии от 4 февраля 2016. Если там, например, нет сведений о детях Пушкина, представленных в специальном шаблоне описания персоны, то, увы, и мне про них ничего не известно. Я не буду повторять этот дисклеймер всякий раз перед каким-либо громким заявлением: и так все ясно.
Прошлая попытка началась с того, что я вручную пытался провести цепочку знакомств между Сократом и Пушкиным. Получилось более 130 человек. Посмотрим теперь, что об этом думает английская вики.
Какая минимальная возможная связь существует в ней между Сократом и Пушкиным, учитывая все заданные там типы связей?
Связь вышла такой:
Socrates → Lucian → Voltaire → Alexander Pushkin
С первого взгляда кажется, что это ошибка, по крайней мере это явно не связь знакомств. Никто из этих людей друг друга никогда не видел, хотя бы потому, что годы жизни ни у кого из них не пересекаются. На самом же деле ничего странного нет, просто связь протянулась через оказываемое последовательное влияние одних людей на других.
Лукиан (в русской вики - Лукиан Самосатский) (120-180 н.э.) был, скорее, идейным противником Сократа, но ведь нельзя же сказать, что тот совсем на него не повлиял? Оставим эту связь на совести того, кто ее прописал в английской википедии. Далее, этого Лукиана все в унисон называют “Вольтером классической древности” (например, Энгельс и Герцен), да и сам Вольтер пишет про Лукиана в своих произведениях: так что тут тоже - зачет. Последнее звено - самое, на мой взгляд, надежное. Пушкин и рисовал Вольтера, и переводил, и, говорят, зачитывался им еще до поступления в Лицей.
Состоялись бы Лукиан без Сократа, Вольтер без Лукиана, а Пушкин без Вольтера в том виде, что мы их знаем? Этот вопрос будет мною раскрыт в серии следующих двенадцати постов.
Уберем теперь призрачную связь через идейное влияния и попробуем снова протянуть ее через знакомства. Если наивно предположить, что все предшественники и преемники по властным полномочиям видели друг друга (а это, конечно, далеко не всегда так), а также, что все родители видели своих детей (это кажется уже менее наивным), то можно на основе англовики выстроить и новую цепочку знакомств между Сократом и Пушкиным, и она будет состоять всего из 90 человек.
Socrates → Plato → Aristotle → 'Alexander the Great', 'Alexander IV of Macedon', 'Seleucus I Nicator', 'Stratonice of Syria', 'Antiochus II Theos', 'Seleucus II Callinicus', 'Antiochus III the Great', 'Cleopatra I Syra', 'Ptolemy VIII Physcon', 'Ptolemy IX Lathyros', 'Cleopatra V of Egypt', 'Cleopatra', 'Mark Antony', 'Antonia Minor', 'Claudius', 'Nero', 'Otho', 'Vitellius', 'Vespasian', 'Domitian', 'Nerva', 'Trajan', 'Hadrian', 'Antoninus Pius', 'Marcus Aurelius', 'Commodus', 'Pertinax', 'Didius Julianus', 'Septimius Severus', 'Caracalla', 'Macrinus', 'Elagabalus', 'Severus Alexander', 'Maximinus Thrax', 'Balbinus', 'Gordian III', 'Philip the Arab', 'Decius', 'Volusianus', 'Aemilianus', 'Gallienus', 'Claudius Gothicus', 'Quintillus', 'Aurelian', 'Marcus Claudius Tacitus', 'Florianus', 'Marcus Aurelius Probus', 'Carus', 'Carinus', 'Maximian', 'Fausta', 'Constantius II', 'Gratian', 'Theodosius I', 'Arcadius', 'Pulcheria', 'Marcian', 'Leo I the Thracian', 'Julius Nepos', 'Charlemagne', 'Louis the Pious', 'Charles the Bald', 'Charles the Fat', 'Berengar I of Italy', 'Otto I, Holy Roman Emperor', 'Vladimir the Great', 'Maria Dobroniega of Kiev', 'Bolesław II the Generous', 'Przemysł II', 'Elizabeth Richeza of Poland', 'Elizabeth of Carinthia, Queen of Germany', 'Albert II, Duke of Austria', 'Leopold III, Duke of Austria', 'Ernest, Duke of Austria', 'Catherine of Austria (1420–1493)', 'Christoph I, Margrave of Baden-Baden', 'Charles Frederick, Grand Duke of Baden', 'Charles Louis, Hereditary Prince of Baden', 'Elizabeth Alexeievna (Louise of Baden)', 'Alexander I of Russia', ‘Alexander Pushkin’
Небольшое допиливание пришлось делать по краям, т.к. ни у Сократа, ни у Пушкина не было властных полномочий и детей/родителей, прописанных в шаблонах. Видно, что цепочка сократилась на 50 человек за счет лишь ее оптимального автоматизированного построения, по сравнению с той, что я выстраивал вручную. И это, конечно, далеко не теоретический предел ее краткости.
Ведь сейчас получается, что в среднем, каждому новому человеку-звену удается протянуть связь на дополнительные 30 лет: так что еще есть куда расти. Вот, например, Ахматова протянула связь-знакомство от Гумилева до Бродского на 40 лет. И это, видимо, далеко не предел. Но, правда, расти теперь можно лишь в сторону расширения наших знаний: добавлению связей, формализации других вариантов взаимоотношений между людьми. Кратчайший же путь на основе текущих данных не укоротить.
Теперь перейдем к следующим пунктам.
А что если вытащить из вики кластеры, где люди связаны между собой лишь супружескими узами? Ну, мало ли, кто-то бывает сперва в браке с одним человеком, потом с другим, а тот в свою очередь с третьим, который когда-то встречался с четвертым и т.д. Мне, вот, интересно, насколько бывают длинными подобные цепочки.
Оказывается бывают они очень длинны и запутаны. Особенно в сериалах. Персонажи мыльных опер описываются в вики наравне с обычными людьми. (Да, я еще объединял этой связью и людей, имеющих общих детей, даже если они в браке не состояли).
Лидером по числу участников стала цепочка брачных связей из сериала “The Bold and the Beautiful” - ровно 100 человек. Можете посмотреть картинку тут: https://goo.gl/1qcoit . Построил я картинки и для сериалов “Days of Our Lives” (64 персонажа) https://goo.gl/IbzZi7 , “General Hospital”, который выступил в командном зачете с сериалом “All My Children” (51 человек) https://goo.gl/9gZkSc . Если посмотреть на эти графики, то можно с удивлением обнаружить, что в брачных связях бывают замкнутые цепочки (петли, циклы), порой, весьма продолжительные. Минимальная подобная петля состоит из четырех человек - вот например подобная из сериала “The Bold and the Beautiful”.
Две девушки были поочередно замужем за двумя парнями. (Ну и не только за ними, конечно. Это же всего лишь фрагмент).
Обычно же брачные петли в сериалах намного длиннее. Подумав, я отнес их наличие к буйной фантазии сценаристов, которые, при относительном постоянстве основных персонажей, должны на протяжении десятков лет придумывать все новые сюжетные ходы. Подумав еще немного, я понял, что, при некоторых допущениях, петля может состоять и из трех человек. Но таких сюжетных ходов я пока не обнаружил.
Жизнь от сериалов не слишком отстает. Хотя шесть из первых десяти самых крупных брачных кластеров - родом из телеящика, второе место (81 человек) - занимает брачный союз актеров, режиссеров а также певцов и примкнувшим к ним писателей (уже вполне реальных).
Вот этот кластер https://goo.gl/fdmKSQ :
Несколько лет назад мой друг написал пост samon.livejournal.com/20626.html, в котором он пытался разобраться во взаимоотношениях Вуди Аллена, Мии Ферроу, Фрэнка Синатры и нескольких других известных личностей. Пост выдержан в том духе, что, дескать, куда ни ткни - всюду выйдет сплошная Санта-Барбара. Он и не предполагал, что случайным образом ткнул в самую большую зафиксированную в вики брачную сеть реально существующих людей. При этом вытащил на поверхность лишь самую незначительную ее часть. Сразу после этой находки, я поспешил сообщить ему, что в реальности все не так и плохо, что ему просто не повезло, и что если он будет пробовать тыкать в другие места, то вряд ли сможет найти сходный по запутанности сюжет.
С другой стороны эта цепочка вовсе и не Санта-Барбара даже. Ведь теперь-то мы можем довольно точно оценить уровень переплетений судеб, и решить, когда у нас Санта-Барбара, а когда - нет. И становится ясно, что Санта-Барбарой здесь совсем не пахнет. Посмотрите как мелко она выглядит https://goo.gl/TCu3L4 :
Всего каких-то 10 человек на картинке. Делит жалкое 90-е место с еще 22 кластерами подобной величины. Кластер же, где “Вуди Аллен и все-все-все” - это что-то среднее между “The Bold and the Beautiful” и “Days of Our Lives”. Или восемь целых и одна десятая по шкале Санта-Барбары, если хочется мерить именно Санта-Барбарами.
Сейчас-то я понимаю, что тот незначительный фрагмент, который откопал Миша, как раз с Санта-Барбарой и сравним. И, в общем-то, он прав был в том своем заключении. Но этим соображением я пока с ним не поделился.
Вернемся снова к этом кластеру https://goo.gl/fdmKSQ .
Удивительным в нем является разрыв по дате рождения между самыми разнесенными его представителями. Самый пожилой участник - это президент Columbia Pictures Harry Cohn, родившийся в 1891. Умер он в 1958, за 12 лет до рождения самой молодой в этой брачной цепочке Soon-Yi Previn. Последняя жена Вуди Аллена родилась в 1970 через 79 лет после рождения Гарри Кона.
Замечу, правда, что для такого семимильного шага вовсе не нужно иметь сотню человек. Например у Элизабет Тейлор, которая также присутствует в этом кластере, разница в возрасте между крайними мужьями - 43 года (Майкл Тодд - 1909 г.р. и Ларри Фортенски - 1952 г.р.)
Я специально изобразил этот кластер так, чтобы самый старший представитель оказался крайним слева, а самая молодая - почти что в самом правом краю, чтобы долго их не искать. Хотя эти схемы и выглядят, как иерархии, никакой иерархии по времени в них нет. Не следует воспринимать этот кластер, как идущий из прошлого и набирающий обороты в будущем. Скорее, это много разрозненных ветвей, пик соединения которых произошел где-то в 1950-х. В среднем же, это люди, родившиеся в период с 1915 по 1935, причем, около 70% к настоящему времени уже умерло.
Сравнивая брачные кластеры сериалов и брачные кластеры, возникающие среди реальных людей (последние обычно состоят из представителей богемы: политиков, миллионеров, актеров, гонщиков - ну т.е. тех, кто попадает в википедию), мне к какому-то моменту перестала казаться такой уж буйной фантазия сценаристов (которые, кстати, тоже нередки в этих супружеских цепочках).
Единственное мое предположение о существенном различии, которое сходу возникло, было таким: в реальной жизни в брачных кластерах не встречается циклов. И я был в этом практически убежден, пока не дошел до 8 по размеру кластера, который описывает нетривиальные взаимоотношения правящей элиты Гавайских островов (43 человека). https://goo.gl/NDeVGV
Оказывается обычай время от времени дарить и передаривать своих супруг своим родственникам и друзьям - нормальное дело для этого королевства. Короли и королевы могли иметь множество жен / мужей, и с этими ресурсом проблем у них, видимо, не было.
Мне пришлось откинуть свою первую гипотезу об отсутствии циклов в брачных кластерах у обычных людей и предложить вторую: сценаристы голливудских мыльных опер много времени проводят на Гавайях. Ее я пока не сумел ни доказать, ни опровергнуть.
Чтобы закончить разговор о брачных кластерах, приведу еще один пример из греческой мифологии. https://goo.gl/ICGXJm
Здесь множественные супружеские связи объясняются в том числе и большой вариативностью мифов, которые вики пытается честно фиксировать.
Следующая, такая же весьма актуальная тема, которую мне пришло в голову исследовать - это вопрос наследования власти. Допустим существует монархическая династия, ну т.е. та, где власть передается последовательно от родителя к ребенку. Сколько поколений, в среднем, удается так продержаться? Каковы шансы на то, что династия на каком-то этапе прервется?
Для этих целей я взял всех людей, объединенных связью “предшественник”-”преемник” и оставил только тех из них, которые были объединены еще и связью “родитель”-”ребенок” (добавив сюда случаи, когда должность к ребенку попадает не сразу, а через супругу / супруга предшествующего правителя). И разобрал получившиеся связные фрагменты по их длине. Следует отметить, что сама должность могла видоизменяться при наследовании. Например крупный правитель множества земель мог делить их между несколькими детьми, которые наследовали лишь часть и т.д.
Дольше всех удавалось продержаться французским королям. Две из трех самых крупных цепочек за ними. Правда первую из них нельзя назвать целиком французской. Начала она во Франции с Валуа, а закончилась уже своей боковой веткой, перешедшей в династию Габсбургов https://goo.gl/RO7Fl2 . Русская вики про последнего представителя династии Карла II (короля Испании) пишет так: последний представитель дома Габсбургов на испанском престоле, из-за дурной наследственности отличался чрезвычайной болезненностью. Смерть Карла положила конец правящей династии в стране и привела к Войне за испанское наследство, по результатам которой на престол взошли французские Бурбоны.
Неплохой результат показали и Капетинги https://goo.gl/CpX9m4 . Про последнего представителя написано следующее: “Иоанн I Посмертный родился через несколько месяцев после смерти отца, 15 ноября 1316 года, и сразу был провозглашён королём, однако король-младенец умер уже через пять дней сразу после крещения”. И далее: “Наследование трона вызвало династический кризис, поскольку на протяжении трёх с лишним столетий подобных сложностей с престолонаследием не возникало — со времён Гуго Капета среди Капетингов власть всегда без затруднений переходила от отца к старшему сыну”.
Сходная по продолжительности Османская империя, где родственное наследование протянулось через 16 поколений, выглядит скучнее https://goo.gl/TuFalS Закончилась она Ахмедом I, который умер от тифа. “Смерть Ахмеда I привела к дилемме, которая никогда не возникала ранее в Османской империи: несколько шехзаде, живших в Топкапы, получили право на трон”.
Я с трудом оторвал себя от чтения статей вики про последних членов правящих родов и построил график зависимости количества существовавших династий от их длины.
Первый столбец на графике указывает количество династий, закончившихся на правнуках: т.е. тех, которые протянулись на три поколенческих интервала. Видно, что число зафиксированных династий, с ростом протяженности длины их существования, измеренной в поколениях, убывает где-то по экспоненте.
Можно примерно оценить и вероятность сохранения наследования на каждом этапе. Если уже существует династия “родоначальник - сын - внук”, то вероятность того, что она перейдет и к правнуку - примерно 45%. К праправнуку от правнука - 54%, далее вероятность будет постепенно расти до 65%, где и зафиксируется, а после 9 поколения начнет падать. Но к этим данным нельзя уже относиться серьезно - слишком мало остается династий, перешедших рубеж 9 поколений - всего 17 штук.
Я бы сказал так. Если уже существует династия, которая продержалась пару сотен лет, то вероятность того, что очередной ее отпрыск станет последним в ней - процентов сорок. Довольно неплохой результат. Больше шансов прервать династию совсем на раннем этапе. И вот этот факт нам надо постоянно помнить, мне кажется.
Более того, контекстный анализ статей показывает, что если мочить династию на позднем этапе, обязательно всплывут многочисленные шехзаде, мечтающие взобраться на трон.
Задался я, конечно, и вопросом, а какие самые длинные нединастические цепочки передачи власти были в прошлом? Может это линия солдатских императоров Рима или что-нибудь еще. Но, на удивление, оказалось, что к этому вопросу не так просто подступиться. Связь предшественник-преемник даже за вычетом всех династий, задает гигантский кластер на 40 тысяч человек и множество более мелких. Беглый анализ мелких показывает, что, в основном, это всякие последовательности глав религиозных конфессий. Надо как-то разбивать гигантский кластер. Уверен, что те полтора человека, которые до этого места дочитают, посоветуют мне в комментариях, как это лучше сделать.
Последнее, что я сегодня рассмотрю - это еще один огромный кластер на 6000 человек, объединяющий научных руководителей и их учеников.
Вот так выглядит его маленький фрагмент:
Кластер заметно растянулся по горизонтали - на самом деле он в 45 раз шире приведенного фрагмента, но тут я привел самую высокую его часть.
Вот эта верхушка в сильно усеченном виде: https://goo.gl/TNnX18
Самым верхними учителями оказались итальянский врач и гуманист Nicolo Leoniceno / Николо Леоничено (1428-1524) и итальянский математик Niccolò Fontana Tartaglia / Никколо Тарталья (1499-1557) (один из предполагаемых авторов алгоритма решения кубических уравнений). В англовики он указан научным руководителем Ostilio Ricci, студентом которого был Галилео Галилей.
Тарталья, кстати, в детстве пострадал, когда одна загибающаяся ветвь Валуа пыталась оттяпать кусок Италии.
Но, по-моему, я уже перебрал норму: оставшиеся 143 графика, которые в этот пост не поместились, буду пытаться распихивать по комментам.