Как у меня работает поглощение информации, если я себя не останавливаю. Вот вчера например.
1. Увидел в одном ТГ-канале упоминание о том, что в викторианской Англии использовали inexpressibles (невыразимые) как название брюк вместо собственно trousers или breeches, которые считались слишком грубыми словами; и в том числе у Диккенса так. Захотел уточнить; как я помнил, это забавное использование inexpressibles/unmentionables действительно было вполне реальным, но не обязательным, скорее стилистическим выбором. Надо бы проверить, сколько раз, скажем, Диккенс его использовал, в сравнении с "нормальными" словами.
2. Как это проверить?читать дальше Если иметь в виде файлов все тексты Диккенса у себя на диске, это тривиально. Как проще всего их заиметь? Наверное, они все или почти все есть в Project Gutenberg. Но, естественно, на их сайте нет простого способа скачать все книги одного автора разом. Давай-ка я найду, как скачать текстовые версии всего проекта Гутенберг разом; это много, но не слишком, пожалуй несколько гигабайт. Когда-то я уже это делал, но не помню, как. 15 минут спустя: это не очень тривиально. Официальный способ - через wget с задержкой в 2 секунды между книгами, это очень долго, или rsync, тоже долго. Ищу, кто уже это сделал и нахожу репозиторию "Gutenberg, dammit" на гитхабе, кого-то это так же раздражало, как меня. Там файлы до 2016 года, мне этого достаточно.
3. Скачиваю архив и открываю, сейчас я быстро найду все книги Диккенса и прошерстю их на предмет этих слов. Стоп, файлы названы типа 000/00001.txt, вся мета-информация в огромном JSON-файле. Как оттуда вытащить, какие книги Диккенса? (искать имя автора внутри текста книги не работает, некоторые книги разбиты на несколько частей, мета-информация только в первой части). Ищу способ быстро обработать JSON-файл, нахожу интересную командную утилиту jq, скачиваю, читаю ее документацию, разбираюсь настолько, чтобы быстро отфильтровать книги Диккенса и имена их файлов, выцепляю имена файлов с помощью grep, cut, копирую все эти книги в отдельную директорию с помощью xargs, как всегда не помню, как пользоваться xargs, чтобы добавить фиксированный аргумент в конец для cp; нахожу ответ на stackoverflow. Теперь могу легко найти все, что нужно, с помощью grep и wc. В текстах Диккенса есть 12 упоминаний inexpressibles в этом значении брюк (впрочем, в другом в такой форме множественного числа и не бывает), 260 упоминаний trousers, 110 упоминаний breeches и 50 pantaloons. Примерно так я и подозревал. Можно теперь написать комментарий в тот ТГ-канал. Может и запись в блог напишу, если время найду.
4. Меж тем параллельно я искал научные статьи об этом использовании inexpressibles/ummentionables, надеясь, что в них расскажут что-то интересное о том, кто этим пользовался, а кто нет. Прочитал 2-3 статьи через SciHub, ничего супер интересного не увидел, кроме того, что узнал (может, когда-то знал, но забыл), что pants возникло в Америке в 19-м веке как неформальное сокращение pantaloons. Зато увидел несколько раз, что первое упоминание этого эвфемизма - в 1790-х, у поэта-сатирика по имени John Wolcot, который писал под псевдонимом Peter Pindar. Этимологические словари дают ссылку на его сочинение "Rowland for Oliver" (1794), и приводят текст:
I've heard that breeches, pettycoats, and smock,
Give to thy modest mind a grievous shock;
And that thy brain (so lucky its device)
Christ'neth them *inexpressibles*, so nice!
5. Мне стало интересно, что это за стихи, и захотелось прочитать этот отрывок в контексте, и узнать что-то про автора. Сначала я не находил вообще сочинение "Rowland for Oliver", но потом понял, что кое-где указывали название неверно, точнее "A Rowland for an Oliver", и довольно быстро нашел на Google Books пятитомник этого самого Уолкота издания 1811 года. В нем нашлось это сочинение, которое оказалось чем-то вроде собрания отдельных стихотворений, в основном саркастических од на разные темы, всего страниц 40. Не нашел там этого отрывка про inexpressibles. Удивился, подумал, что пропустил, просмотрел более внимательно, не нашел. Гугл-поиском нашел текстовый вариант этого тома, в нем тоже не нашел. Удивился, стал искать конкретные фразы типа "breeches, pettycoats and smock" в Google Books, понял, что они есть в более раннем издании Уолкота, 1794 года. Это издание на Google Books по неясным причинам не показывается в полном виде. Зная, что часто на archive.org находятся книги из Google Books, которые там не показывают, поискал издания Уолкота (под его псевдонимом Peter Pindar) на archive.org, нашел сто-пятьсот разных томов из разных изданий, и с некоторым трудом отыскал тот, что мне нужен.
6. Там нашелся этот отрывок, действительно внутри "A Rowland for An Oliver", но более конкретно внутри стихотворения "Ода жеманству" (Ode to Affectation). Теперь стал ясен смысл отрывка, это жеманству приписывается (не без оснований) идея использовать inexpressibles, потому что слова типа breeches его шокируют. По причинам, не вполне мне понятным, текст этой оды сильно отличается в изданиях 1794 и 1811 года, и в последнем этот отрывок отсутствует. Сам автор умер в 1819-м, так что это видимо была его редактура.
Почитал еще несколько стихотворений этого Уолкота, и про него в Википедии заодно. Довольно тяжело что-нибудь понять. Нет ничего более преходящего, чем сатирические стихи на злободневные темы (кроме одного божественного исключения). Уолкот был весьма популярен в свое время, судя по всему; его издавали и отдельными брошюрами, и собрания сочинений в трех и пяти томах, во множественных изданиях в конце 18 и начале 19 веков. Но сейчас трудно через это продраться и понять, на что или на кого он намекает. Вряд ли кто-то этим занимался за последние лет сто; хотя, может, кто-то и корпит где-то на факультете английской литературы, все бывает.
7. Взять, например, название этого сборника "A Rowland for an Oliver", что оно значит? Многие из од в этом сборнике - это саркастические ответы на чьи-то чужие оды, ругающие автора. С некоторым трудом разобрался, что есть архаичная идиома "a Roland for an Oliver", которую я раньше не встречал. Она действительно вышла из употребления; чтобы проверить это, иду на сайт Нью-Йорк Таймс, где есть исторический поиск архива, и нахожу, что в 20-м веке она встречалась в текстах газеты всего несколько раз и последний раз в 1963 году. Эта идиома означает примерно "баш на баш", т.е. ответ на что-то, равноценный этому; и в ней аллюзия на средневековую "Песнь о Роланде", где у рыцаря Роланда был близкий друг и соратник Оливер, равный ему в умении и храбрости (может, пора наконец прочитать "Песнь о Роланде"? Праздная мысль мелькает). Но у Уолкота именно Rowland, и это не описка и не альтернативное написание имени Roland. Тут что-то таится. Он хотел намекнуть на идиому "a Roland for an Oliver", и заодно на какое-то или какого-то Rowland. И, видимо, читателям того времени это было понятно; может, какой-то критик или политик или еще что. Провожу минут 10 за просмотром в Википедии списка известных людей с именем или фамилией Rowland (почти все в 20-м веке), или места, не нахожу ничего очевидно подходящего. Ладно, оставим это; название остается неразрешенной загадкой.
8. Думаю, что можно бы написать запись обо всем этом, и возвращаюсь к вкладке на archive.org с текстом издания Уолкота 1794 года, чтобы сделать скриншот этого отрывка. Не могу избавиться от впечатления, что как-то странно выглядит этот текст, не похож на то, где я его видел в другом месте, но не могу понять, что. Механически пытаюсь найти его в издании 1811 в другой вкладке (у меня всего к этому моменту открыто 25-30 вкладок на все эти темы), забывая, что его там собственно нет. Но все равно взгляд на тексты 1811 года помогает понять, в чем дело: в тексте 1794 года есть длинная s, а в издании 1811 ее нет. Длинная s это вариант написания буквы s, очень похожий на f, только без черточки посредине, или с черточкой, уходящей влево, а не в обе стороны. В 17 и 18 веках в английских текстах так почти всегда писали s в середине слова, а на конце писали как сейчас. Я знаю, что в 19 веке это вышло из моды, но не знаю точно, когда. Мне приходит в голову идея поискать другие издания Уолкота на archive.org, и вскоре я нахожу, к своему изумлению, издание 1797 года, на первый взгляд полностью идентичное изданию-1794, что я до сих пор смотрел, но без длинных s. Даже типография та же, Джона Уокера!
Читаю статью в Википедии про long s, и узнаю, что от нее отказались буквально в течение одного десятилетия, 1790-х, под влиянием нескольких авторитетных издателей и типографий. И вот эти два издания Уолкота, разделенные тремя годами, 1794 и 1797, очень наглядно это демонстрируют. Размышляю о том, насколько странно и непривычно было это для автора.
9. Думаю о том, что из всего этого оформить в виде записи в блоге, или больше, чем одной, и как; оставляю вкладки как есть на пол-дня. Сажусь писать запись и не знаю, с чего начать; в итоге появляется идея оформить это в мета-стиле с пересказом всего этого процесса поглощения информации. Вот так. Это все заняло часа полтора вчера, и еще час сегодня написать эту запись. Может, не стоило так сразу мчаться в поисках текстов Диккенса от одного упоминания inexpressibles? Может, и не стоило. Но если сознательно себя не ограничивать и не приструнивать (что не всегда выходит), так у меня примерно во всем.
P.S. Если вы имеете отношение к математике, точным наукам, инженерии, и работаете с интегралами или встречаете их в повседневной жизни - знайте, что каждый раз, когда видите знак интеграла, это единственный дошедший до нас пережиток длинной s. Лейбниц ввел в употребление этот знак, взяв его из первой буквы слова "сумма" на латыни - summa - которое тогда писали с длинной s. Ему нравился вариант (а может, он тогда стандартным был, не знаю), в котором буква спускается ниже строки и заканчивается такой же симметричной загогулиной, что и сверху. Вот вам и знак интеграла. avva.livejournal.com/3541654.html
Как у меня работает поглощение информации, если я себя не останавливаю. Вот вчера например.
1. Увидел в одном ТГ-канале упоминание о том, что в викторианской Англии использовали inexpressibles (невыразимые) как название брюк вместо собственно trousers или breeches, которые считались слишком грубыми словами; и в том числе у Диккенса так. Захотел уточнить; как я помнил, это забавное использование inexpressibles/unmentionables действительно было вполне реальным, но не обязательным, скорее стилистическим выбором. Надо бы проверить, сколько раз, скажем, Диккенс его использовал, в сравнении с "нормальными" словами.
2. Как это проверить?читать дальше avva.livejournal.com/3541654.html
1. Увидел в одном ТГ-канале упоминание о том, что в викторианской Англии использовали inexpressibles (невыразимые) как название брюк вместо собственно trousers или breeches, которые считались слишком грубыми словами; и в том числе у Диккенса так. Захотел уточнить; как я помнил, это забавное использование inexpressibles/unmentionables действительно было вполне реальным, но не обязательным, скорее стилистическим выбором. Надо бы проверить, сколько раз, скажем, Диккенс его использовал, в сравнении с "нормальными" словами.
2. Как это проверить?читать дальше avva.livejournal.com/3541654.html