Оригинал взят у в Recorded Future
А смотрели ли вы, многоуважаемые френды, замечательный кинофильм "Три дня "Кондора" с замечательным Робертом Редфордом в главной роли?
Для не смотревших читать дальше
С точки зрения дальнейшего содержания этого поста представляют интерес первые пять минут фильма: от титров до выхода героя Редфорда за пончиками через задний ход.
Сегодня я с коллегами побывал за такой безымянной дверью, правда, не в центре Нью-Йорка, а в центре Кембриджа. Контора, находящаяся за безымянной дверью на шестом этаже невзрачного здания на Гарвардской площади, действительно сотрудничает как минимум с одной трехбуквенной организацией (и с одной шестибуквенной, которую я не побоюсь назвать, - с Гуглом), но, в отличие от прототипа из "Трех дней", имеет и собственное имя: Recorded Future ("Записанное будущее"
.
В остальном функции Recorded Future поразительно напоминают функции ее прототипа. Конечно, сотрудники RF не анализируют прессу вручную: на то есть многоумные компьютеры. Да и анализируемая пресса уже далеко не та: источниками информации служат несколько сот веб-сайтов газет, журналов и органов власти всех уровней, блоги, Твиттер и много что еще - в США и за рубежом, на английском, а также французском, немецком, русском, китайском, арабском, фарси и других языках. Вся эта информация закачивается на сервера RF практически в реальном времени и обрабатывается.
Обработка заключается в идентификации событий. С точки зрения RF, событием является нечто, происшедшее или предстоящее в определенном месте в определенное время (возможно, с определенными людьми). Программы, написанные программистами RF, работают с текстами на исходных языках. Они извлекают из них имена и даты. Даты, естественно, сначала извлекаются в системе летосчисления оригинала (иранские - по иранскому календарю, китайские - по китайскому и т.п.) Зачастую даты даны относительно текущего контекста: например, "в пятницу" обычно значит "в ближайшую пятницу", но если в тексте сначала упоминается событие, которое произойдет "в четверг 28 марта", то слово "пятница" в том же тексте, скорее всего, относится к 29 марта.
читать дальше
Для не смотревших читать дальше
С точки зрения дальнейшего содержания этого поста представляют интерес первые пять минут фильма: от титров до выхода героя Редфорда за пончиками через задний ход.
Сегодня я с коллегами побывал за такой безымянной дверью, правда, не в центре Нью-Йорка, а в центре Кембриджа. Контора, находящаяся за безымянной дверью на шестом этаже невзрачного здания на Гарвардской площади, действительно сотрудничает как минимум с одной трехбуквенной организацией (и с одной шестибуквенной, которую я не побоюсь назвать, - с Гуглом), но, в отличие от прототипа из "Трех дней", имеет и собственное имя: Recorded Future ("Записанное будущее"

В остальном функции Recorded Future поразительно напоминают функции ее прототипа. Конечно, сотрудники RF не анализируют прессу вручную: на то есть многоумные компьютеры. Да и анализируемая пресса уже далеко не та: источниками информации служат несколько сот веб-сайтов газет, журналов и органов власти всех уровней, блоги, Твиттер и много что еще - в США и за рубежом, на английском, а также французском, немецком, русском, китайском, арабском, фарси и других языках. Вся эта информация закачивается на сервера RF практически в реальном времени и обрабатывается.
Обработка заключается в идентификации событий. С точки зрения RF, событием является нечто, происшедшее или предстоящее в определенном месте в определенное время (возможно, с определенными людьми). Программы, написанные программистами RF, работают с текстами на исходных языках. Они извлекают из них имена и даты. Даты, естественно, сначала извлекаются в системе летосчисления оригинала (иранские - по иранскому календарю, китайские - по китайскому и т.п.) Зачастую даты даны относительно текущего контекста: например, "в пятницу" обычно значит "в ближайшую пятницу", но если в тексте сначала упоминается событие, которое произойдет "в четверг 28 марта", то слово "пятница" в том же тексте, скорее всего, относится к 29 марта.
читать дальше