07.11.2017 в 22:53
Пишет  kxena:

Как скачать архив дневника закрытого или с закрытыми записям с HTTrack Website Copier
Как и обещала, я сделала инструкцию для закрытых дневников. Она получилась очень большой, потому я оставлю только ссылку на PDF. Я скачала по ней дневник виртуала и свой собственный. Виртуал был полностью закрыт. Мой частично. Оба скачались с закрытками. Фильтры обновлены, теперь можно настроить скачивание только по дневнику, кнопки обновления, подъема постов и прочих операций - исключены. Фильры должны работать и для открытого дневника. Лучше пользоваться ими. Фильтры приведены с комментариями. Комментарии в программу копировать не надо



Пояснения к инструкции и ответы на вопросы из предыдущего поста

1. Официальное руководство описывает скачивание закрытых логином страниц с помощью Fire Fox и Internet Explorer. Я пробовала так же настраивать Chrome –не пошло. Потому я пользовалась Fire Fox.
2. Перед скачиванием с мобильной версии убедитесь, что она отображает подзамочные записи, если вы залогинены.
3. Лайвхак, который помог мне - скачивание не с главной страницы, а со списка тем (тегов). У меня это kxena.diary.ru/?tags. Это поможет разбить все ваши сообщения по темам, в каждой будет не over9000 постов, а гораздо меньше, что позволит скачать быстрее.
4. Минус скачивания со страницы тегов – некоторые посты будут скачиваться по нескольку раз. Чтобы этого не произошло можно качать со страницы календаря (там точно повторов постов не будет), у меня kxena.diary.ru/?calendar. Тут можно указать меньшую глубину скачивания.
5. Глубину скачивания я считала так:
- для страницы тегов/и главной тоже: 1(страница приветствия) + количество раз, которые нужно кликнуть по "..." в пейджинге (цифры) внизу станицы у самого популярного тега, + +1(вход в пост) + 1(MORE) + 1(MORE в комментариях)
- для страницы календаря: 1(страница приветствия) + 1(страница года) + 1(cтраница месяца) + 1(страница дня) + 1(пост) + 1(MORE) + 1(MORE в комментарии) = 7.
6. Сообщество может скачать тот, у кого есть от него пароль.
7. Качаться будет долго, в зависимости от глубины сканирования и количества информации. По новым фильтрам мой дневник забирался больше 7 часов, но я перестраховалась и задала большую глубину скачивания, тому же качала и календарь, и теги.
8. Если закачку понадобится прервать и затем продолжить - это возможно. Просто вы останавливаете скачивание. Потом, когда нужно, открываете сохранённый проект скачивания .whtt и продолжаете с теми же параметрами.
9. Я не пробовала, но думаю, что с помощью сохраненного проекта скачивания .whtt можно будет обновлять архив дневника. Указывать только режим обновления закачки.
10. Когда дайри тормозят (504 Gateway Time-out) – большой риск при скачивании вместо некоторых страниц получить белые заглушки, в стиле «На ресурс идет DDoS атака попробуйте позже».
11. Я перезакачала дневник с начала.
12. После скачивания при входе внутрь поста, или открытия моря появляется окошко «Ошибка #51». Она ни на что не влияет, самое досадное в ней, что она не закрывается.
13. Можно попробовать обновить уже скачанный дневник с новыми фильтрами, но я не проверяла, будет ли программа обновлять недостающее или начнет переписывать все заново.
14. Кто уже установил программу, идите к п. 5 этой инструкции.

URL записи