27.01.2016 в 17:58
Пишет Ingris:Создание электронной книги с нуля до FB2 (памятка для чайников) 
Сделала себе полноценную шпаргалку
1. Сканирование.
читать дальше1) Настроить параметры для FineReader:
а) разрешение - для мелкого шрифта - 600 дпс, для крупного шрифта - 300 дпс; б) режим сканирования - серый (если текст и чб иллюстрации), цветной (для обложки и стоящих того цветных иллюстраций); в) предобработка изображений - определять ориентацию страницы, делить разворот книги, улучшить качество изображения.
2) Класть листы/книгу на сканер ровно, прижимать плотно, периодически делать сохранения документа и проверять качество сканов (плохо получившиеся проще сразу переделать).
3) Обложку книги отсканировать в цвете. Важные цветные иллюстрации и карты тоже в цвете. Передвинуть в создаваемом документе эти страницы на положенные им места.
2. Распознавание.
читать дальше1) Подключить в FR языки, которые есть в книге (меню Сервис - Редактор языков).
2) Запустить распознавание документа.
3) Подредактировать распознанные области на каждой странице документа: удалить лишние (неверно определенные, плюс если не нужны - колонтитулы, номера страниц, картинки), добавить новые (FR может не заметить иллюстрацию), объединить (название к тексту, несколько одинаковых блоков теста в один), разделить (примечания отделить от основного текста), подровнять (зубчатые границы области текста или картинки), подвинуть (границы областей вплотную к реальным краям текста или картинок), заменить (картинка может быть распознана как текст - и наоборот). После редактирования - распознать страницу заново.
3. Проверка.
читать дальше1) Настроить стили (меню Сервис - Редактор стилей). Свести получившееся в документе разнообразие стилей к разумному минимуму (1-3 уровня градации заголовков, 1-3 вида основного текста, по виду колонтитулов и сносок): выделить одинаковые по уровню (разные по шрифту-размеру-жирности) стили - Объединить - выбрать из выпадающего списка образец для объединения - Ок.
2) Настройка вида для проверки (тут уж как удобнее). Например: Вид - Окно изображение/текст - Показать окна изображение и текст; Вид - Окно крупный план - Внизу; Вид - включить Выделять неуверенно распознанные символы.
3) Проверка текста. Выделенное красным - неправильное или неизвестное программе написание слов (повторяющиеся правильные слова кнопкой добавлять в словарь программы); выделенное голубым - неуверенное распознание символов. Сравнивать имена собственные и цифры с изображением-сканом. Тире и дефисы часто требуют замены на правильный вариант. Последнее слово на странице может быть разорвано переносом - объединять надо вручную. Любой из стилей может оказаться автоматически применен не к тому куску текста - поправляем вручную.
4. Вычитка в doc.
читать дальшеВ принципе, этот этап необязателен: кто-то предпочитает всю мелочевку и картинки поправлять сразу в FR до конвертации, кто-то - потом в fb2. Но мне в MS Офисе нравятся средства редактирования, словари, проверка грамматики-орфографии и заметность для глаз всяческих огрехов в целом.
1) Текст после Проверки сохранить как документ Микрософт Ворд, "все страницы в один файл", в опциях настроить: качество картинок высокое (и галочка "сохранять картинки"), размер бумаги стандартный, оформление - при одном шрифте основного текста "Простой текст", при нескольких - "Форматированный текст" (реже - при важности сохранения внешнего вида источника (шрифтов, деления на страницы и строки и т.п.) -"Редактируемая копия", а то и вовсе "Точная копия" с соответствующими галочками на дополнительных пунктах).
2) Функция "заменить": все мягкие переносы на слитное написание; лишние пробелы (более 1) - на один; стандартизировать кавычки - лапки или елочки (кроме случая кавычек в кавычках); четко развести тире и дефисы (тут требуется просмотр случаев применения).
3) Просмотреть и редактировать текст: выделить форматированием автора и название, заголовки разделов разного уровня, соединить разорванные абзацы, вставить разрыв страницы в конце крупных разделов (глав), убрать лишние жирность и курсив. Для контроля форматирования включить отображение всех знаков. Текст примечаний поместить в квадратные скобки в основном тексте.
4) Сохранить все нужные для книги иллюстрации в отдельные файлы jpg по номерам в порядке следования в тексте. Из текста doc иллюстрации удалить, чтобы не мешали потом при конвертации (но должен под рукой оставаться образец, согласно которому их потом расставлять по своим местам). В принципе, картинки из текста можно и не удалять, а просто потом заменить на обработанные - но лучше таки сравнить с оригиналом, т.к. и при конвертации из скана они могли "съехать".
5. Конвертирование doc в fb2.
читать дальшеПрограммка htmlDocs2fb2 умеет создавать из документов в формате html и doc (MS Word) электронные книги FictionBook, к тому же имеет русский интерфейс и понимает любую винду вплоть до текущей 8-й, поэтому я предпочитаю ее старенькой Any2FB2.
Файл - Открыть - указать свой doc. Затем Файл - Конвертировать - в разделе Титул ввести автора и название (остальное - уже в FBE), кодировку выбрать utf-8 - Ок (сохранить как fb2).
Но хоть файл и превратился в FictionBook и готов для простого использования, библиотечную валидацию он не пройдет, его требуется допиливать в редакторе FB Editor.
6. Подготовка иллюстраций.
читать дальшеДля fb2 подходят рисунки только в форматах JPG и PNG. Размер рисунков обычно от 240х320 до 400х600 пикселей; изредка - если карты или таблицы - применяется 900 на 600. Цветные рисунки должны использовать от 16 до 64 цветов. Красочность и количество пикселей увеличивают размер каждого рисунка - и книги в целом, а учитывая, что девайсы на e-ink понимают только градации серого... Будем скромнее.
Открыть каждый рисунок в редакторе изображений (справится и обычный FastStone Image Viewer), обрезать всё лишнее, уменьшить размер, при необходимости добавить контрастности - и сохранить под порядковым номером (типа 001) в папку иллюстраций для делаемой книги. Обложку сохранить вне списка как "cover".
7. Структурирование в FictionBook Editor.
читать дальшеFictionBook Editor V 2.66 Руководство Тут много и подробно, однако мне требуется покороче и попроще - но чтоб результат на выходе был хорошим. Поэтому пришлось переработать в вариант "для тупых".
1) Заполнить раздел Описание документа (кнопка с буквой D - Description). Обязательно - в подразделе Книга: автор, название, жанр, язык. Обложка добавляется через кнопку "Прикрепить бинарный файл" (в виде скрепки): выбрать файл обложки тут, а потом он появляется в пункте Обложка - Изображение.
2) В разделе Дизайн (кнопка B - Body) ввести аннотацию в элементе "annotation" (с синей полоской).
3) В разделе Дизайн выделить автора и название книги (в блоке с зеленой полоской) - Вставка - Заголовок; в структуре документа слева они должны заменить слово < body >. А если не получается - в разделе Код (кнопка S - sсript) после строки < body > написать следующее:

4) Сделать проверку по F8 - проходит файл валидацию или выдает ошибки? (они чаще всего бывают на иллюстрациях и заголовках, придется переделывать - см. раздел руководства "Валидатор ругается"). Сохранить валидный файл.
5) Вставить подготовленные ранее рисунки - каждый после абзаца текста, кнопкой "Вставить изображение", от вставки пустого рисунка отказаться. После каждой вставки жать F8, т.к. в коде перед рисунком может вставиться лишняя строка-сбой (< subtitle > < strong / > < / subtitle > или < epigraph > ), ее надо удалить. Если на этом этапе были переделки-перевставки картинок, имеет смысл сделать подчистку: Скрипты - Иллюстрации - Проверка иллюстраций. Смотрим, есть ли что неиспользуемое, и если есть, то: Скрипты - Иллюстрации - Удаление неиспользуемых вложений.
6) Проверить, выделены ли названия глав (если вдруг нет, то: Вставка - Заголовок) и подглав (Стиль - Подзаголовок). Хотя после форматирования в ворде они обычно стоят как надо. Чтобы каждая глава начиналась с новой страницы, между нею и предыдущей главой должен быть разрыв текста; в ворде это был Вставить разрыв страницы, тут: Правка - Разрезать, после чего единая зеленая полоса слева разрывается на две.
7) Обработать примечания для распознавания их fb2: Скрипты - Примечания и комментарии из скобок - Примечания из []. В основном тексте остаются порядковые номера сносок, а их тексты переносятся в конец файла согласно номерам.
8) Мелочи: Скрипты - Чистка - Разрыв предложения = если остались разорванные абзацы или предложения без конечного знака препинания, они будут показаны для выбора правильного варианта. Если нужно, можно использовать Скрипт - Подзаголовки, пустые строки - Разметка подзаголовков, чистка пустых строк = будут удалены пустые строки (есть варианты с удалением жирности и курсива в заголовках).
Upd.
9) FBE может не воспринять ряд спецсимволов, их придется заменять на соответствующие HTML entities. Таблицы соответствия - тут и тут.
В итоге - на руках валидный файл FB2!
URL записи
Сделала себе полноценную шпаргалку

1. Сканирование.
читать дальше1) Настроить параметры для FineReader:
а) разрешение - для мелкого шрифта - 600 дпс, для крупного шрифта - 300 дпс; б) режим сканирования - серый (если текст и чб иллюстрации), цветной (для обложки и стоящих того цветных иллюстраций); в) предобработка изображений - определять ориентацию страницы, делить разворот книги, улучшить качество изображения.
2) Класть листы/книгу на сканер ровно, прижимать плотно, периодически делать сохранения документа и проверять качество сканов (плохо получившиеся проще сразу переделать).
3) Обложку книги отсканировать в цвете. Важные цветные иллюстрации и карты тоже в цвете. Передвинуть в создаваемом документе эти страницы на положенные им места.
2. Распознавание.
читать дальше1) Подключить в FR языки, которые есть в книге (меню Сервис - Редактор языков).
2) Запустить распознавание документа.
3) Подредактировать распознанные области на каждой странице документа: удалить лишние (неверно определенные, плюс если не нужны - колонтитулы, номера страниц, картинки), добавить новые (FR может не заметить иллюстрацию), объединить (название к тексту, несколько одинаковых блоков теста в один), разделить (примечания отделить от основного текста), подровнять (зубчатые границы области текста или картинки), подвинуть (границы областей вплотную к реальным краям текста или картинок), заменить (картинка может быть распознана как текст - и наоборот). После редактирования - распознать страницу заново.
3. Проверка.
читать дальше1) Настроить стили (меню Сервис - Редактор стилей). Свести получившееся в документе разнообразие стилей к разумному минимуму (1-3 уровня градации заголовков, 1-3 вида основного текста, по виду колонтитулов и сносок): выделить одинаковые по уровню (разные по шрифту-размеру-жирности) стили - Объединить - выбрать из выпадающего списка образец для объединения - Ок.
2) Настройка вида для проверки (тут уж как удобнее). Например: Вид - Окно изображение/текст - Показать окна изображение и текст; Вид - Окно крупный план - Внизу; Вид - включить Выделять неуверенно распознанные символы.
3) Проверка текста. Выделенное красным - неправильное или неизвестное программе написание слов (повторяющиеся правильные слова кнопкой добавлять в словарь программы); выделенное голубым - неуверенное распознание символов. Сравнивать имена собственные и цифры с изображением-сканом. Тире и дефисы часто требуют замены на правильный вариант. Последнее слово на странице может быть разорвано переносом - объединять надо вручную. Любой из стилей может оказаться автоматически применен не к тому куску текста - поправляем вручную.
4. Вычитка в doc.
читать дальшеВ принципе, этот этап необязателен: кто-то предпочитает всю мелочевку и картинки поправлять сразу в FR до конвертации, кто-то - потом в fb2. Но мне в MS Офисе нравятся средства редактирования, словари, проверка грамматики-орфографии и заметность для глаз всяческих огрехов в целом.
1) Текст после Проверки сохранить как документ Микрософт Ворд, "все страницы в один файл", в опциях настроить: качество картинок высокое (и галочка "сохранять картинки"), размер бумаги стандартный, оформление - при одном шрифте основного текста "Простой текст", при нескольких - "Форматированный текст" (реже - при важности сохранения внешнего вида источника (шрифтов, деления на страницы и строки и т.п.) -"Редактируемая копия", а то и вовсе "Точная копия" с соответствующими галочками на дополнительных пунктах).
2) Функция "заменить": все мягкие переносы на слитное написание; лишние пробелы (более 1) - на один; стандартизировать кавычки - лапки или елочки (кроме случая кавычек в кавычках); четко развести тире и дефисы (тут требуется просмотр случаев применения).
3) Просмотреть и редактировать текст: выделить форматированием автора и название, заголовки разделов разного уровня, соединить разорванные абзацы, вставить разрыв страницы в конце крупных разделов (глав), убрать лишние жирность и курсив. Для контроля форматирования включить отображение всех знаков. Текст примечаний поместить в квадратные скобки в основном тексте.
4) Сохранить все нужные для книги иллюстрации в отдельные файлы jpg по номерам в порядке следования в тексте. Из текста doc иллюстрации удалить, чтобы не мешали потом при конвертации (но должен под рукой оставаться образец, согласно которому их потом расставлять по своим местам). В принципе, картинки из текста можно и не удалять, а просто потом заменить на обработанные - но лучше таки сравнить с оригиналом, т.к. и при конвертации из скана они могли "съехать".
5. Конвертирование doc в fb2.
читать дальшеПрограммка htmlDocs2fb2 умеет создавать из документов в формате html и doc (MS Word) электронные книги FictionBook, к тому же имеет русский интерфейс и понимает любую винду вплоть до текущей 8-й, поэтому я предпочитаю ее старенькой Any2FB2.
Файл - Открыть - указать свой doc. Затем Файл - Конвертировать - в разделе Титул ввести автора и название (остальное - уже в FBE), кодировку выбрать utf-8 - Ок (сохранить как fb2).
Но хоть файл и превратился в FictionBook и готов для простого использования, библиотечную валидацию он не пройдет, его требуется допиливать в редакторе FB Editor.
6. Подготовка иллюстраций.
читать дальшеДля fb2 подходят рисунки только в форматах JPG и PNG. Размер рисунков обычно от 240х320 до 400х600 пикселей; изредка - если карты или таблицы - применяется 900 на 600. Цветные рисунки должны использовать от 16 до 64 цветов. Красочность и количество пикселей увеличивают размер каждого рисунка - и книги в целом, а учитывая, что девайсы на e-ink понимают только градации серого... Будем скромнее.
Открыть каждый рисунок в редакторе изображений (справится и обычный FastStone Image Viewer), обрезать всё лишнее, уменьшить размер, при необходимости добавить контрастности - и сохранить под порядковым номером (типа 001) в папку иллюстраций для делаемой книги. Обложку сохранить вне списка как "cover".
7. Структурирование в FictionBook Editor.
читать дальшеFictionBook Editor V 2.66 Руководство Тут много и подробно, однако мне требуется покороче и попроще - но чтоб результат на выходе был хорошим. Поэтому пришлось переработать в вариант "для тупых".
1) Заполнить раздел Описание документа (кнопка с буквой D - Description). Обязательно - в подразделе Книга: автор, название, жанр, язык. Обложка добавляется через кнопку "Прикрепить бинарный файл" (в виде скрепки): выбрать файл обложки тут, а потом он появляется в пункте Обложка - Изображение.
2) В разделе Дизайн (кнопка B - Body) ввести аннотацию в элементе "annotation" (с синей полоской).
3) В разделе Дизайн выделить автора и название книги (в блоке с зеленой полоской) - Вставка - Заголовок; в структуре документа слева они должны заменить слово < body >. А если не получается - в разделе Код (кнопка S - sсript) после строки < body > написать следующее:

4) Сделать проверку по F8 - проходит файл валидацию или выдает ошибки? (они чаще всего бывают на иллюстрациях и заголовках, придется переделывать - см. раздел руководства "Валидатор ругается"). Сохранить валидный файл.
5) Вставить подготовленные ранее рисунки - каждый после абзаца текста, кнопкой "Вставить изображение", от вставки пустого рисунка отказаться. После каждой вставки жать F8, т.к. в коде перед рисунком может вставиться лишняя строка-сбой (< subtitle > < strong / > < / subtitle > или < epigraph > ), ее надо удалить. Если на этом этапе были переделки-перевставки картинок, имеет смысл сделать подчистку: Скрипты - Иллюстрации - Проверка иллюстраций. Смотрим, есть ли что неиспользуемое, и если есть, то: Скрипты - Иллюстрации - Удаление неиспользуемых вложений.
6) Проверить, выделены ли названия глав (если вдруг нет, то: Вставка - Заголовок) и подглав (Стиль - Подзаголовок). Хотя после форматирования в ворде они обычно стоят как надо. Чтобы каждая глава начиналась с новой страницы, между нею и предыдущей главой должен быть разрыв текста; в ворде это был Вставить разрыв страницы, тут: Правка - Разрезать, после чего единая зеленая полоса слева разрывается на две.
7) Обработать примечания для распознавания их fb2: Скрипты - Примечания и комментарии из скобок - Примечания из []. В основном тексте остаются порядковые номера сносок, а их тексты переносятся в конец файла согласно номерам.
8) Мелочи: Скрипты - Чистка - Разрыв предложения = если остались разорванные абзацы или предложения без конечного знака препинания, они будут показаны для выбора правильного варианта. Если нужно, можно использовать Скрипт - Подзаголовки, пустые строки - Разметка подзаголовков, чистка пустых строк = будут удалены пустые строки (есть варианты с удалением жирности и курсива в заголовках).
Upd.
9) FBE может не воспринять ряд спецсимволов, их придется заменять на соответствующие HTML entities. Таблицы соответствия - тут и тут.
В итоге - на руках валидный файл FB2!

@темы: шпаргалки