Свежие обсуждения
Публикации

Нашёл книгу

1 2 8

ЗаRARено вот это:
Шмаков С. Б. - Энциклопедия радиолюбителя. Современная элементная база - (Радиолюбитель) - 2012.djvu; 383 стр.
Объем файла 81 043 КБ (79,1 МБ).
Это не видеоролик и никаких реклам там нет - самая обычная книга в DjVu.
Я помучился с торрентом, поэтому не обратил внимания на слишком большой размер файла. А сейчас удивился и сам: Стал разбираться. Дело оказалось в том, что эта книга сканирована с разрешением 600 dpi вместо обычно принятого 300 dpi.
Для эксперимента я изменил разрешение с 600 на 300 dpi и файл уменьшился до 4 637 кБ (ок.5 МБ). При этом, правда, я все перевел в Черно-Белое, потеряв цвет. Потерь же в качестве шрифта ни я, ни Fine Reader не заметили .
Так что, качайте смело - никакой гадости там нет.

 

sprite

С помощью каких программ можно так шаманить? Желательно ссылочку на инструкцию.

 

кд503: С помощью каких программ можно так шаманить? Желательно ссылочку на инструкцию.
Делал так.
Открыл файл (DjVu) в FineReader-11 (8-я версия djvu не берет). Он рассыпался на отдельные странички. Сохранил как изображение в отдельную папку. С помощью PhotoShop'а в режиме пакетной обработки изменил разрешение и цветовую модель (на BitMap), отправив результат в другую папку. Оттуда - снова в FineReader-11, попутно распознав текст (он делает OCR гоораздо лучше, чем встроенный в DjvuEditor). Результат сохранил в формат DjVu (FR-11 это позволяет).
Вот и все .
Если есть трудности с ФотоШопом, то можно воспользоваться Fotosizer (1,78 МБ) - программа для пакетной обработки изображений. Она русифицирована, бесплатная, простая в работе. Прямая ссылка на скачивание: http://ftp2.softtorrent.ru/Soft/FotoSizer%201.36.0.524.rar
На FR-11 сохранившиеся у меня ссылки уже битые, поэтому можете взять его.
отсюда (379 МБ)

 

Cпасибо. Не знал, что теперь FineReader поддерживает djvu. Пытал вчера 8-ой версией.

 

Для сборки файла djvu из картинок я использую программу DjVu Small v0.3.3.
Удобно и быстро создает файлы. Несколько режимов работы для получения различного качества выходного файла.
sprite, спасибо за инструкцию и за FineReader

 

Согласен, DjVu-редакторы (не просмотровщики - Viewer, Reader, Browser) нормально собирают картинки в один файл. При этом есть установки параметров вручную. Это хорошо, если не требуется текстовый слой, который удобен для поиска по документу или копирования части текста. Но распознание текста встроенным OCR в редакторах DjVu очень плохое. Fine Reader делает это неизмеримо лучше. Распознавание происходит автоматически при загрузке файлов. В FR есть функция выравнивания страниц, выдается информация о некачественно распознанных страницах и причине этого (потом можно исправить эти страницы).

Кстати, есть еще одна программа, позвооляющая "рассыпать" многостраничный файл (djvu, pdf, doc и из любых программ, где есть функция "Печатать") на отдельные картинки-странички - это виртуальный принтер "Universal Document Converter". В этой программе много чего интересного, довольно подробное описание есть на http://sonic002.ucoz.ru/news/skachat_i_besplatno_universal_document_converter_50... (ссылки на скачивание не проверял - скорее всего, уже битые), а, похоже последняя версия, здесь (UDC-v5_3.rar; 32,2 МБ).

 

DWD не раз объяснял тут, как он делает djvu-публикации. Разжёвывал вплоть до алгоритма. Жаль, ссылку не могу найти.

 

Искал в электронном виде вот это, не нашёл, купил в бумаге. Стоит сканить, кому-нибудь нужно?

 

Спец: DWD не раз объяснял тут, как он делает djvu-публикации.

Могу ещё раз объяснить...

sprite: Объем файла 79,1 МБ.
...самая обычная книга в DjVu.
Дело оказалось в том, что эта книга сканирована с разрешением 600 dpi вместо обычно принятого 300 dpi.
Для эксперимента я изменил разрешение с 600 на 300 dpi и файл уменьшился до 4 637 кБ (ок.5 МБ). При этом, правда, я все перевел в Черно-Белое, потеряв цвет.

Дело не в разрешении, а в дурости того, кто переводил книгу в DjVu - некто Bookingolz (его логотип в виде красного значка прилеплен на первой странице обложки). Уже не раз видел его сканы и везде он расставляет свои значки, непомерно увеличивающие размеры страниц.
Скажем, в данной книге из-за этого дебильного значка первая страница имеет размер 600КБ, а 17-я страница - больше 1МБ. Убрать значёк и размеры уменьшаться до досятков КБ.
А 17-я страница, на которой только текст, да и то редкий из-за табличных данных,
без значка может иметь размер 11КБ вместо 1МБ...

 

Вынул из книги 3 странички в формате DjVu: 9 - чистый текст, 17 - с логотипом Bookingolz и 298 - цветная картинка (2-й столбец в приведенной таблице).
Экспортировал их в BMP (3-й столбец). Посмотрел их в Фотошопе. Все страницы одного размера: 3552х5172 пикс с разрешением 600 пикс/дюйм. Разнятся цветовые модели страниц: 9-я - Черно-Белая (1-битовая), 17-я и 298-я - RGB 32-битовая (8 бит/канал).
Обратная перегонка в DjVu (4-й столбец таблицы) показала, что чисто текстовая стр.9 сохранена в профиле "Черно-белый", а цветные страницы (17 и 298) - в профиле "Фотография" (самый "расточительный" вариант).
Хотя профиль "Нормальный" при гораздо большей компактности тоже сохраняет цвет, но дает сильные искажения - достаточно сравнить вид логотипа на приведенной картинке.

На стр.17 я удалил логотип (замазал его белой краской фона) - размер файла в BMP не изменился, а в DjVu уменьшился на 9%.
Кроме того, в формате DjVu стр.17 (с логотипом) "весит 1088 КБ", а стр.298 (без логотипа) - 4118 КБ. По моему мнению это связано с сетчатой структурой фоновой зпливки, "сеточкой" же выполнены и заливки неосновных цветов (коричневый, фиолетовый, розовый, оранжевый, голубой, серый и т.п.). Кстати, и формат JPG тоже "раздувается" при увеличении количества резких контуров.
Т.е., "грешить" на логотип не приходится. Высокое же качество конечного продукта вполне достойно фирменного знака.