Свежие обсуждения
Документация

Как сканировать печатный текст (разрешение и т.п.)?

1 7

Арс, просмотрел Ваши ссылки (спасибо), попробовал перекодировать примеры, потом прочитал ссылку на эту тему, и могу заявить, что "глюк" с перестановкой (подменой) букв при конвертировании в DjVu является проблемой надуманной, и появляется по причине "жадности"...
Мол, "ай, как хорошо сжимает, дадим проге сожмакать то, что сами еле прочитать можем..." Потом начинаем кричать: "фи... как плохо... буквы переставила...".

Я сам "переболел" этим, увидев, как хорошо уменьшаются файлы после конвертирования в DjVu. Захотелось большего...
Это нормально, это способ знакомства с новым. Но это не значит, что формат плохой. Не нужно требовать от него больше, чем он может. Он и так, может достаточно много, не смотря на простоту программ для него.

Мало Соло, возьмите DocumentExpressEnterprise_5.1.0.
В нём возможностей - замучаетесь экспериментировать...
В то же время, работать с готовыми (выстраданными) установками очень легко.
Взгляните на аттач - это фрагмент меню, встроенного в TOTAL COMMANDER.
Скажем, есть файлик, в котором кроме текста присутствуют и цветные картинки, но маленькие.
При установках по умолчанию получается, что либо размер файла маленький, текст очень хороший, а картинки размыты до безобразия. Либо (с другими установками по умолчанию) всё видно - и текст и картинки, но размер больше исходника...

В этом случае, выделяем на панели файл, который нужно перекодировать, и вызвав показанное меню, жмём кнопку с требуемым качеством, которое обозначено как "quality=..." и его можно менять от 1 до 100.
В этом случае текст не трогается, а картинку можно "вытянуть" так, что она будет прекрасно выглядеть, а размер файла не пострадает. Он, конечно увеличится, но, всё равно, будет меньше исходника.

Арс, в Вашей первой ссылке на другую конфу, я скачал файлик и пробовал конвертировать. Там есть фрагмент, когда рядом стоят две буквы "и", но вторая плохо пропечатана (либо типографская "грязь", либо попытка сканирования сразу в ч/б, что более вероятно, а это даёт мусор в виде точек, проставленных где угодно). При конвертировании в DjVu, я и получил вместо "и" букву "н".
Почему бы и нет, если просмотр оригинально текста даже человеку не позволяет сразу определить букву, разве что, прочитав слово целиком. Но программы то, пока, не на столько интелектуальны...
Стоило при конвертировании "указать", что картинка сканировна не с разрешением 300, а, всего лишь, 200, как глюк с подменой букв пропал, а результат смотрится так же, как и оригинал...

Кстати, если присмотреться, то изменённая буква только напоминает "н". В тексте есть настоящие буквы "н", но прога их сюда не поставила, а поставила какой то символ, очень похожий на "н". Правая вертикальная черта символа имеет выемку, как у буквы "к", просто эта выемка маленькая, а центральная перекладина широкая, по этому, асоциация с буквой "н".
Это говорит о том, что прога создала у себя в базе дополнительный символ, который смогла "разглядеть" в плохом скане. То есть, она не просто подменила букву, а поставила символ, который смогла "увидеть". И в своей базе сохранила его как отдельный, наряду с "и", "н", и другими.

Andy правильно сказал на 3-й странице этой темы: "А в чем проблема? Дайте Solo документ нормального качества, и никаких глюков не будет ".

В общем, я признаю, что проблема существует, но это не проблемы конвертирования, а проблемы сканирования. И возникают они, как было сказано на форуме по ссылке Арс, только при плохом качестве сканирования на малых буквах текста.

По этому, можно смело утверждать, что подмена букв в аннотации статей журнала "Радио" - это не глюки конвертирования в DjVu. При тех размерах и читабельности текста, совершенно нет предпосылок для глюкавости.

Есть ещё одна версия - возможно, такие ошибки делает прога стороннего производителя. По крайней мере, сначала я пробовал разные программы, но в результате отказался от всех кроме Лизардовских, так как они при одинаковом качестве с Соло давали больший размер, либо худшее качество при том же размере.
Экспериментировать с другими прогами я перестал год или два назад, по этому не знаю, как они работают сейчас, в более новых версиях.

50645.djvu