Свежие обсуждения
Компьютеры

Можно ли и как изменить объём JPG снимка? Оптимальный размер?

1 7 9

DWD: GSview
DWD, все даташиты микрочипа защищены от копирования текста, эта программа сможет её отключить?

 

Вот к примеру попробуйте отключить защиту в этом файле
http://www.microchip.ru/files/d-sheets-rus/PIC16F62x-PIC16F6xxA.pdf
(120кБ)

 

Вчера не успел закончить свою мысль.
При конвертировании в DjVu фоток, полученных с бытовой цифровой камеры, получаем размытость мелких деталей второго плана. Иногда, это даже, хорошо - в jpg на облакаках видны разводы, особенно, при переходе цвета, а в DjVu эти переходы размываются и облака получаются, наоборот, более естественными. Лёгкая размытость придаёт им... глубину, что ли...
Если же требуется детализация мелких участков изображения, то DjVu её не даёт. Получается, что этот формат не в состоянии обеспечить передачу мелких участков изображения?..
Ладно, пусть будет так.
Получаем похожий снимок, но не "испорченный" ещё различными алгоритмами сжатия или обработки. Конвертируем его в DjVu и видим, что размытости на таких же мелких деталях второго плана нет! Про размер, я уже молчу, такое впечатление, что соотношение размер/качество стало только лучше.
Выходит, что формат, всё таки, может правильно передать мелкие детали изображения?.. Дополнительное подтверждение тому - картография, где используется этот формат. Но, ведь, карта, это таже фотография - на "переднем" плане вид города с птичьего полёта (какой передний план у карты... ), на втором мелкие детали изображения в виде домов улиц и т.д. Увеличиваем изображение средствами просмотрщика, и видим эти же дома более чётко, плюс ко всему, начинаем видеть окна в этих домах, деревья на улицах и т.д. Ещё больше увеличиваем изображение и видим листья на деревьях...
Возможно, я утрирую, но представьте себе фотографию панорамы с такими возможностями просмотра...

Вот и получается, что DjVu не используется фотографами потому, что используемые ими цифровые камеры, делают напригодным файл для дальнейшей обработки его в DjVu.
Алгоритмы преобразования и обработки, заложенные в эти камеры, делают что то такое с изображением, что оно теряет "естественность". Производится какая то обработка с целью минимизации размера (стандарт - почему именно 1Мб?), и что бы субъективное восприятие не страдало, то есть, с учётом особенностей зрения человека.
Похоже, что механизм вейвлетового преобразования как то конфликтует с такой предобработкой. Для выполнения задачи ему приходится "запоминать" больше слоёв изображения, а это увеличивает размер кода.
Кто знает?..

 

Артём Сергеевич, GSview не отключет защиту кода формата pdf, думаю, он, вообще, ничего с ним не делает. Используются только разрешённые функции.
В приведенном Вами файле http://www.microchip.ru/files/d-sheets-rus/PIC16F62x-PIC16F6xxA.pdf включена защита от всего, кроме просмотра на экране... Ну, правильно, если ещё и эту защиту включить, то какой смысл в публикации файла в инете?

GSview - это просто просмотрщик. Запускаем его и уже в нём читаем указанный Вами файл. Затем пересохраняем его. GSview предложит много вариантов, как графических так и текстовых, но по умолчанию стоит *.pdf, его и выбираем. После сохранения получим тот же файл в том же формате, но уже с отключенными всеми защитами. Его можно редактировать, копировать фрагменты и т.д.

Для меня, например, важен тот вид документа, который ему придал автор, и изменять его у меня необходимости нет. По этому, я его переконвертирую в DjVu и получаю всё тоже самое, но в 5 раз меньше размером файла (26Кб вместо 126Кб). Спрашивается, зачем платить больше?..
Качество сохранения, в принципе, один в один, и при желании любую старницу документа можно переконвертировать в bmp и распознать файнридером - получим то же самое, только в тексте с элементами графики (линии, рамки и т.д.). Из за высокого качества "хранения" в DjVu проблем с распознаванием не будет.
При этом, я даже не использовал GSview, достаточно было установленного Fine Print-а. В самом акробатридере выбираем печать, и в открывшемся окне выбираем - с помощью Fine Print.
Это виртуальный принтер, результатом его работы будет некоторое количество файлов в формате bmp (страница на файл), которые я уже конвертирую в DjVu.
То же самое можно провернуть и в GSview. Просто, на рабочей машине он у меня не установлен, как то, нет необходимости.
Но для проверки самого себя сейчас поставлю и проверю, а результат сообщу позже.

Долго колебался, но рискну выложить переконвертированный файл, размер то, не превышает, устовленного ЮХа, лимита в 50Кб...

20499.djvu

 

А платить больше нужно затем что нужен именно текст, а не картинка или битмап, согласись что я смогу вставить кусок с битмапом кода в MPLAB !

 

И где найти этого самого GSview ?

 

Каюсь, приврал на счёт GSview. Давно им не пользовался.
Простое пересохранение не выключает защиту кода pdf файла. Нужно выбирать в меню не "сохранить как...", а "конвертировать..." в "pdfwrite".
После конвертирования появились проблемы с кодировкой - на экране почти всё в иероглифах. Но это уже такой шрифт был выбран автором документа. Знатоки еще говорят, что подобного рода проблемы появились при создании pdf документов в WindowsXP. Тут уже без "Штирлиц"-а или подобной проги не обойтись. В общем, тут я уже плаваю, точнее, тону...
Попробовал другой документ переделать в GSview, получилось нормально, без иероглифов.
Правда, у меня довольно старая версия GSview - 4.5. Помню, что сталкивался с проблемой кодировки, и помог переход на более новую версию, но подробностей не помню.
Я пользовался GSview только для перевода из pdf в графику для дальнейшей переконвертации в DjVu.

Fine Print-ом я смог воспользоваться потому, что разрешена печать документа. Если бы и она была запрещена, то нужно было бы конвертировать в графику с помощью GSview.
Так что, если требуется именно текст, то, боюсь, поможет только распознавание. Хотя это не проблема, просто потребуется больше времени на обработку.

Вывод.
Простое переконвертирование с помощью GSview не получилось из за проблемы с кодировкой.
Извлечь текст из исходного pdf-документа можно, переконвертировав его тем же GSview в гафику и потом распознав текст файнридром.
Использование DjVu позволяет только хранить (и читать) документ при меньшем размере файла.

 

 

DWD: Извлечь текст из исходного pdf-документа можно, переконвертировав его
Это называется через ж@^% . Извините за грубость но другого выражения вашему методу я найти не смог.
Почему вы такой многословный DWD? В среднем ваши ответы занимают от 3 до 10кБ, что существенно бьёт по моему GPRS траффику!

 

Артём Сергеевич
А платить больше нужно затем что нужен именно текст, а не картинка или битмап, согласись что я смогу вставить кусок с битмапом кода в MPLAB !

Согласен. Проблема понятна. Попробуйте с помощью GSview получить pdf файл с отключенными защитами... что то я уже начинаю сомневаться, что он, именно, отключает их. Посоветуйтесь со спецами.

В GSview есть ещё возможность извлекать текст. Для этого, сначала, нужно переконвертировать *.pdf в *.ps, а потом извлечь из этого файла текст. Попробуйте, может, в этом случае не будет проблем с кодировкой. Если же и это не поможет, то тем же GSview переконвертируем нужные страницы (или все) из pdf в графику и файнридером распознаём.

Но это моё, диллетантское в данном случае, мнение, и Вам лучше обратиться, например, в конфу на том же сайте Микрочипа. Там, ведь, то же сталкиваются с необходимостью скопировать листинг программы, а не тупо набирать его на клаве читая с экрана или с листа бумаги...

Артём Сергеевич
И где найти этого самого GSview ?

Здесь:
http://www.cs.wisc.edu/~ghost/gsview/get47.htm

Уже есть версия 4.7 и дополнительная примочка к ней версии 8.51.
У меня же версии, соответственно, 4.5 и 8.11.
Попробуйте, может, новые версии решат Вашу проблему.
Точнее, они то, её решат наверняка, например, через распознавание. Но, может, получится, именно, снять защиту, получив тот же pdf-файл с отключенными защитами.
Потом поделитесь опытом?..

Собственно, пошёл я и сам туда же... качать...