|
|
|
|
DWD: GSview DWD, все даташиты микрочипа защищены от копирования текста, эта программа сможет её отключить? |
|
|
Вот к примеру попробуйте отключить защиту в этом файле http://www.microchip.ru/files/d-sheets-rus/PIC16F62x-PIC16F6xxA.pdf (120кБ) |
|
|
Вчера не успел закончить свою мысль. При конвертировании в DjVu фоток, полученных с бытовой цифровой камеры, получаем размытость мелких деталей второго плана. Иногда, это даже, хорошо - в jpg на облакаках видны разводы, особенно, при переходе цвета, а в DjVu эти переходы размываются и облака получаются, наоборот, более естественными. Лёгкая размытость придаёт им... глубину, что ли... Если же требуется детализация мелких участков изображения, то DjVu её не даёт. Получается, что этот формат не в состоянии обеспечить передачу мелких участков изображения?.. Ладно, пусть будет так. Получаем похожий снимок, но не "испорченный" ещё различными алгоритмами сжатия или обработки. Конвертируем его в DjVu и видим, что размытости на таких же мелких деталях второго плана нет! Про размер, я уже молчу, такое впечатление, что соотношение размер/качество стало только лучше. Выходит, что формат, всё таки, может правильно передать мелкие детали изображения?.. Дополнительное подтверждение тому - картография, где используется этот формат. Но, ведь, карта, это таже фотография - на "переднем" плане вид города с птичьего полёта (какой передний план у карты... ), на втором мелкие детали изображения в виде домов улиц и т.д. Увеличиваем изображение средствами просмотрщика, и видим эти же дома более чётко, плюс ко всему, начинаем видеть окна в этих домах, деревья на улицах и т.д. Ещё больше увеличиваем изображение и видим листья на деревьях... Возможно, я утрирую, но представьте себе фотографию панорамы с такими возможностями просмотра... Вот и получается, что DjVu не используется фотографами потому, что используемые ими цифровые камеры, делают напригодным файл для дальнейшей обработки его в DjVu. Алгоритмы преобразования и обработки, заложенные в эти камеры, делают что то такое с изображением, что оно теряет "естественность". Производится какая то обработка с целью минимизации размера (стандарт - почему именно 1Мб?), и что бы субъективное восприятие не страдало, то есть, с учётом особенностей зрения человека. Похоже, что механизм вейвлетового преобразования как то конфликтует с такой предобработкой. Для выполнения задачи ему приходится "запоминать" больше слоёв изображения, а это увеличивает размер кода. Кто знает?.. |
|
|
Артём Сергеевич, GSview не отключет защиту кода формата pdf, думаю, он, вообще, ничего с ним не делает. Используются только разрешённые функции. В приведенном Вами файле http://www.microchip.ru/files/d-sheets-rus/PIC16F62x-PIC16F6xxA.pdf включена защита от всего, кроме просмотра на экране... Ну, правильно, если ещё и эту защиту включить, то какой смысл в публикации файла в инете? GSview - это просто просмотрщик. Запускаем его и уже в нём читаем указанный Вами файл. Затем пересохраняем его. GSview предложит много вариантов, как графических так и текстовых, но по умолчанию стоит *.pdf, его и выбираем. После сохранения получим тот же файл в том же формате, но уже с отключенными всеми защитами. Его можно редактировать, копировать фрагменты и т.д. Для меня, например, важен тот вид документа, который ему придал автор, и изменять его у меня необходимости нет. По этому, я его переконвертирую в DjVu и получаю всё тоже самое, но в 5 раз меньше размером файла (26Кб вместо 126Кб). Спрашивается, зачем платить больше?.. Качество сохранения, в принципе, один в один, и при желании любую старницу документа можно переконвертировать в bmp и распознать файнридером - получим то же самое, только в тексте с элементами графики (линии, рамки и т.д.). Из за высокого качества "хранения" в DjVu проблем с распознаванием не будет. При этом, я даже не использовал GSview, достаточно было установленного Fine Print-а. В самом акробатридере выбираем печать, и в открывшемся окне выбираем - с помощью Fine Print. Это виртуальный принтер, результатом его работы будет некоторое количество файлов в формате bmp (страница на файл), которые я уже конвертирую в DjVu. То же самое можно провернуть и в GSview. Просто, на рабочей машине он у меня не установлен, как то, нет необходимости. Но для проверки самого себя сейчас поставлю и проверю, а результат сообщу позже. Долго колебался, но рискну выложить переконвертированный файл, размер то, не превышает, устовленного ЮХа, лимита в 50Кб... 20499.djvu |
|
|
А платить больше нужно затем что нужен именно текст, а не картинка или битмап, согласись что я смогу вставить кусок с битмапом кода в MPLAB ! |
|
|
И где найти этого самого GSview ?
|
|
|
Каюсь, приврал на счёт GSview. Давно им не пользовался. Простое пересохранение не выключает защиту кода pdf файла. Нужно выбирать в меню не "сохранить как...", а "конвертировать..." в "pdfwrite". После конвертирования появились проблемы с кодировкой - на экране почти всё в иероглифах. Но это уже такой шрифт был выбран автором документа. Знатоки еще говорят, что подобного рода проблемы появились при создании pdf документов в WindowsXP. Тут уже без "Штирлиц"-а или подобной проги не обойтись. В общем, тут я уже плаваю, точнее, тону... Попробовал другой документ переделать в GSview, получилось нормально, без иероглифов. Правда, у меня довольно старая версия GSview - 4.5. Помню, что сталкивался с проблемой кодировки, и помог переход на более новую версию, но подробностей не помню. Я пользовался GSview только для перевода из pdf в графику для дальнейшей переконвертации в DjVu. Fine Print-ом я смог воспользоваться потому, что разрешена печать документа. Если бы и она была запрещена, то нужно было бы конвертировать в графику с помощью GSview. Так что, если требуется именно текст, то, боюсь, поможет только распознавание. Хотя это не проблема, просто потребуется больше времени на обработку. Вывод. Простое переконвертирование с помощью GSview не получилось из за проблемы с кодировкой. Извлечь текст из исходного pdf-документа можно, переконвертировав его тем же GSview в гафику и потом распознав текст файнридром. Использование DjVu позволяет только хранить (и читать) документ при меньшем размере файла.
|
|
|
|
|
|
DWD: Извлечь текст из исходного pdf-документа можно, переконвертировав его Это называется через ж@^% . Извините за грубость но другого выражения вашему методу я найти не смог. Почему вы такой многословный DWD? В среднем ваши ответы занимают от 3 до 10кБ, что существенно бьёт по моему GPRS траффику! |
|
|
Артём Сергеевич А платить больше нужно затем что нужен именно текст, а не картинка или битмап, согласись что я смогу вставить кусок с битмапом кода в MPLAB ! Согласен. Проблема понятна. Попробуйте с помощью GSview получить pdf файл с отключенными защитами... что то я уже начинаю сомневаться, что он, именно, отключает их. Посоветуйтесь со спецами. В GSview есть ещё возможность извлекать текст. Для этого, сначала, нужно переконвертировать *.pdf в *.ps, а потом извлечь из этого файла текст. Попробуйте, может, в этом случае не будет проблем с кодировкой. Если же и это не поможет, то тем же GSview переконвертируем нужные страницы (или все) из pdf в графику и файнридером распознаём. Но это моё, диллетантское в данном случае, мнение, и Вам лучше обратиться, например, в конфу на том же сайте Микрочипа. Там, ведь, то же сталкиваются с необходимостью скопировать листинг программы, а не тупо набирать его на клаве читая с экрана или с листа бумаги... Артём Сергеевич И где найти этого самого GSview ? Здесь: http://www.cs.wisc.edu/~ghost/gsview/get47.htm Уже есть версия 4.7 и дополнительная примочка к ней версии 8.51. У меня же версии, соответственно, 4.5 и 8.11. Попробуйте, может, новые версии решат Вашу проблему. Точнее, они то, её решат наверняка, например, через распознавание. Но, может, получится, именно, снять защиту, получив тот же pdf-файл с отключенными защитами. Потом поделитесь опытом?.. Собственно, пошёл я и сам туда же... качать... |
|
|
|
|