Как скопировать текст из djvu файла

Удачный опыт	Как скопировать текст из djvu файла
	1 ← 1 → 2
AZUS6 25.03.2012, 09:21	Как все уже знают , я люблю вставлять в сообщения части статей из научно-популярных журналов,которые естественно хранятся в формате djvu. Наличие ОСR слоя не решает проблему,т.к у него начисто убито форматирование,исправить которое невозможно (только вручную). Поэтому я задался вопросом ,как все это дело провернуть в автоматическом режиме, с минимальным приложением ручного труда. Вопрос часто поднимается в интернете http://www.askguru.ru/list.ghtml?ID=437038 http://www.tehnari.ru/f180/t45727/ Но никто так и не нашел простого и логичного решения (либо предлагается устанавливать кучу всяких громоздких программ,либо вообще результат неудовлетворительный.) Вот мой способ WinDjvuViev -печать -далее выбираем виртуальный принтер Microsoft Office Document Image Writer и страницы которые нам нужны-сохраняем в файл .mdi -открываем в Мicrosoft Office Document Imaging -сохраняем как .tiff . А этот формат уже открываем в ABBYY FineReader 9.0 Professional Edition, распознавание-и вот нормальный текст с нормальным форматированием.
Арс 25.03.2012, 09:30	AZUS6: в ABBYY FineReader 9.0 Professional Edition У него есть скрин-шот ридер, выделяем на экране интересующее и распознаём или в буфер обмена или в ворд, например.
Splav56 25.03.2012, 10:02	А не проще экспортировать в .bmp или .jpg и распознать, сохранив потом в .doc
AZUS6 25.03.2012, 10:13	Это в случае если нужна одна или 2 страницы.И не в в .bmp или .jpg, а WinDjvuViev экспортирует в РNG(этот формат качественнее),НО ТОЛЬКО ПО ОДНОЙ СТРАНИЦЕ. разработчику есть над чем подумать. Но в целом с многостраничным .tiff работать удобнее.
JAS 25.03.2012, 18:48	А можно я напишу, хоть вы и не меня спрашиваете, AZUS6? Просто небольшое замечание. В некоторых дежавю-файлах (наверное в тех, где есть OCR, но не проверял, не уверен) активен пункт "Экспорт в текст" в меню Файл. Что позволяет получить вполне годный для копипасты текст. Одним щелчком. Но, как и говорил, не на всех файлах. Всё, ухожу, ухожу..
Eugene.A 25.03.2012, 22:34	FineReader 10 открывает djvu сам.
Сергей К 25.03.2012, 23:00	AZUS6: WinDjvuViev -печать... Ставим FinePrint, печатаем на нем нужные страницы (или все) и сохраняем полученный результат в PNG. Но если Eugene.A: FineReader 10 открывает djvu сам то вобще все упрощается. JAS: активен пункт "Экспорт в текст" в меню Файл Если это есть, то можно просто на самой страничке выделить нужный фрпагмент и скопировать, на как было сказано выше - с полной потерей форматирования (включая разбиение на абзацы).
vasilshk 25.03.2012, 23:03	Программа CuneiDjVu v1.4 (24,1 МБ) предназначена для создания распознанного текстового слоя (OCR) в DjVu-файлах От сюда http://djvu-soft.narod.ru/soft/ прямая ссылка http://djvu-soft.narod.ru/scan/cuneidjvu.htm Пробовал на журналах Радио получалось очень не плохо.
ayk 26.03.2012, 20:46	ABBYY FineReader распознает элементарно - что тут мутить
Сергей К 27.03.2012, 12:24	Вся соль DjVu в том, что "картинка" страницы и текст хранятся вместе. Распознавать несколько страниц подряд возникает, обычно, для написания рефератов/курсовых и т.д. Чаще требуется скопировать несколько абзацев. Тут проще скопировать с потерей форматирования и неправильными буквами, чем "просеивать" через дополнительные программы (FineReader). А вот бы после FineReader запихнуть распознаный текст обратно в DjVu - было бы полезно!
	1 ← 1 Дальше → 2