Свежие обсуждения
Компьютеры

Конвертер *.txt в *.doc

Здравствуйте! На работе озадачили - есть комплект технической документации в формате *.txt, кодировка, естественно, DOS-866, внутри файлов куча таблиц, сформированных, само собой, псевдографикой. Начальство желает, чтобы файлы хранились в формате MS Word, и были читаемы/печатаемы/корректируемы под Windows, т.к. DOS уже морально устарел... Провел два часа в поискал в Инете, нашел массу софта, конвертирующего txt в *.doc и rtf, но ни одна программа не работает корректно с псевдографическими таблицами. Я даже нашел конвертер текста в битмап, в надежде распознать FineReader-ом, но и эта затея окончилась неудачей - слишком низкого разрешения выдается картинка. У меня уже руки опускаются... Выручайте! С уважением, Николай.

 

Думаю, что таблички придется перерисовывать "врукопашную"

 

Николай, дайте файлик txt посмотреть (1 страничку - хватит)

 

Самое банальное, что приходит в голову (для упрощения автоматизации процесса перевода таблиц в нормальный вид) - это открывать Ваши txt экселем - он позволяет вводить символ - разделитель ячеек и понимает текст DOS. Ну а из экселя - накидывать в ворд. Автоматизация, конечно, условная, но все-таки - не перерисовывать все заново.

А по поводу конвертера текста в битмап - можно и клавишей PrintScrn пользоваться.
а потом в графическом редакторе (напимер IrfanView http://www.scans.ru/newz_5_3.php )принудительно увеличивать разрешение до 300 dpi (оставляя размер картинки неизменным) и попробовать подсовывать такие файлики в FineReader (и та и другая программы поддерживают пакетные режимы). Может - в таком разрешении что-то дельное получится.
Если что - пишите к нам на форум: http://www.scans.ru/phorum.php

 

Можно сначала заменить всю псевдографику на похожие символы, а именно: в уголки поставить "+", горизонтальные линии - "-", вертикальные - "|". Далее: Открываем txt ФАРом, копируем весь текст в буфер обмена и переносим в ВОРД. Шрифт ставим КУРЬЕР - это по-моему единственный моноширинный шрифт. Потом останется поиграть с шириной полей и размером шрифта - чтобы не возникало незапланированных переносов, ломающих таблицы.
Правда полученный doc - файл будет содержать ДОСовскую форматировку, что не позволит полноценно работать с ним как с вордовским (всякие действия с абзацами, шрифтами там и проч).

 

А вот автоматическая "удалялка" псевдографики:

9438.zip

 

Здравствуйте! Спасибо всем, кто откликнулся на мой призыв о помощи! Отвечаю всем по порядку
ЮХа, может быть и можно было бы переформатировать вручную, но файлов пять тысяч... Сроку я попросил два месяца, но не хотелось бы их потратить только на это. Вот и ищу что-то, хоть как-то автоматизирующее процесс.
scans.ru, файлик в аттаче. Я ведь уже нашел отличную конвертилку, от самого Мелкософта, называется lex2rtf, конвертирует текcт из Лексикона в rtf, даже корректно обрабатывает таблицы! Но... Смотрите пример Там есть таблицы без вертикальных разделителей. Например, пункт 3. "Обеспечение и обслуживание рабочего места."
AN1440, спасибо за программу! Буду ковыряться дальше, искать вариант. Думаю, эта маленькая утилитка может помочь. С уважением, Николай.

9456.txt