Свежие обсуждения
Публикации

Составил содержание к журналу "Радио".

1 4 7

SiNil как я понял нужен ещё и трансятор кода? Какой именно? И как правильнее им пользоваться?

 

sprutss: Какой именно? И как правильнее им пользоваться?
Это скрипт на питоне. python.org
после установки питона скрипт просто запускается и все. текст должен быть в одном каталоге со скриптом. ну или пути в скрипте поправить в любом редакторе.

 

sprutss: нужно Прийти к единому стандарту например формат Access
Только не Access, а dbf, это куда проще и удобнее. Разумеется, форматы mdb/xls/dbf взаимно конвертируются, но для таких скромных целей, как содержание журналов, dbf намного легче во всех отношениях, начиная с вьюера и кончая инструментами для обработки баз - поиск дубликатов и т.д.

 

Благодарю за труды. И заодно- поздравляю с Новым Годом! В новом году- новые заботы..

 

GMAP из базы Access легко и Dbf сделать а вообще нужно сначала забить базу данными а потом можно и програмку написать на Делфи (опыт не большой в этом у меня есть - писал такие для баз данных под себя) что б выборки делала по автору либо по журналу, по теме и т.д.

Сейчас как раз этим и занимаюсь (вчера мысль пришла добить и поддерживать базу пока есть силы) .....забиваю базу данных (за основу взял ту которую выложил Curious ), изучаю макросы, создаю их что б проще было работать с Html и текстовыми страницами, ищу 12 номера журналов те которые есть в базе в отличном качестве (точнее содержания за год)
Радио за 2007 год добил вчера нашёл за 2008 год буду сканиравать и обрабатывать
Также нашёл РадиоМир за 2006\ 2007\2008 года тоже отсканирую и потоком обработаю, как и чем я уже вроде придумал осталось реализовать а вот с остальными журналами проблемка ......нету нормального (хорошего) скана в PDF формате
но попробую поискать либо попросить у людей может кто и откликниться и пришлёт отсканеные в хорошем качестве (разрешении) страницы с содержание за весь год в Pdf стандарте ?
Вот только пришлось кое какие рубрики убрать кое какие рубрики всунуть в другие разделы но про это напишу в базе данных

 

SiNil спасибо попробую прикруть скрипт к обработчику

 

sprutss:
кто и откликниться
Откликаюсь.
Есть все "Радио", начиная, кажись, с 78-го года.
Какие надо?
Лучше на почту: gregoryrсобакаimailточкаru

 

Gregory журнал Радио уже не нужен а какие нужны будут я после нового года скажу....Праздник всё
таки на носу

А пока вот файл в екселе тут только журнал Радио от 7/2007 до 12/2008 года может кому пригодиться в личную базу, что б понять его структуру обратите внимание на этот файл в нём применяемое разбиение по разделам если кто не согласен или есть дельное предложение готов выслушать.

А вот это вот файл в Базе данных в Access с уже обновлённым Радио до 12 номера 2008 года (база уже ранее выкладывалась на форуме я только на ней начал собирать и испытывать )

Это только начало

Всех с Новым годом!

 

sprutss: а вот с остальными журналами проблемка ......нету нормального (хорошего) скана в PDF формате

А я не понял, зачем вам pdf - формат. На сайтах журналов лежит все в html - формате. С ним легче работать и разметка есть. Я так и делал, когда эту базу заполнял. Все автоматом залетало. В accesse там есть готовые средства.
А вот с Радииохобби я тогда намучился. У них как раз только в pdf все и лежит. А потом еще полгода правил, выискивая твердые переносы и неправильно распознанное.

 

Curious Pdf я научился обробатывать быстро используя Fine Reader(материал обробатываеться за весь год)+Word(растановка специальных знаков, готовлю таблицы)+Exel (за счёт макросов раскидываеться и сортируеться)
На счёт access пока не разбирался и не видял готовых средств-просьба указать на их попробую разобраться с ними