Свежие обсуждения
Публикации

База данных по радиожурналам почти готова

1 2 8

".....Curious, а почему в Exel? Радиомир я просто копировал в WORD - получилось здорово. Надо только в свойствах таблицы обозначить все границы таблиц....."
Разницы между word и exel никакой. Прсто так мне было удобнее. Более того, в access тоже есть средства работы с html- страницами, но у меня они почему-то непрвильно опознавали столбцы. Я потыкался и бросил, было привычнее exel- ом.
Для Радиохобби так никто ничего и не прислал, ну да бог с ним, пусть Сухову же будет хуже.
Может, тогда кто-нибудь поделится опытом, как из де-жа-вю в текст перевести.

 

Curious
Может, тогда кто-нибудь поделится опытом, как из де-жа-вю в текст перевести.
Сначала из DjVu в картинку, потом распознать...

Последний пакет от Лизарда "DocumentExpressEnterprise_5.1.0" позволяет вместе с конвертированием в DjVu (или после него) распознавать и текст (в том числе и русский) и сохранять его в том же файле в виде дополнительного слоя, или в виде отдельного файла (*.txt или *.html)
Понравилось, как этот же пакет делает из pdf-а doc - c сохранением форматирования и вставкой картинок.

По этому, возможен поиск по тексту (с возможностью копирования) прямо в плугине для броузера (последний, от Лизарда) или после установки дополнительного плугина в любой броузер для поиска по тексту в DjVu файле средствами самого броузера.
Распознавание реализовано на файнридеровском движке, но довольно коряво... Всё равно, лучше, чем ничего. Глядишь, в следующих версиях и улучшат...

Если учесть возможность вставки в DjVu файл гиперссылок, то, может, получится изготовить такую базу не просто в виде краткой аннотации, а и обеспечить переход на статью по найденному описанию в базе?

Скомпоновав это всё на одном компакте, можно получить удобный архивчик.

Кто что пробует, подключайте меня, вдруг, помогу чем то...
Давно уже есть мысль все материаллы свести в подобную базу, да всё, как то, времени не хватает реализовать это, и ума, что бы сделать это красиво (удобно)...

 

В базе, что я сегодня отправил Andy, около 18000 записей. Делать вручную гиперссылки мало не покажется?
Проще разбить большой Djvu файл на мелкие файлы-страницы, и делать ссылки уже на них. Это хотя бы можно как-то автоматизировать каким-нибудь макросом.
А те пиратские dvd- диски с журналами, что продаются, там же бардак, часть в pdf , Часть в tiff , часть в djvu и еще черт знает в чем. Сводить это в один формат, единую систему нумерации... А оно надо?
Если каждый день искать статьи, может оно и надо, а если раз в полгода прочесть то, что когда-то мельком просмотрел и где-то в мозжечке отложилось... не, я лучше руками найду и прочитаю, чем этими же руками делать 18000 тыс. ссылок на заведомо ненужное.

 

А что в базе? Я еще не посмотрел (нужно ставить Access).

 

Посмотрел. Если старая база не изменена, то она содержит ошибки, которые я в свое время исправлял для «Радио» с 1995 года

 

http://search.pro-radio.ru/

Интерфейс очевиден. Возможно, следует пояснить, что находясь на странице журнала или в какой-то категории, поиск идет только в пределах соответствующего журнала или категории.

P. S. Наполнять базу новым содержимым и исправлять ошибки у меня нет ни желания, ни времени Спасибо тем, кто собрал данные, и тем, кто захочет делать это в будущем.

 

База в экзеле много мощнее и гибче для структурирования данных,
и ессно вариантов поиска. Тут чем больше база,- тем яснее это преимущество....
Word не предназначен для таких дел.

 

Andy: http://search.pro-radio.ru/
Превосходная вещь!
Vlad_Petr: База в экзеле много мощнее и гибче для структурирования данных,
А база сиквела ещё мощнее

 

Артём Сергеевич: Превосходная вещь!

Именно так!
Покопался, интерфейс довольно удобный по сравнению с другими базами данных по содержанию журналов. Главное что есть поиск и тематическое разделение по базе, а не просто переписано содержание. И в глазах не пестрит. В общем мне нравится. Главное чтобы она пополнялась своевременно.
Спасибо всем, принимавшим участие в её создании и опубликовании.

 

В изначальном виде, то есть в Access, база была удобнее. Не надо было меленько шинковать по годам. Но,ожет быть мне так только кажется, под себя ведь делал.

А наименование месяцев вместо номера журнала - это неправильно. Не все журналы имеют в году двенадцать выпусков. Радиохобби, например, всегда было по шесть номеров, Нынешний Радиолюбитель, испытывая не лучшие времена, тоже переходит на сдвоенные выпуски и получается, что последний шестой декабрьский номер называется "июнь".