|
|
|
Научно-практическая
конференция
«Научная библиотека академического учреждения:
опыт, проблемы и перспективы информационного обеспечения исследовательской
деятельности»
|
Еремеев Л. Г., Кузнецов
А.
Система создания полнотекстовых электронных ресурсов научного назначения
с использованием библиотечных технологий. На
сегодняшний день распространенной практикой для создания полнотекстовых
электронных ресурсов научного назначения является создание сайтов и порталов
электронных библиотек по необходимой тематике. Данный метод имеет ряд
недостатков, выделим наиболее важные.
Первое: создание сайта
или портала и размещение на нем документов обычно предполагает постоянное
участие в этом процессе профессиональных программистов, что создает для
авторов научных работ определенные трудности. Приходится либо брать программиста
в штат, либо привлекать его временно, либо самим авторам осваивать работу
программистов, что отнимает часть их рабочего времени.
Второе: при поиске, размещенные
на таком портале документы включаются в общее множество документов, находящихся
в Интернете, а поэтому могут затеряться в этом множестве, в том смысле,
что их очень трудно будет найти через поисковые системы. Большую роль
в находимости документов сайта или портала является его проиндексированность
поисковыми системами общего назначения, что требует некоторого времени
после появления документа, а достаточно часто этот процесс занимает значительное
время.
Третье: нет специализированного
поиска по документам, размещенным на таких порталах, а следовательно,
нет возможности ограничить область поиска только полнотекстовыми материалами
научного назначения или порталами с определенной тематикой. Фактически,
каждый портал имеет собственную поисковую систему, и чтобы находить необходимую
информацию в некотором множестве интересующих его порталов, пользователю
(читателю) приходится осваивать поисковые нюансы каждого из них.
Поэтому актуальным является вопрос разработки
такой системы создания полнотекстовых электронных материалов, которая
была бы свободна от этих недостатков. Мы считаем, что способы размещения,
индексирования и поиска электронных документов, построенные на принципах
библиотечных технологий, являются наиболее удобными, т.к. библиотечный
поиск для документов естественен и привычен со времен обучения в школе.
Важно отметить, что уже несколько тысяч библиотек мира используют эти
технологии для создания своих полнотекстовых баз данных. В основу этих
технологий положено использование возможностей протокола Z39.50, разработанного
в библиотеке Конгресса США. Этот подход позволяет осуществлять поиск электронных
материалов с помощью единого поискового механизма (аналогичного поиску
в бумажных библиотечных каталогах), что освобождает читателя от необходимости
осваивать множество поисковых алгоритмов различных сайтов и порталов.
В
Институте математики и информационных технологий Омского государственного
университета разработана система, удовлетворяющая вышеизложенным принципам.
В основу системы положена идея создания электронных версий научных статей,
книг, учебно-методических пособий и т. п. самим автором, без привлечения
к этой работе профессиональных программистов, и размещения информации
о созданном материале в библиотечном каталоге без привлечения профессиональных
работников библиотек (каталогизаторов). При разработке этой системы авторы
стремились найти компромисс между набором функций, которые следует вложить
в инструментальные возможности системы, и легкостью ее освоения, внедрения
и эксплуатации.
Разработанная система включает в себя два АРМа: АРМ «Автор» и АРМ «Администратор».
АРМ «Автор» предназначен для создания полнотекстовых документов и размещения
их на веб-сервере. При создании этого АРМа ставились следующие граничные
условия: автор не должен быть профессиональным программистом, наоборот,
от него требуются минимальные навыки работы с текстовым редактором: умение
пользоваться наиболее простыми средствами операционной системы: найти
необходимую папку, выделить фрагмент текста, и т.п. Этими навыками, на
сегодняшний день, владеет большинство пользователей компьютера.
При работе над текстовым документом автор
может кроме собственно набора текста (с использованием различных шрифтов)
вставлять в любые места текста фотографии или другие изображения, формулы,
графики и т.п., гиперссылки на другие подобные документы, гиперссылки
на аудио и видеоролики. Таким образом, у автора есть возможность создать
достаточно полный по своему содержанию документ с использованием практически
всех доступных на данный момент информационных технологий. АРМ «Автор»
позволяет создавать не только новые электронные документы, но и создавать
электронные версии документов, которые были опубликованы ранее в печатных
изданиях. При создании документов можно использовать большинство распространенных
форматов: txt, doc, pdf, djv.
Для решения задачи каталогизации созданного
материала по принципам библиотечных технологий было сделано следующее.
В процессе работы над документом, АРМ предлагает автору заполнить следующие
поля: заглавие работы, ФИО автора (авторов), краткую аннотацию, ключевые
слова, год публикации. Данные из этих полей используются для процесса
автоматической каталогизации, которая происходит без участия автора. Т.е.
автору не нужно обращаться к библиотечным специалистам (каталогизаторам),
от него требуется лишь поставить значок (галочку) в соответствующем поле
«запрос на каталогизацию» в тот момент, когда он сочтет свой документ
готовым к публикации. Кроме этого, автору дается возможность выбрать тот
электронный каталог, который, по его мнению, является наиболее подходящим
для размещения электронной карточки создаваемого документа.
Для работы с этим АРМом автор должен получить
от администратора системы логин и пароль к своей учетной записи. В рамках
работы своей учетной записи автор получает доступ ко всем документам,
относящимся к этой учетной записи. Автор может просматривать, редактировать
и удалять эти документы. С помощью этого АРМа автор может самостоятельно
осуществить электронную публикацию своих материалов, не затрачивая своего
времени на поиски и привлечение к этой работе специалистов другого профиля:
программистов, библиотекарей, типографии. И его работа будет доступна
для поиска и чтения с помощью унифицированных средств поиска, соответствующим
общемировым стандартам.
АРМ
«Администратор» предназначен для управления учетными записями авторов,
управления списком электронных каталогов, запуска процесса автоматической
каталогизации новых и измененных в последнее время материалов и анализа
статистики содержимого электронных каталогов. Пользуясь этим АРМом, администратор
может добавлять новые учетные записи авторов, удалять или менять существующие,
менять пароли для доступа к учетным записям. В АРМ «Администратор» встроены
функции для создания электронных каталогов. В зависимости от потребностей
организации, в которой установлена данная система, может быть использован
один или несколько каталогов. Логику распределения полнотекстовых материалов
по этим каталогам определяют сами авторы. Каждому каталогу задается название
(полное название на русском языке) и имя каталога (символическое имя,
написанное строчными латинскими буквами и/или цифрами, которое будет использовано
Z-клиентами для соединения с данным каталогом). Например, в Институте
математики и информационных технологий на данный момент создана и используется
такая структура каталогов:
- ege – ЕГЭ по математике
- ethno – Полнотекстовые материалы по
этнографии
- ptd – Полнотекстовые статьи и книг
Также на администратора возложены функции
модератора структур данных, в которые включаются создаваемые авторами
документы, поступающие для каталогизации. В АРМ «Администратор» включены
функции для просмотра документов, созданных или измененных в последнее
время. С их помощью администратор может принять решение о публикации документов
или отправки их на доработку. Выбрав документы, которые удовлетворяют
правилам оформления, принятым в данной организации (эти правила для своих
авторов устанавливает сама организация), администратор может опубликовать
их. После этого все документы, имеющие статус опубликованных, будут доступны
через Интернет. Одновременно с публикацией происходит автоматическая каталогизация
выбранных документов, и созданные в результате нее электронные карточки
помещаются в соответствующие электронные каталоги. После этого читатели
смогут получить эти электронные карточки при помощи Z-клиента, в каждой
электронной карточке будет содержаться ссылка на полный текст данного
материала. Статистический раздел АРМа «Администратор» содержит информацию
о количестве опубликованных документов в каждом из каталогов системы,
количестве документов, предложенных к публикации, измененных документов,
а также документов, находящихся в работе.
Созданное программное обеспечение относится
к классу клиент-серверных систем. Для ее работы на стороне сервера необходимы
следующие компоненты:
- - операционная система,
- - веб-сервер,
- - СУБД,
- - АРМ «Автор»,
- - АРМ «Каталогизатор»,
- - Z-сервер.
В случае,
когда данная система используется внутри локальной сети, и у ее пользователей
нет реальных IP-адресов, она должна быть дополнена программным обеспечением
Z-прокси, которое решит проблему передачи данных между Z-сервером и Z-клиентами.
©
авторы
|
|