The 12 reference contexts in paper V. Serebryakov A., O. Shorin N., Владимир Серебряков Алексеевич, Олег Шорин Николаевич (2014) “Проблемы семантической интеграции библиотечных данных // Problems of Semantic Integration of Library Data” / spz:neicon:bibliotekovedenie:y:2014:i:5:p:41-47

  1. Start
    5333
    Prefix
    Например, имея данные о наличии и стоимости книги в разных книжных магазинах, а также информацию о расположении и часах работы этих магазинов, человек способен сделать выбор и купить необходимую ему книгу по оптимальной цене в близлежащем работающем магазине. К сожалению, автоматизировать этот процесс в терминах гипертекста чрезвычайно сложно
    Exact
    [4]
    Suffix
    . Для оперирования данными необходимо было решить несколько ключевых вопросов: • каким образом обеспечить доступ к данным, для того чтобы их можно было повторно использовать; • как должно происходить обнаружение данных, связанных с уже имеющимися данными; r2_#5_14.indd 42r2_#5_14.indd 4230.10.2014 11:55:3630.10.2014 11:55:36 • как приложения должны интегрировать разнородные данные, по
    (check this in PDF content)

  2. Start
    5788
    Prefix
    вопросов: • каким образом обеспечить доступ к данным, для того чтобы их можно было повторно использовать; • как должно происходить обнаружение данных, связанных с уже имеющимися данными; r2_#5_14.indd 42r2_#5_14.indd 4230.10.2014 11:55:3630.10.2014 11:55:36 • как приложения должны интегрировать разнородные данные, полученные из большого числа заранее неопределенных источников
    Exact
    [7]
    Suffix
    . Необходимо было придумать механизмы поиска, доступа, интеграции и использования данных. В 2006 г. Т. Бернерс-Ли сформулировал четыре основных принципа связанных данных: • применение универсальных идентификаторов URI в качестве имен сущностей; • применение HTTP URI для реализации возможности обращения по именам, для того чтобы они могли быть найдены как людьми, так и программными системам
    (check this in PDF content)

  3. Start
    6361
    Prefix
    применение универсальных идентификаторов URI в качестве имен сущностей; • применение HTTP URI для реализации возможности обращения по именам, для того чтобы они могли быть найдены как людьми, так и программными системами; • предоставление полезной информации о сущности при обращении по URI, используя стандартизованные форматы; • включение ссылок на другие cвязанные URI для облегчения поиска
    Exact
    [3]
    Suffix
    . С целью реализации этих принципов было предложено использовать модель представления данных RDF (Resource Description Framework), пригодную для машинной обработки. Структурно выражения в RDF являются триплетами.
    (check this in PDF content)

  4. Start
    6758
    Prefix
    Структурно выражения в RDF являются триплетами. Каждый триплет состоит из субъекта, предиката и объекта. Выражение RDF-триплета означает, что отношение, указанное предикатом, связывает предметы, обозначенные как субъект и объект
    Exact
    [10]
    Suffix
    . Например, предикат «является автором» может связывать субъект «Достоевский» и объект «Преступление и наказание». Основная идея RDF состоит в том, чтобы показать взаимосвязь одних данных с другими.
    (check this in PDF content)

  5. Start
    8770
    Prefix
    Для выражения семантики используются словари, таксономии и онтологии, которые задаются с использованием языков RDFS (RDF Vocabulary Description Language), SKOS (Simple Knowledge Organization System) и OWL (Web Ontology Language) соответственно
    Exact
    [9]
    Suffix
    . SKOS представляет собой словарь иерархически организованных терминов, а RDFS и OWL являются словарями для описания концептуальных свойств в терминах классов, свойств, экземпляров, классов и операций.
    (check this in PDF content)

  6. Start
    10662
    Prefix
    (рефератом), шифром хранения документа, дополнительными точками доступа, сведениями о связи с другими библиографическими записями и другой дополнительной информацией о документе, обеспечивающей доr2_#5_14.indd 43r2_#5_14.indd 4330.10.2014 11:55:3630.10.2014 11:55:36 БВ 44 БВ Доступ к информации ступ к нему, датой завершения обработки документа, сведениями служебного характера»
    Exact
    [2]
    Suffix
    . С точки зрения связанных данных библиографические записи представляют огромный интерес, поскольку хранящаяся в них информация взаимосвязана: авторы связаны со своими произведениями, сериальные издания связаны друг с другом через общую часть, издательства имеют непосредственное отношение к изданным ими книгам и т. д.
    (check this in PDF content)

  7. Start
    11449
    Prefix
    В частности, одним из первых проектов в этом направлении являлась инициатива Библиотеки Конгресса США, в рамках которой было опубликовано более 260 тыс. авторитетных записей. Следует отметить также проект создания Виртуального международного авторитетного файла (Virtual International Authority File), в котором участвуют более 35 национальных библиотек
    Exact
    [11]
    Suffix
    . Целью проекта является сопоставление одних и тех же авторитетных записей из различных библиотек мира. Наиболее амбициозным можно смело назвать проект The Open Library, поскольку его конечной целью является создание отдельной веб-страницы для каждой выпущенной книги.
    (check this in PDF content)

  8. Start
    12340
    Prefix
    Основная цель этого этапа — обеспечение свободного, равного и всеобщего доступа граждан России к документной информации историко-культурного, научного и образовательного назначения через Интернет, предоставляемой на основе единой общенациональной системы создания и эффективного использования цифровых библиотечно-информационных ресурсов и сервисов
    Exact
    [1]
    Suffix
    . Для достижения поставленной цели необходимо решить следующие задачи: • формирование распределенного фонда, в состав которого будут входить актуальные научные и образовательные материалы, востребованные жителями страны произведения, социально значимая информация; • обеспечение доступа к распределенному цифровому фонду путем создания единой точки доступа, предоставляющей развитый набор сервисов
    (check this in PDF content)

  9. Start
    14498
    Prefix
    В рамках реализации программной системы должны быть решены некоторые принципиальные задачи. 1. Разработка онтологии предметной области на базе существующих решений. При создании онтологии предметной области необходимо максимально использовать термины из широко используемых словарей
    Exact
    [6]
    Suffix
    . Такой подход значительно снижает вероятность того, что для существующих программных систем может потребоваться дополнительная конвертация данных или даже изменение приложения. Следует изучить проекты Библиотеки Конгресса США, прежде всего стандарт METS представления описательных, административных и структурных метаданных цифровых библиотек, а также проект Europeana, который в качестве метада
    (check this in PDF content)

  10. Start
    14936
    Prefix
    Следует изучить проекты Библиотеки Конгресса США, прежде всего стандарт METS представления описательных, административных и структурных метаданных цифровых библиотек, а также проект Europeana, который в качестве метаданных использует стандарт Dublin Core
    Exact
    [8]
    Suffix
    . Немаловажным будет изучение опыта проекта Delos и документа Digital Library Reference Model. Необходимо также учитывать стандарт PRISM (Publishing Requirements for Industry Standard Metadata), разработанный издательствами для обмена метаданными о публикациях. 2.
    (check this in PDF content)

  11. Start
    17092
    Prefix
    Должны быть проанализированы несколько подходов: автоматическая конвертация MARC-данных в RDF-триплеты «на лету» для каждого запроса, хранение заранее сконвертированных данных в реляционной базе данных, хранение данных в специализированном хранилище триплетов. Каждый из подходов имеет свои преимущества и недостатки
    Exact
    [5]
    Suffix
    . Например, автоматическая конвертация данных по каждому запросу не приводит к их дублированию, но требует реализации сложной логики и будет обладать низкой производительностью. Хранение же триплетов, в свою очередь, является причиной дублирования данных.
    (check this in PDF content)

  12. Start
    18319
    Prefix
    По правилам публикации данных в LOD новые сущности должны ссылаться на уже опубликованные наборы. Для этого необходимо будет исследовать уже опубликованные массивы данных на предмет возможности использования их в качестве субъектов в RDF-триплетах
    Exact
    [12]
    Suffix
    . Следует провести анализ имеющихся механизмов публикации данных в LOD, выбрать наиболее подходящие для поставленной задачи и осуществить публикацию с их использованием. Необходимо будет создать также точку доступа SPARQL к данным и обертки вокруг нее в виде обычного веб-сервера. 7.
    (check this in PDF content)