Система ручек - Handle System

Handle система является Корпорацией национальных исследовательских инициатив «ы собственного реестра назначая постоянные идентификаторы , или ручки , к информационным ресурсам, а также для решения„этих ручек в информацию , необходимую для поиска, доступ, а также иным образом использовать ресурсы“.

Как и в случае с дескрипторами, используемыми в других местах в вычислениях, дескрипторы системы дескрипторов непрозрачны и не кодируют информацию о базовом ресурсе, будучи привязанными только к метаданным, относящимся к ресурсу. Следовательно, дескрипторы не становятся недействительными при изменении метаданных.

Система была разработана Бобом Каном из Корпорации национальных исследовательских инициатив (CNRI). Первоначальная работа финансировалась Агентством перспективных исследовательских проектов Министерства обороны (DARPA) в период с 1992 по 1996 год как часть более широкой структуры для распределенных сервисов цифровых объектов и, таким образом, была одновременной с ранним развертыванием Всемирной паутины с аналогичными целями.

Система управления была впервые реализована осенью 1994 года, а администрирование и управление ею осуществлялось CNRI до декабря 2015 года, когда был введен новый режим работы с несколькими основными администраторами (MPA). DONA Foundation теперь управляет Реестром Global Handle Registry и аккредитует MPA, включая CNRI и International DOI Foundation. В настоящее время система обеспечивает базовую инфраструктуру для таких систем на основе дескрипторов, как идентификаторы цифровых объектов и DSpace , которые в основном используются для обеспечения доступа к научным, профессиональным и правительственным документам и другим информационным ресурсам.

CNRI предоставляет спецификации и исходный код для эталонных реализаций серверов и протоколов, используемых в системе, в рамках бесплатной «Общественной лицензии», аналогичной лицензии с открытым исходным кодом.

В настоящее время работают тысячи сервисов управления. Более 1000 из них находятся в университетах и ​​библиотеках, но они также работают в национальных лабораториях, исследовательских группах, государственных учреждениях и коммерческих предприятиях, получая более 200 миллионов запросов на разрешение в месяц.

Характеристики

Система управления определена в информационных RFC 3650, 3651 и 3652 Инженерной группы Интернета (IETF) ; он включает открытый набор протоколов, пространство имен и эталонную реализацию протоколов. Документация, программное обеспечение и сопутствующая информация предоставлены CNRI на специальном веб-сайте.

Дескрипторы состоят из префикса, который определяет «орган по присвоению имен», и суффикса, который дает «локальное имя» ресурса. Как и в случае с доменными именами, префиксы выдаются агентствам по присвоению имен одним из «многоцелевых администраторов» системы после уплаты сбора, которая должна обновляться ежегодно. Агентство по присвоению имен может создать любое количество дескрипторов с уникальными «локальными именами» в пределах назначенных им префиксов. Пример ручки:

  • 20.1000/100
  • 10.1000/182

В первом примере, который является дескриптором лицензии на программное обеспечение HANDLE.NET, 20.1000является префикс, назначенный органу присвоения имен (в данном случае самому Handle.net), и 100является локальным именем в этом пространстве имен. Локальное имя может состоять из любых символов из набора символов Unicode UCS-2 . Префикс также состоит из любых символов UCS-2, кроме «/». Префиксы состоят из одного или нескольких сегментов органов управления именами, разделенных точками, что представляет собой иерархию органов управления именами. Таким образом, в примере 20используется префикс центра присвоения имен для CNRI, в то время как он 1000обозначает подчиненный орган именования в пределах префикса 20. Другими примерами префиксов верхнего уровня для федеративных органов управления именами DONA Foundation являются 10дескрипторы DOI; 11для ручек, присвоенных ITU ; 21для ручек, выпущенных немецким Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG), научным вычислительным центром Геттингенского университета ; и 86для Коалиции услуг по обслуживанию - Китай. Старые «унаследованные» префиксы, выпущенные CNRI до того, как была учреждена структура «многоосновного администратора» (MPA), обычно состоят из четырех из пяти цифр, как во втором примере выше, дескриптор, администрируемый Лестерским университетом . Все префиксы должны быть зарегистрированы в Global Handle Registry через утвержденного DONA Foundation регистратора, как правило, за определенную плату.

Как и в других случаях использования дескрипторов в вычислениях, дескриптор непрозрачен; то есть он не кодирует информацию о базовом ресурсе и предоставляет только средства для извлечения метаданных о ресурсе.

Этому можно противопоставить унифицированный указатель ресурса (URL), который может кодировать в идентификаторе такие атрибуты ресурса, как протокол, который будет использоваться для доступа к серверу, содержащему ресурс, имя хоста сервера и номер порта и, возможно, даже местоположение. особенности, такие как имя файла в файловой системе сервера, содержащего ресурс. В системе дескрипторов эти особенности не закодированы в дескрипторе, а находятся в метаданных, к которым привязан дескриптор.

Метаданные могут включать в себя многие атрибуты информационного ресурса, такие как его местонахождение, формы, в которых он доступен, типы предлагаемого доступа (например, «бесплатный» или «платный») и кому. Обработка метаданных для определения того, как и где должен быть получен доступ к ресурсу, и предоставление ресурса пользователю выполняются на отдельном этапе, называемом «разрешение», с использованием Resolver, сервера, который может отличаться от те, которые участвуют в обмене дескриптором метаданных. В отличие от URL-адресов, которые могут стать недействительными, если встроенные в них метаданные становятся недействительными, дескрипторы не становятся недействительными и не нуждаются в изменении при изменении местоположения или других атрибутов метаданных. Это помогает предотвратить гниение ссылок , поскольку изменения информационного ресурса (например, местоположения) нужно отражать только в изменениях метаданных, а не в изменениях каждой ссылки на ресурс.

У каждого дескриптора может быть свой собственный администратор, и администрирование дескрипторов может осуществляться в распределенной среде, аналогичной доменным именам DNS. Привязки имени к значению также могут быть защищены как с помощью подписей для проверки данных, так и с помощью ответа на запрос для проверки передачи данных, что позволяет использовать дескрипторы в приложениях доверительного управления.

Один и тот же базовый информационный ресурс может быть связан с несколькими дескрипторами, как если бы две университетские библиотеки генерировали дескрипторы (и, следовательно, возможно, разные наборы метаданных) для одной и той же книги.

Система дескрипторов совместима с системой доменных имен (DNS), но не требует этого, в отличие от постоянных идентификаторов, таких как PURL или ARK , которые похожи на дескрипторы, но используют доменные имена. Однако, в отличие от этих подходов, основанных на доменных именах, дескрипторы требуют отдельного процесса регистрации префиксов и обрабатывают серверы отдельно от серверов доменных имен.

Ручки можно использовать изначально. или выражаются как универсальные идентификаторы ресурсов (URI) через пространство имен в схеме информационного URI ; например, 20.1000/100может быть записана в виде URI, info:hdl/20.1000/100. Некоторые пространства имен системы обработки, такие как идентификаторы цифровых объектов, сами по себе являются пространствами имен URI «info:»; например, info:doi/10.1000/182это другой способ записать дескриптор текущей версии Справочника DOI в виде URI.

Некоторые пространства имен Handle System определяют специальные правила представления. Например, идентификаторы объектов Digital , которые представляют собой высокий процент дошедших до ручки, как правило , представлены с «DOI:» префикс: doi:10.1000/182.

Любой дескриптор может быть выражен как унифицированный указатель ресурса (URL) с использованием общего прокси-сервера HTTP :

Некоторые системы на основе дескрипторов предлагают прокси-сервер HTTP, который предназначен для использования с их собственной системой, например:

Выполнение

Реализация системы дескрипторов состоит из служб локальных дескрипторов, каждая из которых состоит из одного или нескольких сайтов, которые предоставляют серверы, хранящие определенные дескрипторы. Глобальный реестр дескрипторов - это уникальная служба локальных дескрипторов, которая хранит информацию о префиксах (также известных как органы именования) в системе дескрипторов и может запрашивать, чтобы узнать, где хранятся определенные дескрипторы в других сервисах локальных дескрипторов в этой распределенной системе.

Веб-сайт Handle System предоставляет ряд инструментов для реализации, в частности, программное обеспечение HANDLE.NET и клиентские библиотеки HANDLE.NET. Клиенты Handle могут быть встроены в программное обеспечение конечного пользователя (например, веб-браузер) или в серверное программное обеспечение (например, веб-сервер), а расширения уже доступны для Adobe Acrobat и Firefox .

Библиотеки клиентского программного обеспечения Handle доступны как на C, так и на Java. Некоторые приложения разработали специальные дополнительные инструменты, например, для системы DOI.

Совместимая сеть распределенных серверов распознавателей дескрипторов (также известных как система прокси-серверов) связана через глобальный распознаватель (который является одним логическим объектом, хотя физически децентрализован и зеркалирован). Пользователи технологии Handle System получают префикс дескриптора, созданный в глобальном реестре дескрипторов. Глобальный реестр дескрипторов поддерживает и разрешает префиксы локально обслуживаемых сервисов дескрипторов. Следовательно, любая служба локальных дескрипторов может разрешить любой дескриптор через глобальный преобразователь.

Дескрипторы (идентификаторы) передаются клиентом в виде запроса органа присвоения имен / префикса в глобальный реестр дескрипторов (GHR) системы обработки. GHR отвечает, отправляя клиенту информацию о местоположении для соответствующей службы локальной обработки (которая может состоять из нескольких серверов на нескольких сайтах); затем запрос отправляется на соответствующий сервер в рамках службы локальной обработки. Служба локальной обработки возвращает информацию, необходимую для получения ресурса, например URL-адрес, который затем может быть преобразован в перенаправление HTTP. (Примечание: если у клиента уже есть информация о соответствующей LHS для запроса, первоначальный запрос к GHR опускается)

Хотя исходная модель, из которой происходит система управления, имела дело с управлением цифровыми объектами, система управления не требует какой-либо конкретной модели отношений между идентифицированными объектами и не ограничивается идентификацией только цифровых объектов: могут быть представлены нецифровые объекты. как соответствующий цифровой объект для целей управления цифровым объектом. Требуется некоторая осторожность при определении таких объектов и того, как они соотносятся с нецифровыми объектами; существуют установленные модели, которые могут помочь в таких определениях, например, функциональные требования к библиографическим записям (FRBR) , CIDOC CRM и модель содержимого indecs . Некоторые приложения сочли полезным объединить такую ​​структуру с приложением-дескриптором: например, Инициатива Advanced Distributed Learning (ADL) объединяет приложение Handle System с существующими стандартами для распределенного учебного контента, используя эталонную модель объекта совместно используемого контента (SCORM). , а реализация системы идентификаторов цифровых объектов (DOI) для Handle System приняла ее вместе со структурой indecs для обеспечения семантической совместимости .

Система управления также ясно указывает на важность приверженности организации схеме постоянных идентификаторов, но не требует наличия одной модели для обеспечения такой приверженности. Отдельные приложения могут установить свои собственные наборы правил и социальную инфраструктуру для обеспечения устойчивости (например, при использовании в приложении DSpace и приложении DOI).

Принципы дизайна

Система Handle разработана с учетом следующих требований для обеспечения устойчивости.

Строка идентификатора:

  • не основан на каких-либо изменяемых атрибутах объекта (местонахождение, владение или любой другой атрибут, который может измениться без изменения личности референта);
  • непрозрачен (предпочтительно «тупое число»: хорошо известный шаблон предполагает предположения, которые могут вводить в заблуждение, а значимая семантика может не переводиться на разные языки и может вызывать конфликты товарных знаков);
  • уникальна в системе (чтобы избежать коллизий и ссылочной неопределенности);
  • имеет необязательные, но неплохие функции, которые должны поддерживаться (читаемые человеком, с возможностью вырезания и вставки, встраиваемые; подходит для общих систем, например, спецификации URI).

Механизм разрешения идентификатора:

  • является надежным (с использованием избыточности, без единой точки отказа и достаточно быстрым, чтобы не показаться сломанным);
  • масштабируемость (более высокие нагрузки просто управляются большим количеством компьютеров);
  • гибкий (может адаптироваться к изменяющимся вычислительным средам; полезен для новых приложений):
  • пользуется доверием (и у разрешения проблем, и у администрации есть методы технического доверия; эксплуатирующая организация привержена долгосрочным планам);
  • строится на открытой архитектуре (поощряя усилия сообщества по созданию приложений в инфраструктуре);
  • прозрачен (пользователям не нужно знать подробности инфраструктуры).

Приложения

К объектам, которые в настоящее время идентифицируются ручками, относятся журнальные статьи, технические отчеты, книги, диссертации, правительственные документы, метаданные, распределенный учебный контент и наборы данных. Ручки используются в приложениях для создания цифровых водяных знаков, приложениях GRID, репозиториях и многом другом. Хотя отдельные пользователи могут загружать и использовать программное обеспечение HANDLE.NET независимо, многие пользователи сочли полезным сотрудничать в разработке приложений в федерации, используя общую политику или дополнительные технологии для предоставления общих служб. Как одна из первых схем постоянных идентификаторов, система обработки была широко принята государственными и частными учреждениями и проверена на протяжении нескольких лет. (См. Парадигма, Постоянные идентификаторы.)

Приложения Handle System могут использовать дескрипторы как простые постоянные идентификаторы (как наиболее часто используемые для разрешения текущего URL-адреса объекта) или могут использовать другие функции. Его поддержка одновременного возврата в виде вывода нескольких частей текущей информации, связанной с объектом, в определенных структурах данных, позволяет устанавливать приоритеты для порядка, в котором будут использоваться несколько разрешений. Таким образом, дескрипторы могут разрешаться для разных цифровых версий одного и того же контента, для зеркалирования сайтов или для разных бизнес-моделей (платный или бесплатный, безопасный или открытый, общедоступный или частный). Они также могут разрешить разные цифровые версии разного контента, например, сочетание предметов, необходимых для курса дистанционного обучения.

Сегодня действуют тысячи пунктов обслуживания в 71 стране на 6 континентах; более 1000 из них работают в университетах и ​​библиотеках. Сервисы Handle обслуживаются федерациями пользователей, национальными лабораториями, университетами, вычислительными центрами, библиотеками (национальными и местными), правительственными агентствами, подрядчиками, корпорациями и исследовательскими группами. Крупные издатели используют систему обработки для постоянной идентификации коммерчески продаваемого контента и контента открытого доступа посредством его реализации с системой идентификаторов цифровых объектов (DOI) .

Количество префиксов, которые позволяют пользователям назначать дескрипторы, растет и на начало 2014 года превысило 12 000. Существует шесть серверов глобального реестра верхнего уровня, которые получают (в среднем) 68 миллионов запросов на разрешение в месяц. Известные CNRI прокси-серверы, передающие запросы системе через Интернет, получают (в среднем) 200 миллионов запросов на разрешение в месяц. (Статистика из Handle Quick Facts.)

В 2010 году CNRI и ITU (Международный союз электросвязи) заключили соглашение о сотрудничестве в области использования системы управления (и архитектуры цифровых объектов в целом) и работают над конкретными деталями этого сотрудничества; в апреле 2009 года МСЭ назвал систему управления «новой тенденцией».

Лицензии и политика использования

Handle System, HANDLE.NET и Global Handle Registry являются товарными знаками Корпорации национальных исследовательских инициатив (CNRI), некоммерческой корпорации по исследованиям и разработкам в США. Система Handle является предметом патентов CNRI, которая лицензирует свою технологию Handle System через общедоступную лицензию, аналогичную лицензии с открытым исходным кодом, чтобы обеспечить более широкое использование технологии. Инфраструктура Handle System поддерживается за счет регистрации префиксов и платы за обслуживание, большинство из которых поступает от владельцев одного префикса. Самым крупным спонсором в настоящее время является Международный фонд DOI . Общественная лицензия позволяет коммерческое и некоммерческое использование по низкой цене как запатентованной технологии, так и эталонной реализации программного обеспечения, а также позволяет свободно встраивать программное обеспечение в другие системы и продукты. Соглашение об обслуживании также доступно для пользователей, которые намереваются предоставлять услуги идентификации и / или разрешения с использованием технологии Handle System в рамках общедоступной лицензии Handle System.

Связанные технологии

Система управления представляет собой несколько компонентов долгосрочной архитектуры цифровых объектов. В январе 2010 года CNRI выпустила универсальное программное обеспечение репозитория цифровых объектов, еще один важный компонент этой архитектуры. Доступна дополнительная информация о выпуске, включая спецификацию протокола, исходный код и готовую к использованию систему, клиенты и утилиты.

Смотрите также

Рекомендации

Внешние ссылки