IBM Parallel Sysplex - IBM Parallel Sysplex

В вычислений, Parallel Sysplex представляет собой кластер из мэйнфреймы IBM , действующих вместе , как единый образ системы с г / OS . Parallel Sysplex, используемый для аварийного восстановления, сочетает в себе совместное использование данных и параллельные вычисления, позволяя кластеру из 32 систем совместно использовать рабочую нагрузку для обеспечения высокой производительности и доступности .

Sysplex

В 1990 году мэйнфреймы IBM представили концепцию системного комплекса , обычно называемого Sysplex , с MVS / ESA SPV4.1. Это позволяет авторизованным компонентам в восьми логических разделах (LPAR) связываться и взаимодействовать друг с другом с использованием протокола XCF .

Компоненты Sysplex включают:

  • Общий источник времени для синхронизации часов всех систем-участников. Это может включать в себя таймер Sysplex (модель 9037) или протокол времени сервера (STP).
  • Глобальная сериализация ресурсов (GRS), которая позволяет нескольким системам одновременно получать доступ к одним и тем же ресурсам, сериализуя, где это необходимо, для обеспечения монопольного доступа
  • Cross System Coupling Facility ( XCF ), который позволяет системам обмениваться данными в одноранговой сети
  • Парные наборы данных (CDS)

В число пользователей (базового) Sysplex входят:

  • Консольные сервисы - позволяют объединить несколько консолей MCS из разных членов Sysplex, обеспечивая единый образ системы для операций
  • Диспетчер автоматического перезапуска (ARM) - политика для прямого автоматического перезапуска неудачных заданий или запущенных задач в той же системе, если она доступна, или в другом LPAR в Sysplex
  • Sysplex Failure Manager (SFM) - Политика, которая определяет автоматические действия, которые необходимо предпринять при возникновении определенных сбоев, таких как потеря члена Sysplex или при перенастройке систем.
  • Workload Manager (WLM) - управление производительностью гетерогенных рабочих нагрузок на основе политик в одном или нескольких образах z / OS или даже в AIX.
  • Глобальная сериализация ресурсов (GRS) - Связь - позволяет использовать ссылки XCF вместо выделенных каналов для GRS и динамических RNL.
  • Tivoli OPC - поддержка горячего резервирования для контроллера
  • RACF (программный продукт IBM для обеспечения безопасности мэйнфреймов) - общесистемные команды RVARY и SETROPTS
  • Обмен файлами PDSE
  • Мультисистема VLFNOTE, SDUMP, SLIP, DAE
  • Resource Measurement Facility (RMF) - Отчетность в масштабе всей системы
  • CICS - использует XCF для обеспечения лучшей производительности и времени отклика, чем использование VTAM для маршрутизации транзакций и доставки функций.
  • zFS - Использование связи XCF для доступа к данным в нескольких LPAR

Параллельный сисплекс

Схематическое изображение параллельного сисплекса

Параллельный сисплекс был представлен с добавлением средства связи (CF) с соединительными линиями для высокоскоростной связи с поддержкой операционной системы MVS / ESA V5.1 вместе с моделями мэйнфреймов в апреле 1994 года.

Средство связи (CF) может находиться на выделенном автономном сервере, сконфигурированном с процессорами, которые могут запускать управляющий код средства связи (CFCC), в качестве интегральных процессоров на самих мэйнфреймах, настроенных как ICF (внутренние средства связи), или, реже, как обычные LPAR. CF содержит структуры Lock, List и Cache для помощи в сериализации, передаче сообщений и согласованности буфера между несколькими LPAR.

Основная цель Parallel Sysplex - предоставить возможности совместного использования данных, позволяя нескольким базам данных выполнять прямое чтение и запись в совместно используемые данные. Это может дать преимущества

  • Помогите устранить единые точки отказа в сервере, LPAR или подсистемах
  • Доступность приложения
  • Единый образ системы
  • Динамическая балансировка сеанса
  • Динамическая маршрутизация транзакций
  • Масштабируемая емкость

Базы данных, работающие на сервере System z, которые могут воспользоваться этим, включают:

Другие компоненты могут использовать средство сопряжения, чтобы помочь с управлением системой, производительностью или снижением требований к оборудованию. Называется «Совместное использование ресурсов» и использует:

  • Каталог - общие каталоги для повышения производительности за счет сокращения операций ввода-вывода для набора данных каталога на диске.
  • CICS - Использование CF для предоставления возможностей совместного использования и восстановления для именованных счетчиков, таблиц данных или переходных данных
  • DFSMShsm - балансировка рабочей нагрузки для рабочей нагрузки миграции данных
  • GRS Star - снижение производительности ЦП и времени отклика при выделении набора данных.

Tape Switching использует структуру GRS для обеспечения совместного использования ленточных накопителей между образами z / OS.

  • Динамическое управление CHPID (DCM) и управление приоритетами ввода-вывода
  • JES2 Checkpoint - обеспечивает улучшенный доступ к мультисистемной контрольной точке.
  • Operlog / Logrec - Объединенные мультисистемные журналы для управления системой
  • RACF - общий набор данных для упрощения управления безопасностью в Parallel Sysplex
  • WebSphere MQ - общие очереди сообщений для обеспечения доступности и гибкости
  • WLM - обеспечивает поддержку Intelligent Resource Director (IRD) для расширения z / OS Workload Manager, помогая управлять ресурсами ЦП и ввода-вывода в нескольких разделах LPAR в Parallel Sysplex. Функции включают управление процессором LPAR, IRD.

Многосистемное управление анклавом для повышения производительности

  • XCF Star - снижение требований к оборудованию и упрощенное управление трактами связи XCF

Основные компоненты Parallel Sysplex включают:

  • Оборудование Coupling Facility (CF или ICF), позволяющее нескольким процессорам совместно использовать, кэшировать, обновлять и балансировать доступ к данным;
  • Таймеры Sysplex или протокол серверного времени для синхронизации часов всех систем-членов;
  • Высокая скорость, высокое качество, резервирование кабелей;
  • Программное обеспечение ( службы операционной системы и, как правило, промежуточное ПО, такое как DB2 ).

Средство связи может быть либо выделенной внешней системой (небольшой мэйнфрейм, например System z9 BC, специально сконфигурированным только с процессорами средства связи), либо встроенными процессорами на самих мэйнфреймах, сконфигурированными как ICF (внутренние средства связи). Рекомендуется использовать хотя бы один внешний CF в параллельном сисплексе. Рекомендуется, чтобы Parallel Sysplex имел по крайней мере два CF и / или ICF для избыточности, особенно в среде совместного использования производственных данных. Протокол времени сервера (STP) заменил таймеры Sysplex начиная с 2005 г. для моделей мэйнфреймов System z z990 и новее. Таймер Sysplex - это физически отдельная часть оборудования от мэйнфрейма, тогда как STP является неотъемлемой частью микрокода мэйнфрейма. С помощью STP и ICF можно построить полную установку Parallel Sysplex с двумя подключенными мэйнфреймами. Более того, один мэйнфрейм может содержать внутренний эквивалент полного физического Parallel Sysplex, полезного для тестирования и разработки приложений.

Журнал IBM Systems Journal посвятил полный выпуск всем технологическим компонентам.

Серверный протокол времени

В компьютерных системах важно поддерживать точное время. Например, в системе обработки транзакций процесс восстановления восстанавливает данные транзакции из файлов журнала. Если для регистрации данных транзакции используются отметки времени, а отметки времени двух связанных транзакций переносятся из фактической последовательности, то восстановление базы данных транзакций может не соответствовать состоянию до процесса восстановления. Серверный протокол времени (STP) может использоваться для предоставления единого источника времени между несколькими серверами. На основе концепций сетевого протокола времени один из серверов System z назначается HMC в качестве основного источника времени (Stratum 1). Затем он отправляет временные сигналы на серверы Stratum 2 с помощью соединительных каналов. Серверы Stratum 2, в свою очередь, отправляют временные сигналы серверам Stratum 3. Чтобы обеспечить доступность, один из серверов может быть назначен в качестве источника времени резервного копирования, а третий сервер может быть назначен в качестве арбитра, чтобы помочь Резервному серверу времени определить, следует ли ему выполнять роль основного во время исключительных ситуаций.

STP доступен на серверах System z с 2005 года.

Дополнительная информация о STP доступна в «Руководстве по планированию протокола времени сервера».

Географически распределенный параллельный сисплекс

Географически распределенный параллельный сисплекс ( GDPS ) - это расширение параллельного сисплекса мэйнфреймов, потенциально расположенных в разных городах. GDPS включает конфигурации для одного или нескольких сайтов:

  • GDPS HyperSwap Manager: он основан на технологии синхронного однорангового удаленного копирования (PPRC) для использования в одном центре обработки данных. Данные копируются с основного запоминающего устройства на вспомогательное запоминающее устройство. В случае отказа основного устройства хранения система автоматически делает вторичное устройство хранения основным, обычно без прерывания работы приложений.
  • GDPS Metro: он основан на технологии синхронного зеркалирования данных (PPRC), которая может использоваться на мэйнфреймах на расстоянии 200 километров (120 миль) друг от друга. В двухсистемной модели оба сайта можно администрировать, как если бы они были одной системой. В случае отказа системы или устройства хранения восстановление может происходить автоматически с ограниченной потерей данных или без нее.
  • GDPS Global - XRC: основан на технологии асинхронного расширенного удаленного копирования (XRC) без ограничений по расстоянию. XRC копирует данные на устройствах хранения между двумя сайтами, так что в случае сбоя может быть потеряно всего несколько секунд данных. Если сбой все же происходит, пользователь должен инициировать процесс восстановления. После запуска процесс восстановления с вторичных запоминающих устройств и реконфигурации систем происходит автоматически.
  • GDPS Global - GM: основан на асинхронной технологии IBM Global Mirror без ограничений по расстоянию. Он предназначен для восстановления после полного отказа на одном объекте. Он активирует вторичные устройства хранения и системы резервного копирования.
  • GDPS Metro Global - GM: это конфигурация для систем с более чем двумя системами / площадками для аварийного восстановления. Он основан на GDPS Metro совместно с GDPS Global - GM.
  • GDPS Metro Global - XRC: это конфигурация для систем с более чем двумя системами / площадками для аварийного восстановления. Он основан на GDPS Metro совместно с GDPS Global - XRC.
  • Непрерывная доступность GDPS: это решение для аварийного восстановления / непрерывной доступности, основанное на двух или более сайтах, разделенных неограниченным расстоянием, работающих с одними и теми же приложениями и имеющими одни и те же данные для обеспечения балансировки нагрузки между сайтами. IBM Multi-site Workload Lifeline, благодаря своему мониторингу и маршрутизации рабочих нагрузок, играет важную роль в решении GDPS Continuous Availability.

Смотрите также

Рекомендации

внешняя ссылка