Сбор данных - Data collection
Сбор данных - это процесс сбора и измерения информации о целевых переменных в установленной системе, который затем позволяет ответить на соответствующие вопросы и оценить результаты. Сбор данных - это компонент исследования во всех областях обучения, включая физические и социальные науки , гуманитарные науки и бизнес . Хотя методы различаются в зависимости от дисциплины, акцент на обеспечении точного и честного сбора остается неизменным. Целью сбора всех данных является сбор качественных доказательств, которые позволяют анализу дать убедительные и достоверные ответы на поставленные вопросы. Сбор и проверка данных состоят из четырех этапов, когда они включают проведение переписи, и семи этапов, когда они включают выборку.
Независимо от области исследования или предпочтения определения данных ( количественных или качественных ), точный сбор данных имеет важное значение для поддержания целостности исследования. Выбор подходящих инструментов сбора данных (существующих, модифицированных или вновь разработанных) и подробных инструкций по их правильному использованию снижает вероятность ошибок .
Формальный процесс сбора данных необходим, поскольку он гарантирует, что собранные данные являются как определенными, так и точными. Таким образом, последующие решения, основанные на аргументах, воплощенных в выводах, принимаются с использованием достоверных данных. Этот процесс обеспечивает как основу для измерения, так и в некоторых случаях указание на то, что следует улучшить.
Существует 5 распространенных методов сбора данных:
- закрытые опросы и викторины,
- открытые опросы и анкеты,
- Индивидуальные интервью,
- фокус-группы и
- прямое наблюдение.
DMP и сбор данных
DMP - это аббревиатура от платформы управления данными. Это централизованная система хранения и анализа данных. DMP, в основном используемые маркетологами, существуют для компиляции и преобразования больших объемов данных в различимую информацию. Маркетологи могут захотеть получать и использовать первые, вторые и сторонние данные. DMP позволяют это сделать, потому что они представляют собой совокупную систему DSP (платформа на стороне спроса) и SSP (платформа на стороне предложения). Когда дело доходит до рекламы, DMP являются неотъемлемой частью оптимизации и направления маркетологов в будущих кампаниях. Эта система и ее эффективность являются доказательством того, что категоризированные, проанализированные и скомпилированные данные гораздо полезнее, чем необработанные данные.
Сбор данных на z / OS
z / OS - широко используемая операционная система для мэйнфреймов IBM . Он разработан, чтобы предложить стабильную, безопасную и постоянно доступную среду для приложений, работающих на мэйнфрейме. Рабочие данные - это данные, которые система z / OS производит при запуске. Эти данные указывают на работоспособность системы и могут использоваться для определения источников проблем с производительностью и доступностью в системе. Анализ операционных данных аналитическими платформами дает понимание и рекомендуемые действия для повышения эффективности работы системы, а также для решения или предотвращения проблем. IBM Z Common Data Provider собирает операционные данные ИТ из систем z / OS, преобразует их в расходный формат и передает их на аналитические платформы.
IBM Z Common Data Provider поддерживает сбор следующих рабочих данных:
- Данные средств управления системой (SMF)
- Данные журнала из следующих источников:
- Журнал заданий, вывод, который записывается в определение данных (DD) выполняющимся заданием.
- Файл журнала z / OS UNIX, включая системный журнал системных служб UNIX (syslogd)
- Кластер метода доступа к виртуальному хранилищу с последовательным входом (VSAM)
- системный журнал z / OS (SYSLOG)
- Сообщения IBM Tivoli NetView для z / OS
- Журнал IBM WebSphere Application Server для z / OS High Performance Extensible Logging (HPEL)
- Отчеты IBM Resource Measurement Facility (RMF) Monitor III
- Данные пользовательского приложения, операционные данные из собственных приложений пользователей
Проблемы целостности данных
Основная причина сохранения целостности данных - поддержка обнаружения ошибок в процессе сбора данных. Эти ошибки могут быть сделаны намеренно (преднамеренная фальсификация) или непреднамеренно ( случайные или систематические ошибки ).
Есть два подхода, которые могут защитить целостность данных и обеспечить научную достоверность результатов исследований, изобретенных Крэддиком, Кроуфордом, Роудсом, Редиканом, Рукенбродом и Лоусом в 2003 году:
- Гарантия качества - все действия, выполняемые перед сбором данных
- Контроль качества - все действия, выполняемые во время и после сбора данных
Гарантия качества
Его основное внимание уделяется предотвращению, которое в первую очередь является рентабельной деятельностью по защите целостности сбора данных. Стандартизация протокола лучше всего демонстрирует эту рентабельную деятельность, которая разработана в подробном и подробном руководстве по процедурам сбора данных. Риск не выявить проблемы и ошибки в процессе исследования, очевидно, вызван плохо написанными инструкциями. Перечислены несколько примеров таких сбоев:
- Неопределенность сроков, методов и определения ответственного лица
- Частичный список предметов, которые необходимо было забрать
- Расплывчатое описание инструментов сбора данных вместо строгих пошаговых инструкций по проведению тестов
- Неспособность распознать точное содержание и стратегии обучения и переподготовки сотрудников, ответственных за сбор данных
- Неясные инструкции по использованию, настройке и калибровке оборудования для сбора данных
- Нет заранее определенного механизма для документирования изменений в процедурах, которые происходят во время расследования.
Контроль качества
Поскольку действия по контролю качества происходят во время или после сбора данных, все детали тщательно документируются. Существует необходимость в четко определенной коммуникационной структуре в качестве предварительного условия для создания систем мониторинга. Неуверенность в потоке информации не рекомендуется, поскольку плохо организованная структура связи ведет к слабому мониторингу, а также может ограничивать возможности для обнаружения ошибок. Контроль качества также отвечает за идентификацию действий, необходимых для исправления неправильных методов сбора данных, а также за минимизацию таких случаев в будущем. Команда с большей вероятностью не осознает необходимость выполнения этих действий, если их процедуры написаны расплывчато и не основаны на обратной связи или образовании.
Проблемы со сбором данных, требующие незамедлительных действий:
- Систематические ошибки
- Нарушение протокола
- Мошенничество или нарушение научной этики
- Ошибки в отдельных элементах данных
- Проблемы с производительностью отдельных сотрудников или сайта
Смотрите также
использованная литература
внешние ссылки
- Статистическое бюро Гайаны , Арун Сукнарин