RUS | ENG

Система обработки данных

ОБРАБОТКА ПЕРВИЧНЫХ ДАННЫХ

Необработанные данные с оптических модулей и мастер-модулей секций передаются по оптоволоконным кабелям сначала в центр кластера, а затем на Береговую станцию.

Программа по управлению кластером обрабатывает первичные данные и классифицирует на три различных типа записей: мастер-записи, сервисные записи и мониторные записи.

Мастер-записи содержат оцифрованные данные с оптических модулей с метаданными, такими как временные метки, адреса оптических модулей, информация о триггере и т. д.

Сервисные записи — информация о статической и динамической конфигурации кластера: количество кластеров, IP-адреса элементов телескопа, расположение секций и гирлянд. Данные динамической конфигурации описывают текущие номера сеансов и применяемую систему триггеров.

Мониторные записи состоят из рабочих параметров оптических модулей: напряжение ФЭУ, пороги срабатывания триггеров, температуры внутри модуля и распределения амплитуд сигналов.

Один кластер генерирует приблизительно 15 Гб данных в день. Данные сжимаются и передаются на серверы Объединенного института ядерных исследований в Дубне.

    
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ

Данные обрабатываются программой BARS (Baikal Analysis and Reconstruction Software). В основе ядра BARS лежит программный пакет MARS коллаборации MAGIC (используется с разрешения). Он, в свою очередь, построен на программном пакете ROOT.

BARS предназначен для работы в операционной системе Linux, и состоит в основном из классов C++ и макросов ROOT, каждый из которых выполняет конкретные задачи: 
             — распаковывает и читает файлы необработанных данных,
             — сортирует и фильтрует различные типы записей,
             — распределяет данные по секциям кластера или временным меткам,
             — извлекает информацию об импульсах,
             — реконструирует единые события из совпадающих по времени сигналов.

Результатом работы одного макроса обычно является ROOT-файл, который содержит входные данные для следующего и тем самым формирует цепочку задач обработки. Эта цепочка представляет собой полный цикл обработки данных. Для ежедневной обработки потока новых данных этот цикл запускается автоматически. Управляет ей специализированная система автоматизации на основе Python.