Уже более 60 лет ученые ищут в космосе возможные признаки радиопередачи, которые указывали бы на существование внеземного разума (ВЗР). За это время технология и методы значительно усовершенствовались, но самые большие проблемы остаются. Помимо того, что никогда не удавалось обнаружить радиосигнал внеземного происхождения, существует широкий спектр возможных форм, которые могла бы принять такая передача.
Короче говоря, исследователи SETI должны предположить, как будет выглядеть сигнал, но без каких-либо известных примеров. Недавно международная группа под руководством Калифорнийского университета в Беркли и Института SETI разработала новый инструмент машинного обучения, который моделирует, как может выглядеть сообщение от внеземного разума (ВЗР). Он известен как Setigen, библиотека с открытым исходным кодом, которая может стать переломным моментом для будущих исследований SETI.
Исследовательской группой руководил Брайан Бжицки, аспирант по астрономии Калифорнийского университета в Беркли. К нему присоединились Эндрю Симион, директор Исследовательского центра SETI в Беркли, и исследователи из Института SETI, Breakthrough Listen, Института астрономии и астрофизики имени Данлапа, Института космических наук и астрономии, Международного центра радиоастрономических исследований (ICRAR) и Института наук о данных имени Гергена.
С 1960-х годов наиболее распространенным методом SETI является поиск в космосе радиосигналов искусственного происхождения. Первым таким экспериментом был проект "Озма" (апрель - июль 1960 года), которым руководил известный корнельский астрофизик Фрэнк Дрейк (создатель уравнения Дрейка). В этом исследовании использовалась 25-метровая антенна Национальной радиоастрономической обсерватории в Грин-Бэнке, Западная Вирджиния, для наблюдения за Эпсилон Эридани и Тау Цети на частотах около 400 кГц в диапазоне 1,42 ГГц.
С тех пор эти поиски расширились и стали охватывать большие участки ночного неба, более широкие диапазоны частот и большее разнообразие сигналов. Как объяснил Бжицки:
"В 1960-х годах идея заключалась в том, чтобы сосредоточиться на области вокруг хорошо известной частоты, на которой нейтральный водород испускает излучение в межзвездном пространстве - 1,42 ГГц. Поскольку это естественное излучение распространено по всей галактике, идея заключалась в том, что любая разумная цивилизация будет знать о нем и, возможно, выберет эту частоту для передачи, чтобы максимизировать вероятность обнаружения. С тех пор, особенно в связи с быстрым развитием технологий, радио диапазон SETI расширилось по всем направлениям измерений.
"Теперь мы можем проводить измерения в диапазоне частот в несколько гигагерц мгновенно. По мере совершенствования систем хранения данных мы можем собирать огромные объемы данных, что позволяет проводить наблюдения с более высоким разрешением как во временном, так и в частотном направлениях. Кроме того, мы проводим исследования близлежащих звезд и других направлений в галактике, чтобы максимально охватить потенциально интересные направления в небе".
Другим важным изменением стало внедрение алгоритмов машинного обучения, разработанных для поиска передач среди радиофонического шума космоса и коррекции радиочастотных помех (RFI). Алгоритмы, используемые в исследованиях SETI, делятся на две категории: те, которые измеряют данные временных рядов напряжения, и те, которые измеряют данные спектрограммы временных частот.
"Необработанные данные, собранные радиоантенной, представляют собой измерения напряжения; радиоволна вызывает ток в антенне, который считывается и записывается как напряжение", - говорит Бжицки. "Радиотелескоп - это на самом деле просто антенна, дополненная параболической тарелкой для фокусировки большей площади света, что увеличивает разрешение и яркость. Оказалось, что интенсивность пропорциональна квадрату напряжения. Далее, нас интересует интенсивность как функция частоты и времени (когда и где потенциальный сигнал)".
Чтобы получить это, говорит Бжицки, астрономы начинают с использования алгоритмов, которые вычисляют мощность каждой наблюдаемой частоты по отношению к входным данным временного ряда. Другими словами, алгоритм преобразует данные радиосигнала из функции пространства и/или времени в функцию, зависящую от пространственной частоты или временной частоты - так называемое преобразование Фурье (ПФ). Возведя его в квадрат, астрономы могут измерить интенсивность каждой частоты за период сбора данных.
"Чтобы получить полную спектрограмму, массив интенсивности как функции времени и частоты, мы берем участок временного ряда напряжения, получаем FT, затем повторяем этот процесс на протяжении всего наблюдения, так что мы можем эффективно укладывать ряд массивов FT-данных друг на друга во временном направлении", - добавил Бжицки. "Как только вы определитесь с временным разрешением, мы вычислим необходимое количество временных выборок и рассчитаем FT, чтобы увидеть, сколько энергии находится в каждом частотном бине".
Основной алгоритм поиска, используемый исследователями SETI, известен как алгоритм "некогерентного дерева ДеДоплера", который сдвигает спектр радиоволн для коррекции дрейфа частоты и максимизации отношения сигнал/шум сигнала. Самая комплексная программа поиска SETI, Breakthrough Listen, использует открытую версию этого алгоритма, известную как TurboSETI, которая послужила основой для многих поисков "техносигнатур" (они же признаки технологической деятельности). Как объяснил Бжицки, этот метод имеет некоторые недостатки: "Алгоритм делает предположение, что потенциальный сигнал SETI является непрерывным с высоким рабочим циклом (это означает, что он почти всегда "включен"). Поиск непрерывного синусоидального сигнала - это хороший первый шаг, поскольку людям относительно легко и недорого производить и передавать такие сигналы.
Поскольку TurboSETI нацелен на прямолинейные сигналы, которые всегда "включены", он может с трудом улавливать альтернативные морфологии, такие как широкополосные и импульсные сигналы. В настоящее время разрабатываются дополнительные алгоритмы для обнаружения этих других видов сигналов, но, как всегда, наши алгоритмы эффективны лишь настолько, насколько мы предполагаем, на какие сигналы они нацелены".
Для исследователей SETI машинное обучение - это способ выявления передач в необработанных радиочастотных данных и классификации многочисленных типов сигналов. Основная проблема, говорит Бжицки, заключается в том, что у астрономического сообщества нет набора данных о сигналах ET, что затрудняет контролируемое обучение в традиционном смысле. С этой целью Бжицки и его коллеги разработали библиотеку с открытым исходным кодом на базе Python под названием Setigen, которая облегчает создание синтетических наблюдений радиоизлучения.
"Setigen облегчает производство синтетических сигналов SETI, которые могут быть использованы в полностью синтетических данных или добавлены поверх реальных данных наблюдений для создания более реалистичного шума и фона RFI", - сказал Бжицки. "Таким образом, мы можем создавать большие наборы данных синтетических сигналов для анализа чувствительности существующих алгоритмов или в качестве основы для обучения машинного обучения".
Эта библиотека стандартизирует методы синтеза для анализа поисковых алгоритмов, особенно для существующих продуктов данных радио наблюдений, таких как те, которые используются Breakthrough Listen. "Они поставляются в форматах спектрограммы и комплексного напряжения (временного ряда), поэтому наличие метода получения имитационных данных может быть действительно полезным для тестирования производственного кода и разработки новых процедур", - добавил Бжицки.
В настоящее время разрабатываются алгоритмы для многолучевых наблюдений с использованием Setigen для получения имитационных сигналов. Библиотека также постоянно обновляется и совершенствуется по мере развития исследований SETI. Бжицки и его коллеги также надеются добавить поддержку синтеза широкополосных сигналов, чтобы помочь алгоритмам поиска, нацеленным на не узкополосные сигналы. Более надежные исследования SETI станут возможны в ближайшем будущем, когда в строй войдут радиотелескопы нового поколения.
К ним относится Breakthrough Listen, который будет использовать данные с массива MeerKAT в Южной Африке. Существует также проект Square Kilometre Array (SKA) - массивный радиотелескоп, который объединит данные обсерваторий в Южной Африке и Австралии. К ним относятся MeerKAT и Hydrogen Epoch of Reionization Array (HERA) в Южной Африке и Australian SKA Pathfinder (ASKAP) и Murchison Widefield Array (MWA) в Австралии.
Увы, остается самый ограничивающий фактор в SETI - наша крайне ограниченная система координат. Когда дело доходит до дела, астрономы не имеют представления о том, как должен выглядеть внеземной сигнал, потому что мы никогда не видели его раньше. Это, как ни парадоксально, затрудняет вычленение техносигнатур среди фонового шума космоса. Таким образом, астрономы вынуждены использовать подход "низко висящих фруктов", что означает поиск технологической активности в том виде, в котором мы ее знаем.
Однако, установив параметры, основанные на теоретически возможном, ученые могут сузить круг поиска и повысить вероятность того, что когда-нибудь они что-то найдут. Как резюмировал Бжицки:
"Единственным потенциальным решением этой проблемы является некое исследование машинного обучения без наблюдения, которое минимизирует наши предположения; работа в этом направлении ведется. Setigen, безусловно, полагается на это предположение - синтетические сигналы, которые можно получить, являются эвристическими по своей природе, поскольку пользователь решает, как они должны выглядеть.
"В конце концов, библиотека дает возможность оценить существующие алгоритмы и создать наборы данных потенциальных сигналов для разработки новых методов поиска, но фундаментальные вопросы о том, где и когда, всегда будут оставаться - лучшее, что мы можем сделать, это продолжать искать".
В такие моменты полезно напоминать себе, что парадокс Ферми должен быть решен только один раз. Как только мы обнаружим радиопередачу в космосе, мы будем точно знать, что мы не одиноки во Вселенной, что разумная жизнь может существовать и существует за пределами Земли и общается с помощью технологий, которые мы можем обнаружить.