Космічний дата-Майнінг або цифрова поезія астрономії

Сучасні наукові публікації переповнені новими словами та смислами. Big Data, Data-mining, Machine-learning, Deep-learning та Artificial intelligence для багатьох давно стали цілком звичними поняттями. Світ змінюється рекордними темпами, а людство виробляє дедалі більше інформації.

За перші кілька тижнів своєї роботи Слоунівський цифровий огляд неба (Sloan Digital Sky Survey – SDSS) за допомогою одного телескопа у 2000 р. зібрав більше даних, ніж накопичилося за всю попередню історію астрономії. До 2010 р. архів SDSS зібрав 140 терабайтів – нині такий обсяг збирається менш ніж за добу. У 2017 році користувачі мобільних пристроїв щодня генерували 2,5 екзабайт.[1] Останні два роки було створено близько 90% всіх наявних даних.[2] Найкращі уми наукового світу та бізнесу зосередили свої зусилля на вивченні та опанування новим «океаном», що складається не з атомів та молекул, а з цифр, текстів, таблиць та образів.

Єдиною сферою діяльності людства, яка вже протягом тисяч років працювала з Big Data, була астрономія. З урахуванням зазначених вище глобальних змін в інформаційних технологіях можна було б очікувати, що саме в ній буде досягнуто найбільш дивовижних результатів у використанні нових підходів. Все виявилося не так просто, але саме команда українських вчених на основі новітніх математичних методів та алгоритмів створила новий інструмент для астрономічних досліджень. Йдеться про унікальну розробку під назвою CoLiTec, яка дозволяє об’єднати, обробити та отримати результати за підсумками тисяч сеансів спостережень, зроблених як аматорами, так і професійними вченими-астрономами. Це мільйони знімків зоряного неба, зроблених за допомогою тисяч телескопів з різною якістю, точністю та рівнем обробки. Ну чим це не дата-майнінг?

Програма CoLiTec: як і для чого це працює

Сучасні системи пошуку астероїдів за ніч формують безліч знімків великих ділянок небесної сфери. У світі немає достатньої кількості вчених-астрономів для перегляду цих сирих спостережних даних за прийнятний час. Особливо серйозні труднощі виникають під час обробки кадрів, отриманих світлосильними широкопільними астрографами, у полі зору яких може бути одночасно кілька десятків астероїдів зі слабким блиском. Розв`язанням цієї проблеми є впровадження автоматизованого виявлення об’єктів із візуальним підтвердженням отриманих результатів.

На момент початку досліджень зі створення CoLiTec в Україні, країнах СНД та Балтії не було жодної чинної програми автоматизованого пошуку астероїдів та комет. Ця обставина призводила до дуже низької ефективності спостережень малих тіл Сонячної системи в обсерваторії цих країн. Не тільки професіонали, а й численні астрономи-аматори зазнавали обґрунтованих переживань, боячись пропустити щось значуще і важливе у купі отриманих «сирих» даних.

Весь цей комплекс проблем мав вирішити CoLiTec. Основною технічною ідеєю, що лежить у його основі, стало використання методу накопичення даних уздовж траєкторій з невідомими параметрами.

Новий метод істотно виграє в порівнянні з традиційним «стробовим» методом виявлення треків об’єктів, що рухаються. На 10 кадрах, отриманих телескопом, при тому самому його енергетичному потенціалі можна побачити небесні тіла з вчетверо меншою яскравістю (ефективною поверхнею розсіювання) — іншими словами, проникна здатність інструменту покращується на 1,5 зоряної величини лише шляхом обчислень, в наслідок використання методу накопичення даних.

Ще однією примітною особливістю CoLiTec є можливість ефективного виявлення астероїдів з нульовим видимим рухом, тобто зі зсувом між кадрами, порівнянним з помилками вимірювання положення об’єктів. Це особливо важливо, оскільки серед таких об’єктів є й ті, які можуть бути на траєкторії зіткнення з нашою планетою. Кутова швидкість переміщення багатьох тіл із цієї категорії не перевищує кількох середньоквадратичних відхилень помилок вимірювання положень на знімку. Тому класичними методами вони не можуть бути виявлені. Для цього в програмі CoLiTec реалізований новий метод, заснований на перевірці важливості кутової швидкості об’єкта.

На цей час CoLiTec — єдина програма з автоматичним виділенням об’єктів з ненульовим видимим рухом, що знаходиться у відкритому доступі, одна з кращих за точністю спостережень, а також єдина у світі надійно робоча на широких полях. Крім того, це єдина програма такого роду у пострадянських державах. Вона виконує внутрішньокадрову та міжкадрову обробку даних за допомогою алгоритму виявлення об’єктів на основі накопичення статистик, пропорційних енергії зображень, вздовж можливих траєкторій руху.

У CoLiTec реалізований метод розпаралелювання обробки даних, що дозволяє їх оперативно обробляти та підтверджувати найцікавіші виявлені об’єкти безпосередньо в ніч відкриття. Є блоки виявлення дуже повільних та дуже швидких об’єктів. Наприклад, за допомогою першого з них була відкрита популярна свого часу комета ISON. На цей час програма адаптована для використання на широко підлогових телескопах. Так було знайдено комету P/2013V3 Nevski (телескоп Genon, поле зору 7,0º×4,0º).

CoLiTec наочно представляє результати своєї роботи з використанням спеціального візуалізатора із дружнім інтерфейсом. Їм можна незалежно переглядати вже отримані результати, доки основна програма продовжує обробку даних.

Програма також забезпечує можливість публікації кадрів, знятих на обсерваторіях, що її використовують у рамках SIA протоколу IVOA. Вона розбита на окремі блоки, реалізує ідеологію відкритої архітектури та дозволяє незалежно застосовувати на кожному етапі розроблені програмні засоби.

Використання інструментарію CoLiTec у рамках реальних досліджень швидко довело свою ефективність. Так, за період нічних спостережень 3 січня 2011 року спостерігачем ISON-NM Леонідом Єленіним за допомогою програми було відкрито 32 астероїди, що є рекордом для даної обсерваторії. Загалом цієї ночі з використанням СoLiTec було проведено 3868 спостережень 967 астероїдів, що також стало абсолютним рекордом.

За останні кілька років програма застосовувалася для автоматизованого виявлення астероїдів на Андрушівській астрономічній обсерваторії (Житомирська обл., Україна), в обсерваторії ISON-NM у штаті Нью-Мексико (Mayhill, NewMexico, USA), а також в обсерваторіях ISON-Кисловодськ та ISON -Усурійськ. Зараз програма CoLiTec — одна з небагатьох у світі, яка активно та дуже ефективно використовується як професіоналами, так і астрономами-аматорами. Причому для останніх (а це десятки та сотні тисяч людей по всьому світу) вона є практично єдиним шансом не лише детальніше розглянути небесні тіла, а й відкрити щось важливе для науки та людства. За допомогою CoLiTec проста людина з телескопом та ПЗЗ-камерою перетворюється на учасника наукового процесу, здатного на відкриття світового рівня.

Історія створення програми

Ідея про необхідність створення подібної системи прийшла до одного з її розробників, наукового та ідейного натхненника Вадима Саваневича ще 1988 р., коли він проходив службу в Центрі контролю космічного простору ЗС СРСР («Ногінськ-9»). Потім була аспірантура та докторантура у Харківській військовій академії, робота з такими видатними вченими, як Віктор Деденок, Сергій Кузьмін та Едуард Петров, які поглиблено вивчали обчислювальні методи міжкадрової (вторинної) обробки радіолокаційної інформації.

У серпні 1990 р., у співпраці з Віктором Деденком, було розроблено метод накопичення даних уздовж траєкторії з невідомими параметрами. До 2006 р. метод пройшов кілька стадій удосконалення та формалізації. На початку 2009 р. Вадим Саваневич спільно зі спостерігачем євпаторійського телескопа АЗТ-8 Олександром Брюховецьким зайнявся розробкою автоматичного виявлення слабкоконтрастних штучних супутників Землі (ШСЗ) на серії CCD-кадрів. Текст дисертації та програмний код створювалися паралельно. Теоретичні викладання за новим методом почали перетворюватися на дієву систему.

У березні 2009 р. проєкт CoLiTec вийшов на стадію практичної реалізації. Поштовхом до цього стала зустріч робочої групи з Юрієм Іващенком, який на власні кошти створив у невеликому містечку Андрушівка приватну астрономічну обсерваторію. На той час на ній вже відкрили кілька сотень нових астероїдів. Юрій Миколайович зацікавився викладеним методом та запропонував перевірити його на практиці. Водночас стало ясно, що офіційним структурам України спостереження ШСЗ реально не цікаві, що призвело до перенесення уваги проєкту на астероїди.

Влітку 2009 року до проєкту прийшли Олександр Кожухов та Володимир Власенко.

У травні 2010 р. в автоматизованому режимі в Андрушівській астрономічній обсерваторії було відкрито два астероїди — вперше в країнах СНД та Балтії. У листопаді того ж року астроном Леонід Єленін запропонував використовувати CoLiTec на обсерваторії ISON-NM, що було реалізовано 27 листопада 2010 р. А вже 10 грудня 2010 р. Леонід відкрив свою першу комету С2010 Х1 Elenin, яка стала першою новою кометою в СНД (та першої, відкритої в автоматизованому режимі).

Результати розробки та використання CoLiTec стали предметом доповідей на багатьох міжнародних конференціях та симпозіумах у Франції, США, Іспанії, Фінляндії, Італії, Словаччині та ін. Перебуваючи поза науковими структурами, команда CoLiTec отримала заслужене визнання серед спільноти астрономів України: у 2018 р. доктору технічних наук, завідувачу лабораторії Західного центру радіотехнічних спостережень Державного космічного агентства України Вадиму Саваневичу спільно з Віталієм Андруком (науковим співробітником Головної астрономічної обсерваторії НАНУ) та Юрієм Іващенком (к.ф.-м.н, старшим науковим співробітником ГАО НАНУ), було присуджено премію НАНУ ім. Федорова за видатні роботи у галузі теоретичної та прикладної астрономії. Наукову нагороду їм вручив перший віцепрезидент Академії Антон Григорович Наумовець на звітній сесії НАНУ, що відбулася 26 квітня 2018 р.[3]

Як працює програма

Як приклад послідовної оглядової роботи розглянемо функціонування обсерваторії ISON-NM. Перебуваючи в місці з гарним астрокліматом, вона все ж таки займається малими оглядами небесної сфери: діаметр її телескопа дорівнює 45,5 см, що, безумовно, накладає певні обмеження. Зокрема, через ці обмеження використовувані експозиції зазвичай становлять 100 секунд — значно вищі, ніж у великих професійних оглядів.

Спочатку система «телескоп-камера-комп’ютер» отримує знімки піднебіння, призначені для пошуку небесних тіл. Астероїд виділяється серед «нерухомих» зір завдяки переміщенню на їх фоні. Щоб знайти на знімках такий об’єкт, необхідно робити їх не підряд (тоді переміщення, швидше за все, просто не буде помітно), а з деякою перервою, тому огляди зазвичай працюють за принципом мозаїк, тобто знімають певну кількість суміжних полів, що становлять загальну композицію. Спершу оглядовий телескоп знімає ці поля по черзі один раз, потім другий раз і т.д. Зазвичай кожного поля робиться по 4 знімки з проміжком від 10 до 20 хвилин. Коли робота по одній мозаїці закінчена, телескоп переходить до другої й так далі.

Після того, як знімки отримані, вони автоматично обробляються для пошуку об’єктів, що рухаються. На обсерваторіях, що використовують CoLiTec, спостереження та обробка зазвичай відбувається одночасно з пошуком (при цьому, якщо буде знайдено щось цікаве, вони іноді встигають протягом тієї ж ночі отримати додаткові позиції для підтвердження знайдених об’єктів).

Після обробки знімків проводиться автоматична ідентифікація виявлених об’єктів із відомими. Програмне забезпечення налаштоване так, що приблизно 50% знахідок виявляються помилковими — це зроблено для того, щоб збільшити робоче проникнення і, отже, кількість реальних нових відкриттів. Усі «підозрілі» об’єкти спостерігач перевіряє вручну (за повноцінну спостережну ніч їх зазвичай буває близько сотні) одразу після автоматичного виявлення. У ході цієї процедури помилкові «відкриття» відсіваються.

Відкриття, зроблені за допомогою CoLiTec

З використанням нової програми вже відкрито чотири комети – C/2011X1 Elenin (MPEC 2010-X101), P/2011NO1 Elenin (MPEC 2011-O10), C/2012S1 (MPEC 2012-S63), P/2013V3 Nevski (MPEC 2013-V45). Також за її допомогою виявлено понад 1560 астероїдів, у т.ч. чотири зближуються із Землею, 21 «троянець» на орбіті Юпітера та один астероїд-кентавр. У 2011-2014 р. із застосуванням CoLiTec було виконано 86% спостережень та 75% відкриттів астероїдів у країнах СНД та Балтії.

На знімку зліва можна побачити комету Єленіна (C/2010 X1 Elenin). Зображення зроблено 1 серпня 2011 космічним апаратом STEREO-B. Відстань між ним та кометою на той момент була трохи більше ніж 7 млн ​​км — зовсім недалеко за мірками Сонячної системи. Хоча STEREO-B і призначений для спостережень Сонця, фахівці NASA вирішили розвернути апарат під час зближення з ним комети Єленіна, щоб простежити за нею трохи довше. На знімку праворуч можна побачити туманну цятку «хвостатої зорі», яка протягом години помітно змістилася на тлі зоряного неба.

Кометний циркуляр №2768, опублікований 19 липня 2011 р., містив повідомлення про новий рухомий небесний об’єкт, відкритий 7 липня Леонідом Єленіним та Ігорем Молотовим за допомогою 45-сантиметрового (f/2,8) роботизованого астрографа ISON-NM (Мейхіл, штат Нью-Мексико). Пізніше об’єкт був ідентифікований як періодична комета, яка одержала позначення P/2011 NO1. Згідно з попередніми розрахунками, вона повертається до Сонця кожні 13±0,16 років. У перигелії комета була 20 січня 2011 р. на геліоцентричній відстані 1,2 а.о.

Подане нижче зображення комети C/2012 S1 ISON отримано додаванням 12 знімків, зроблених телескопом Hubble 10-11 квітня 2013 р. Комета була відкрита 21 вересня 2012 р. аматорами астрономії Віталієм Невським (Вітебськ, Білорусь) та Артемом Нововичонком (Петрозаводськ, РФ) за допомогою 40-сантиметрового рефлектора, встановленого в обсерваторії проєкту ISON, та програми автоматизованого пошуку рухомих об’єктів CoLiTec. На момент відкриття вона мала 18-у зоряну величину і мала кому діаметром 10 кутових секунд, діаметр її ядра оцінюється в 3 км.

Комета C/2012 S1 ISON. Джерело: NASA

Попередні розрахунки показали, що 1 жовтня 2013 р. ця комета пролетить у 0,07 а.о. (10 млн км) від Марса. 28 листопада 2013 р. вона пройшла лише у 0,012 а.о. (1,8 млн км) від центру Сонця і в 1,1 млн км від його поверхні, після чого повністю розпалася і випарувалася. Орбітальні елементи комети C/2012 S1 схожі на елементи Великої комети 1680 р.

Комета C/2013 V3 Nevski. Джерело: remanzacco.blogspot.com

У кометному циркулярі №3695, виданому 8 листопада 2013 р., містилося повідомлення про відкриття днем раніше нової комети, зроблене Віталієм Невським під час знімання неба за допомогою 20-сантиметрового рефлектора (f/1,5) обсерваторії ISON під Кисловодськом. Експозиція становила 180 секунд, обробка кадрів проводилася програмою CoLiTec. Комета одержала позначення C/2013 V3 Nevski.

Висновки та перспективи

З появою програми CoLiTec вчені отримали у своє розпорядження інструмент, що звільнив їх від більшої частини рутинної роботи, яка раніше вважалася «наукою», і надає їм більше часу для глибоких інтерпретацій спостережень космосу.

В основу програми покладено унікальні обчислювальні методи, що дозволяють в автоматизованому режимі з високою точністю та якісно вирішувати науково-практичні завдання з обробки великих обсягів (Big Data) різнорідних астровимірювань з метою знаходження нових комет та астероїдів.

CoLiTec може використовуватись як професійними астрономами, так і любителями. За допомогою програми вже зроблено багато значних астрономічних відкриттів. Вона має великий потенціал для подальшого розвитку, удосконалень та практичного впровадження. Нині готується оновлена ​​версія лінійки старих і нових продуктів CoLiTec-Team, яка вийде у світ на початку 2019 р. Паралельно ведеться робота над програмою яскравісного вирівнювання астрономічних зображень FrameSmooth, проєктом автоматизованої обробки супутникових оглядів CoLiTecSAT, автоматичної високоточної побудови кривих блиску змінних зір та астероїдів CoLiTecVS, і навіть проєктом інтеграції даних багатьох телескопів ViO. При цьому пілотна версія останнього вже успішно реалізована в окремих обсерваторіях України та Словаччини, а FrameSmooth та CoLiTecVS використовуються, тестуються та досліджуються в Україні, Словаччині, Казахстані, Таїланді.

Тепер можна сміливо заявити, що попри всі складнощі останніх років, CoLiTec-Team відродилася, привела астрономічне програмне забезпечення, що розробляється, до євростандартів і готова повноцінно брати участь у наукових проєктах, а також виходити на ринок аматорського астрософту.

Учасники проекту CoLiTec:

Саваневич Вадим Євгенович керівник проєкту, доктор технічних наук, професор, основний розробник обчислювальних алгоритмів для астрометричної та фотометричної редукції ПЗЗ-кадрів, оцінки параметрів положення та руху об’єктів різної природи, їх автоматичного виявлення шляхом накопичення статистик зображень уздовж траєкторій з невідомими параметрами, а також методу запобігання виникненню колізій при паралельній обробці даних.

Брюховецький Олександр Борисовичпрограміст, науковий дослідник, кандидат технічних наук, основний розробник програмного коду обчислювальних алгоритмів для автоматичного калібрування та косметичної корекції зображень, астрометричної та фотометричної редукції ПЗЗ-кадрів, ототожнення об’єктів різної природи, а також оцінки параметрів їх руху.

Діков Євгеній Миколайовичпрограміст, професійний астроном, автор переглядової програми LookSky, що є складовою програмою CoLiTec для автоматизованого відкриття астероїдів та комет на серії ПЗЗ-кадрів. LookSky надає можливість візуального аналізу виявлених в автоматичному режимі рухомих об’єктів різної природи, ручного вимірювання об’єктів, що рухаються, а також формування та відправлення необхідних звітів.

Хламов Сергій Васильовичпрограміст, QA-інженер, науковий дослідник, кандидат технічних наук, автор програми управління обробкою будь-яких типів астрономічних даних CoLiTec Control Center, що дозволяє запускати різні типи обробки з можливістю відстеження процесу на кожному етапі обробки для різних серій астрономічних даних, редактора налаштувань ThresHolds для тонкого настроювання всіх параметрів обробки, що використовуються різними модулями ПО CoLiTec, а також програми вирівнювання залишкової фонової складової зображень на астрономічних кадрах FrameSmooth.

Погорєлов Артем Віталійовичпрограміст, автор програми PlotsViewer для зображення кривих блиску, які отримують у ручному або автоматичному режимах, з використанням файлів, що містять інструментальний блиск досліджуваних об’єктів (наприклад, змінних зір, астероїдів або штучних супутників Землі).

Власенко Володимир Петровичпрограміст, розробник обчислювальних алгоритмів для інверсної медіанної та нелінійної високочастотної фільтрації, вейвлет-перетворень, а також оцінки параметрів положення об’єктів різної природи на ПЗЗ-кадрах.

Кожухов Олександр Михайловичкандидат технічних наук, розробник обчислювальних алгоритмів для попередньої обробки, астрометричної та фотометричної редукції ПЗЗ-кадрів, оцінки параметрів положення, руху та автоматичного виявлення рухомих об’єктів на серії знімків.

[1] Один екзабайт даних (1 EB) відповідає мільярду гігабайт, або 1018 байт

[2] https://www.mckinsey.com/business-functions/mckinsey-analytics/our-insights/an-executives-guide-to-ai

[3] http://www.nas.gov.ua/text/pdfNews/laureates_2018.pdf