Посмотрите на фото ниже. И что вы увидели на этом замечательной картине? Просто какой-то буй посреди воды. Ничего интересного. А если я вам скажу, что, во-первых, это не «просто какой-то буй», а целый невидимый остров, во-вторых, вы там были хотя бы один раз в жизни. Ну и, в-третьих, этот остров, пожалуй, самое насыщенное данными место в мире. Так, падажжи, что за насыщенность данными такая? Как я там мог оказаться? Хорошие вопросы, на которые простым предложением не ответишь. Но возможно, фраза про невидимый остров может вас натолкнуть на какие-то мысли. Но, если что, вот вам примерная история этого забавного артефакта.
Всё началось... на самом деле достаточно давно. Но сейчас нас интересует 1984 год. Именно тогда в мировую науку и инженерно-географический обиход была введена WGS 84. Единая всемирная система геодезических параметров Земли. Не буду углубляться во все эти подробности (да и боюсь туда погружаться, если честно), но суть в том, что клеточки, которые вы видите практически на всех картах — это как раз она. Система координат. И если вы помните школьную алгебру, то знаете, что у любой сетки с координатами должно быть начало. И вот теперь, наступает время для нашего буйка. Ну, точнее, станции 13010 (soul) сети PIRATA, которая должна отслеживать различные изменения в океане — температура воды, воздуха, ветра и так далее. Но он стоит именно в той точке, которая в координатной системе WGS84 соответствует 0°0° (кто-то уже заподозрил неладное, да, товарищи программисты?). Так, с буйком разобрались. Но почему он остров?
В 2008 году термин Null Island в профессиональный жаргон ввёл Стив Пеллегрин — один из ГИС аналитиков компании Tableau. В 2011 году, о забавном названии узнала чуть более широкая аудитория, когда добровольцы, работающие в ГИС (геоинформационных системах) и прочие программисты добавили этот буй в общедоступную базу картографических данных Natural Earth. И по приколу назвали его Нулевым островом. Там этот буй превратился в кусок земли площадью 1 м² и следовательно, не отображается на общедоступных картах (им тупо не хватает масштаба). Такой виртуальный островок. Зачем? А вот тут в дело вступает глобальный вопрос, который может быть не по плечам простому буйку.
А так он выглядит в представлении геодезистов. Почему именно так? Если догадались, то мое уважение. Если нет — я там ниже напишу.
Когда вы блокируете свой GPS (а он как раз использует систему WGS 84) и открываете какое-нибудь приложение с привязкой к геоданным, вы можете получить ссылку на точку куда-то в район Африки (Гвинейский залив). Вот теперь вас и поздравляю! Вы только что виртуально побывали на Нулевом Острове. Помните историю про бедную-несчастную ферму, которую все обижали? Вот здесь что-то похожее произошло. Каждый раз, когда в получении геоданных возникает ошибка, приложение подставляет значение NULL. Большинство других программ воспринимают это как 0. И, соответственно, бросает туда всё, что связано с несуществующей точкой в координаты 0°0°. А так как подобных сбоёв в мире происходит множество, то количество информации, привязанное к этой точке растёт буквально в геометрической прогрессии. Загруженные фото без метаданных, заглушки на сайтах с привязкой к картам, арендное жильё во всяких аналогов AirBnB, маршруты пробежек, твиты, видео, профили пользователей. Куча всего. И вот, чтобы выловить такие баги, Natural Earth и добавила подобный остров к себе на карты. И не они одни. Эта точка является «индикатором ошибок» для многих ГИС-систем.
Это, кстати, флаги для этого острова. Их много и они разные.
Ну а дальше, пошло-поехало. Вскоре у этого острова появился свой флаг (был даже сайт, но потом, похоже, кто-то забыл оплатить доменное имя), остров обрёл очертания (из игры Myst) и начал наполнятся метой. Логично предположить, что подобные «нулевые острова» есть и в других картографических системах, поэтому аналитики заговорили о целом нулевом архипелаге, озёрах (в том случае, когда такая точка попадает на сушу) и даже чёрных дырах (если координатные данные вообще находятся где-то за пределами понимания и ограничения географической системы). Кстати, подобные острова могут стать и довольно большой проблемой для человечества, о которой сейчас говорят специалисты. В том смысле, что все эти данные, которые содержит остров... они же реальные. И часть из них нужна не просто для того, чтобы какой-нибудь дизайнер показал всем своим подписчикам в соцсетях, что он там кушал на завтрак. И значит, какие-то системы в результате ошибок лишились некоего количества информации. Так, выяснилось, что в 2021 году к этой точке оказались привязаны тысячи данных по заболевшим COVID (и, следовательно, их анализ был произведён не очень качественно), а во время выборов в Америке 2020 (тех самых, скандальных, да) к этой точке привязались идентификационные данных части избирателей, которые после подобной операции уже не могли участвовать в электронных выборах. Короче, хватит кормить остров данными, пишите нормальный код!
Картинка всех этих островов, озер, и прочих точек, к которым привязаны ошибочные данные
Ну и немного информации:
1. Статья на английском
2. Wiki, куда без нее.
3. Немного визуализации этого процесса.
4. Для фанатов буя — его карточка на сайте центра буев.
5. Книга Analytics for the Internet of Things (IoT)
6. Книга The 99% Invisible City