Big Data: есть ли альтернатива киберпанку?

Когда летом 2014 года на чемпионате мира по футболу сборная Бразилии в родных стенах потерпела сокрушительное поражение от команды Германии со счетом 1:7, вся планета была повергнута в шок. Возможно, одни из немногих, кого такой результат не привел в изумление — это немецкие ученые. Дело в том, что победа Германии ковалась не только в тренерском штабе и на изнурительных тренировках: на нее работала передовая немецкая наука. В частности, программу подготовки к чемпионату и стратегию матчей корректировали ученые на основании анализов Больших данных.

По результатам компьютерной обработки огромного массива статистических показателей ученые помогали подобрать оптимальный состав команды на каждый матч, тактику игры, график тренировок и отдыха, рацион игроков, указывали на слабые места соперника и т.д. Методы Big Data указывали на каждую малейшую закономерность, которую мог упустить из виду человек. Это означает, что теперь шампанское пьет не столько только тот, кто рискует, но и тот, кто умело анализирует данные.

В конце 2000-х годов в области информационных технологий возникло новое направление, которое быстро успело завоевать одно из ведущих положений в научных исследованиях и практическом применении – Большие данные (Big Data). Речь идет о совокупности подходов, инструментов и методов работы с большими объемами структурированных и неструктурированных данных.

Основной характеристикой Big Data, за которую их уже успели прозвать «new oil»  – новой нефтью, является возможность на качественно новом уровне выявлять тенденции и закономерности, и принимать решения  на  основе имеющейся информации о состоянии различных сфер жизни.

Что позволило правительствам и корпорациям качать эту «новую нефть»? Использование Больших данных стало возможным благодаря соединению нескольких факторов:

  1. возрастание объемов накопленных и оцифрованных данных;
  2. радикальное удешевление носителей информации;
  3. экспоненциальное возрастание мощности обработки данных;
  4. появление методов обработки слабоструктурированных данных.

По подсчетам компании IDC, объем данных ежегодно возрастает приблизительно на 40%. Это значит, что в период с 2009 по 2020 год их станет больше в 44 раза, если пользоваться методом простой экстраполяции (на сколько он правомерен – другой вопрос). Уже до 2015 года в мире будет 7, 9 зетабайт информации. Такое возрастание происходит в первую очередь вследствие распространения соцсетей, смартфонов и «Интернета вещей» — наиболее продуктивных источников данных. По некоторым подсчётам до 2016 года рынок Big Data будет составлять 23, 8 млрд долларов. Среднее ежегодное возрастание рынка составит 31,7%. Занятость в сфере Больших данных в ближайшие года разовьется до 4,4 млн рабочих мест (Gartner).

Big Data Just Beginning to Explode Infographic

График стремительного возрастания данных и возможностей их обработки согласно прогнозам Computer Sciences Corporation.

За полдесятилетия благодаря появлению Больших данных произошли изменения практически во всех сферах человеческой деятельности. Под влиянием Big Data кардинально трансформировалась наука, производство, торговля, финансы, медицина, государственное и корпоративное управление, война, политика, спорт, культура, этика. Сегодня с применением Big Data составляются новые карты звездного неба, оптимизируется информационная безопасность, модернизируется промышленное производство, повышается энергоэффективность, обнаруживают сети торговли людьми, отслеживаются пути распространения вирусных заболеваний, разгружается дорожный трафик, выявляют возможные природные катаклизмы, выбирают оптимальные стратегии сельскохозяйственных посевов, осуществляют планирование семьи, и так далее. Обнаружив с помощью Больших данных определенный тренд, удается верно расставить приоритеты, принимать решения более рационально, выявлять угрожающие тенденции и вовремя принять меры, точнее анализировать процессы, обнаруживать системные ошибки, просчеты и застаревшие представления.

Сегодня анализу данных поддаются такие «непредсказуемые», на первый взгляд, сферы жизни как культура и спорт. Пользуясь Большими данными, сервис GooglePlay составляет математически выверенный график тенденции в развитии музыкальных жанров ХХ-ХХІ столетий, которые раньше определялись по чартам и продажам альбомов. Другой сервис GoogleNgram позволяет отслеживать хронологическую динамику использования слов и словосочетаний в литературе на разных языках. Это дает возможность визуализировать тенденции гуманитарной сферы, которые раньше не имели математического выражения и колебались от субъективности экспертов.

Динамика употребления названий полит. идеологий в ХХ-ХХІ столетиях в англоязычной литературе по данным GoogleNgram

 

Спорт. Во время Чемпионата мира по футболу в Бразилии с помощью Big Data были сделаны прогнозы матчей. Анализ включал данные про рейтинг команд, историю встреч, климат, поддержку трибун и т.д. В итогах программы удалось безошибочно определить будущего победителя в 11 из 12 матчей плей-офф. Об успехах победителей чемпионата, которые шли к триумфу активно используя методы Больших данных, уже сказано выше. Таким же образом благодаря Big Data в чемпионате по американскому футболу по результатам анализа игр за многолетний период было выявлено, что чаще побеждают команды, играющие на грани оффсайда, и теперь эта тактика все больше завоевывает умы тренеров. То есть случайность стремительно покидает сферу профессионального спорта.

Однако едва ли не наибольшее распространение технологии Big Data получили в сфере онлайн- и оффлайн-маркетинга. Анализ Больших данных о склонностях и поведении клиентов позволяет до деталей проанализировать спрос, выяснить географию расселения и социальную структуру клиентуры, быстрее и точнее, чем конкуренты, определять тренды, вносить коррективы в стратегию продаж, и, что важно, индивидуализировать предложение (например, используя контекстную рекламу).

Измерение влияния Больших данных на ведение бизнеса согласно исследованию University of Texas

 

Важнейшая из заслуг Big Data – минимизация субъективного фактора. Если раньше производителям и дистрибьюторам приходилось проводить маркетинговые опросы, то теперь эти опросы проводятся автоматически со значительно большей точностью. Несколько лет назад случился скандал. 12-летней девочке, зарегистрированной на одном из онлайн-магазинов, пришла реклама  товаров для беременных. Ее отец и сама девочка были глубоко возмущены предложением. Однако, со временем выяснилось, что девочка на самом деле была беременна: программа вычислила предложение по поведению девочки на сайте, свойственное беременным. Такая «математическая правдивость» Big Data делает новый шаг в количественных социологических исследованиях. Ведь теперь анализ данных о поведении внутри исследуемой группы способен дать значительно более точные результаты, чем опрос, где респонденты могут сказать неправду, не осознать свой выбор, или где вопросы могут быть заранее искажены. Накануне референдума в Швейцарии по поводу разрешения на строительство новых мечетей соцопросы показывали благожелательное отношение населения к мусульманам. Но референдум продемонстрировал прямо противоположные результаты, которые совпадали с результатом анализа соцсетей с помощью Big Data. Люди боялись показать себя не толерантными перед опрашивающим, но на самом деле придерживались ксенофобских взглядов.

С учетом сказанного выше, возможности Big Data вызывают целый ряд этических и политических вопросов. Например, благодаря Большим данным работодатели отслеживают скрытые тенденции в HR-секторе, которые потом используют с целью дискриминации по признаку национальности, возраста, пола, гендера, цвета кожи и т.д. Другой пример: полиция Лос-Анжелеса продолжает эксперимент по превентивному задержанию подозреваемых на основании анализа Big Data. Подобно тому, как в фантастическом фильме Стивена Спилберга «Особое мнение» трое провидцев предугадывают еще не совершенные преступления, сегодня использование Больших данных полицией фактически ставит под сомнение такой базовый юридический принцип как презумпция невиновности. Как это оценивать?

Карта центральной части Лондона с местами «будущих преступлений», определенных с вероятностью до 70% по методам Big Data. Разработка University of Trento, Италия.

Одним из наиболее спорных вопросов, которые сейчас активно обсуждаются аналитиками и учеными, является вопрос приватности пользователей сети и использование корпорациями персональных данных. Такие компании-гиганты как Google и Facebook даже не скрывают того, что ведут сбор персональных данных пользователей с целью «улучшения  обслуживания». Как используются эти колоссальные массивы структурированных данных? Самое малое для создания «комфортной окружающей среды» пользователя – так называемого закрытого информационного кокона, который метафорически можно назвать «плюшевым концлагерем», а также для обеспечения этими данными третьих корпораций с коммерческими целями. Самое большее – доступ к персональным данным оказывается в руках спецслужб. Можно сделать вывод, что в руках правящего класса Big Data уже превращается в инструмент классового насилия и закрепления своей власти. Использование больших данных спецслужбами для выявления оппозиционных настроений и организаций, упреждение забастовок и бунтов, предвидение результатов волеизъявления, моделирование группового поведения – все это дает основания для беспокойства.

Компьютерное моделирование Big Data, которое прогнозирует поведение больших общественных групп и то, как его можно изменять — приоритетное направление разработок спецслужб и оборонных ведомств ключевых империалистических государств. Для примера тут можно вспомнить Эдварда Сноудена, который указал на злоупотребление со стороны Агентства национальной безопасности США в использовании персональных данных и грубом нарушении права на приватность. Проблема тут состоит не столько в слежении за поведением индивидов, сколько в доступе спецслужб к тенденциям групповой динамики с помощью программы Prism, созданной по принципу анализа Big Data.

Возможная схема работы системы Prism Агентства национальной безопасности США. Автор — обладатель Пулитцеровской премии за публикации в сфере защиты сетевой приватности Ашкан Солтани.

Данная тенденция особенно опасна в силу того, что в государственном репрессивном аппарате минимизируется человеческий фактор, а научные методы контроля, управления и манипуляции выходят на качественно новый уровень. Таким образом, угроза новых форм классового господства – «киберпанка» — становится реальной, как никогда раньше.

В то же время стоит понимать, что Большие данные – не только угроза. Эта технология несет в себе также и колоссальный потенциал общественных преобразований в направлении перехода на качественно новый уровень развития человечества. Если проводить аналогии, то на уровне техники и методов Big Data могут стать той материальной базой, которую когда-то намеревался создать академик Виктор Глушков для внедрения системы ОГАС и кибернетических методов управления экономикой.

Показательно, в октябре 2014 года журнал The New Yorker опубликовал статью о подобном глушковскому, только менее масштабному, проекту Киберсин под названием «Социалистическое происхождение Больших данных». Большие массивы данных, которые накапливаются и обрабатываются в режиме реального времени, возможность максимальной публичности, учёт и контроль – вот основы новой плановой экономики, которые позволяют заложить Большие данные. Соответствующее использование технологии Big Data способно обеспечить рациональное перераспределение ресурсов, достоверную оценку потребностей населения и возможностей производства, обозначить приоритеты развития, регулировать экологический и демографический баланс, экстраполировать образовавшиеся тенденции во избежание кризисных явлений, радикально трансформировать все сферы человеческого взаимодействия. И благодаря  всемирному охвату Сети все это впервые в истории человечества может быть воплощено в глобальных масштабах.

Ситуационная комната проекта Киберсин

Наконец, одна из главных перспектив Больших данных – снятие проблемы бюрократии и коррупции, громоздкости и неповоротливости управленческого аппарата. Big Data (совместно с технологиями 3D-принтинга, социальных сетей, «Интернета вещей» и т.д.) открывают прямой путь к ликвидации товарного производства и дальнейшего эффективного демократического управления экономикой.

Ясно, что технология не есть панацеей и сама по себе не способна привести к радикальным социальным изменениям. Без классических форм классовой борьбы она не способна решить всего многообразия проблем капиталистического общества – эксплуатации, национальных конфликтов, обскурантизма и религиозного фундаментализма, неравномерности развития и остальных вопросов. Напротив, в руках господствующего класса высокие технологии уже в наше время становятся, по выражению Джулиана Ассанжа, «новым ядерным оружием». Однако, на сегодняшний день невозможно игнорировать вызовы и перспективы, которые ставит перед человечеством существование технологии Больших данных, как без преувеличения передовой элемент современных производительных сил.

В каком направлении «киберпанка» или «киберкоммунизма» — будут использованы Большие данные, станет одним из ключевых предметов политической борьбы в следующие десятилетия.

 Текст: Андрей Мовчан