Некоторое время назад мы начали говорить о том, что многие финансовые организации, имея обширные базы данных с информацией о своих клиентах, ищут способы эти данные монетизировать. Для этого они создают вокруг себя многочисленные дочерние структуры, не имеющие, казалось бы, отношения к традиционному финансовому бизнесу материнских компаний. В подтверждение этого даю ссылку на свежую статью, дающую представление о том, как это делается в одном из крупнейших российских банков.
Итак, подошло время поговорить о том, как можно заработать на данных, вернее – на больших данных.
В интернете вы без труда найдете огромное количество определений термина «Большие данные». Почти все они содержат такие слова и выражения как «терабайты», «алгоритмы», «структурированные и неструктурированные» и еще много чего.
Все эти определения объединяет одно – как правило, все они придуманы айтишниками и для айтишников.
Нам все это не подходит. Пока, во всяком случае. Нам большие данные интересны в качестве источника заработка.
С точки зрения экономиста, большие данные – это информация, которая при достижении ей некоего критического объема, может быть обработана таким образом, чтобы приобрести новое качество, новую ценность. Все в соответствии со вторым законом диалектики – законом перехода количества в качество. И все – в соответствии с принципами функционирования экономики: некоторое количество исходных сырьевых ресурсов в результате воздействия на них факторов производства, приобретают новое качество – становятся товаром.
Еще каких-то 20 лет назад человечество умело использовать с пользой для себя всего какие – то доли процента всего многообразия окружающих нас данных. Для этого предварительно информацию необходимо было структурировать и разместить в СУБД – системах управления базами данных. СУБД были громоздкими, медленными и не гибкими. Самый же существенный недостаток таких систем заключался в том, что они позволяли работать только с историческими данными, то есть с теми событиями, которые уже произошли. Конечно, путем несложных алгоритмов, таких как трендирование, экстраполирование и других, на основе исторических данных можно было делать некоторые приблизительные прогнозы для принятия управленческих решений. Но ценность таких решений была очень сомнительной.
Ситуация кардинальным образом поменялась с приходом в нашу жизнь инфраструктуры для обработки неструктурированных данных.
Наверное каждый из нас мечтал о путешествиях во времени. Хорошо было бы перенестись на несколько месяцев в будущее, подсмотреть, например, тамошний курс доллара к рублю и, вернувшись назад использовать полученное знание для улучшения своего финансового состояния. Есть такое?
Так вот, с наступлением эры больших данных, предсказывание будущего стало реальностью. Рассчитать будущие курсы валют и стоимость ценных бумаг с их помощью все также проблематично, а вот смоделировать с достаточной степенью достоверности будущее поведение людей на основании их прошлой и настоящей активности, вполне реально.
Но об этом мы поговорим в следующий раз.