К настоящему времени крупные организации накопили данные о миллионах клиентов и их действиях, своей операционной деятельности и т. д. – в целом многие терабайты структурированной и неструктурированной информации. И по данным McKinsey Global Institute, этот объем стремительно нарастает, при этом процессы их обработки и анализа занимают все больше времени, соответственно, и получать из них полезные для бизнеса знания становится все сложнее (углубленный анализ был либо слишком дорогим, либо очень сложным, занимая недели и месяцы). Однако появление нового класса аналитических инструментов сделало эту задачу возможной и доступной для целого ряда предприятий, использующих анализ для принятия оперативных и взвешенных решений. Так, экономисты исследовательского центра Cebr (Великобритания) подсчитали, что развитие технологий Больших Данных в ближайшие пять лет может принести экономике страны 216 млрд фунтов стерлингов и создать около 58 тыс. рабочих мест. Применение аналитики нового поколения для исследований и разработок может помочь созданию новых товаров и услуг и даже новых рынков, что к 2017 году даст экономике Великобритании 24,1 млрд фунтов стерлингов. Улучшение выявления случаев мошенничества позволит сэкономить порядка 2 млрд фунтов средств госбюджета, а повышение эффективности управления производительностью принесет еще 3,6 млрд фунтов.
Для решения бизнес-задач аналитическими методами организации нужно пройти определенный набор шагов, требующих вовлечения различных специалистов: от бизнес-менеджеров и бизнес-аналитиков до аналитиков-математиков и ИТ-специалистов. Сегодня SAS предлагает SAS High Performance Analytics – набор специализированного ПО для каждого из этих типов пользователей, предназначенного для различных способов распределенной обработки Больших Данных. SAS Grid Computing – первое решение из новой линейки, предназначенное для управления распределенными вычислениями в среде SAS при работе как на одном сервере, так и на большом количестве серверов (фактически, это некий аналог «облачных» технологий). Вторая технология – SAS In Database, разработанная около года назад, когда распределенная обработка достигается путем переноса вычислений с аналитического сервера SAS на сервер внешней базы данных. Максимальный эффект дает этот метод в условиях, когда аналитические модели разрабатываются на инструментах SAS, а корпоративное хранилище данных реализовано на СУБД другого вендора. Поскольку новые данные появляются именно в хранилище, то применение аналитических моделей оптимально выполнять, не извлекая данные большого объема из хранилища. Продукты серии SAS Scoring Accelerator переводят аналитические модели на язык партнерских СУБД и переносят их внутрь этих СУБД для регламентного применения. Например, сначала специалисты банка средствами углубленной аналитики выявляют факторы, определяющие вероятность невозврата кредита, а потом внутри хранилища данных проводится регулярная переоценка уровня кредитного доверия по всем клиентам банка.
Генеральный директор SAS Россия/СНГ Валерий Панкратов
И наконец, новейшая технология, которую и презентовали вчера специалисты компании в Москве, – это SAS In-Memory Analytics (распределенные вычисления в оперативной памяти блейд-серверов). Сегодня компания предлагает два продукта, работающих по технологии in-memory: средство визуализации данных SAS Visual Analytics и средство построения аналитических моделей SAS High Performance Analytics. SAS Visual Analytics сочетает в себе высокопроизводительные средства анализа и удобный графический интерфейс визуализации данных, позволяя бизнес-пользователям и аналитикам самостоятельно анализировать большие объемы данных и получать точные, наглядные и удобные для интерпретации отчеты. В свою очередь, продукт SAS High Performance Analytics позволяет алгоритмам основных существующих направлений аналитики выполняться на десятках и сотнях миллионов записей с очень высокой производительностью. Если раньше на анализ закономерностей и построение аналитических моделей требовались часы или даже дни, то теперь эти операции проходят за секунды и минуты. Например, банки, разрабатывая модели принятия решений о выдаче кредитов на основе регрессионного анализа, реально могут получить ускорение в 100 раз. Кроме того, на основе технологии SAS In-Memory Analytics, компания предлагает и три прикладных решения: SAS High Performance Risks (высокопроизводительный расчет уровня риска портфеля на рынках капитала), SAS High Performance Markdown Optimization (расчет оптимальной стоимости и скидок для розничной торговли) и SAS High Performance Marketing Optimization (определение оптимального предложения каждому клиенту).
Способность работать с Большими Данными за минуты вместо часов дает, прежде всего, точность и оперативность получения аналитических моделей. Если раньше аналитики оперировали лишь подвыборкой данных, то сейчас они могут проводить анализ на всей генеральной совокупности, что позволяет в некоторых случаях перейти на более детальный уровень анализа (например, не по клиентам, а по их транзакциям). Соответственно, запустить анализ можно большее число раз, что даст возможность лучше подобрать оптимальные настройки. Немаловажно и увеличение скорости получения результатов анализа – это существенно, например, для оперативной реакции на произошедшие изменения. Как это работает на практике, проверил один из крупных банков в США. За счет сокращения среднего времени работы аналитической процедуры с 5 часов до 3 минут появилась возможность применять больше видов алгоритмов в более сложной конфигурации. В результате точность моделей возросла с 1,6 до 2,5. Это означает, например, что на маркетинговое предложение откликнулось бы в полтора раза больше клиентов (отношение 2,5/1,6), чем если бы предложение рассылалось клиентам, выбранным менее производительной аналитической моделью, и в 2,5 раза больше клиентов, чем если бы они выбирались случайным образом. Условно говоря, не 100 человек из 1000 и даже не 160, а 250. В масштабах крупного банка дополнительная прибыль может составить внушительную сумму.
Решения SAS High Performance Analytics
«Решая задачи, связанные с анализом и визуализацией Больших Данных, компании получают весомые конкурентные преимущества в виде доступности обоснованных результатов аналитических исследований, проведенных на громадных объемах структурированных и неструктурированных данных, причем в условиях жестких ограничений по времени. Такой подход меняет саму парадигму ведения бизнеса, позволяя руководителям применять недоступные ранее методы и возможности для управления компанией. Умение оперативно анализировать Большие Данные предоставляет уникальные возможности для управления рисками и предотвращения индивидуального и группового мошенничества (вплоть до остановки подозрительных транзакций в режиме реального времени) в банках и страховых компаниях, для анализа больших потоков данных абонентов в телекоме, для сложных аналитических задач в энергетике, госсекторе и т. д. Список можно продолжать. По всей видимости, именно банковский сектор и телеком могут быть отраслями, где новые решения наиболее востребованы, экономически обоснованы и где сконцентрированы профессиональные кадры, способные использовать возможности нового ПО», – отметил генеральный директор SAS Россия/СНГ Валерий Панкратов.
Уже сегодня организации, применяющие на практике разработки High Performance Analytics, добились впечатляющих результатов. Одна из лидирующих мировых компаний смогла сократить время на решение задач оптимизации маркетинговых кампаний для 25 млн клиентов и 1000 различных продуктовых и сервисных предложений с 5,5 часа менее чем до 6 минут. Теперь стало возможным проводить моделирование различных сценариев и принимать решения, такие, как изменение бюджета или других параметров (например, количества операторов в колл-центре), которые могут существенно увеличить доход компании, полученный от целевого маркетинга. Что касается России, то говорить о многочисленных внедрениях пока не приходится, однако уже есть первые компании, использующие эти технологии. Например, в одном из топ-5 банков России для анализа поведения клиентов и управления кредитными рисками применяются специальные средства для анализа Больших Данных.
«В современной конкурентной среде помимо традиционных факторов успеха в банковской сфере, таких как стабильность, качественное обслуживание и привлекательная продуктовая линейка, все более важными становятся эффективность, скорость и гибкость изменений. Степень развития и использования этих факторов зависит от того, насколько комплексно вы видите рынок, своих клиентов и свои внутренние процессы, действия и результаты, насколько быстро и раньше конкурентов вы выявляете изменения, перспективы или угрозы рынка, а также как быстро осуществляете необходимые изменения действий банка и работы с клиентами. А для этого важно не просто обладать всем спектром необходимой информации в хранилище или аналитических системах, а иметь возможность быстро ею воспользоваться для получения ответов на сложные вопросы, требующие обработки огромных массивов данных», – подтверждает вице-президент, заместитель директора финансового департамента банка ВТБ24 Сергей Анохин.
Сферы использования SAS In-Memory Analytics
Как отметили специалисты SAS, в настоящее время наметился тренд все большего использования аналитики при принятии решений. И хотя, с одной стороны, происходит демократизация интерфейсов (создание аналитической модели в три-четыре клика), важнейшие решения, принимаемые с помощью аналитики, будут продолжать использовать экспертные модели. Другое дело, что на самый верх будет поступать уже проанализированная информация аналитиками, готовые решения, плюсы и минусы, на основе которой высшее руководство и будет принимать решения. В частности, это подтверждает и Сергей Анохин из ВТБ24. С другой стороны, благодаря использованию аналитики в оперативном управлении происходит реальное изменение всех бизнес-процессов. «К примеру, необходимо принять решение о выдаче кредита в удаленном подразделении банка. Квалифицированного аналитического персонала там нет, но есть статистическая модель, которая может подсказать операционисту правильное решение. Таким образом, реально это решение можно опускать вниз и масштабировать его без необходимости повышения серьезной квалификации персонала. Это приводит также к тому, что онлайн-решения для анализа текстовой и речевой информации (text maining) call-центров, операционных и центров продаж вообще не требуют вовлечения человека, все делается на основе статистики. Это упрощает, удешевляет все операции», – отметил в заключение генеральный директор SAS Россия/СНГ Валерий Панкратов.
Напомним, что компания SAS является крупнейшей в мире частной IT-компанией, специализирующейся на разработке и продаже решений и услуг в области бизнес-аналитики. Основанная в 1976 году, сегодня она располагает 400 офисами по всему миру, в которых работают более 12 тыс. сотрудников. Доход в 2011 году составил $2,725 млрд, показав 12%-ный рост, четверть доходов вкладывается в R&D. Клиентами SAS являются более 55 тыс. организаций в 127 странах мира, среди них 93 компании из первой сотни лидеров, включенных в список «2010 FORTUNE Global 500». В России и странах СНГ компания SAS начала работу в 1996 году. Заказчикам компания SAS предлагает полный спектр решений и услуг в области бизнес-аналитики: консалтинг, внедрение, обучение и техническую поддержку. Клиентами SAS в России и СНГ являются РЖД, МТС, «МегаФон», Сбербанк России, группа ВТБ, Газпромбанк, «Альфа-банк», ЮниКредит банк, Райффайзенбанк, Ситибанк, GE Consumer Finance, Банк «Возрождение», Банк «Тинькофф Кредитные Системы» и другие компании.