Ведущий эксперт подразделения по управлению данными Павел Живулин, отдел ПО, IBM в России и странах СНГ: «Мы сумели осуществить временной сдвиг, одновременно удешевив процесс обработки и хранения информации»

В октябре 2012 года IBM объявила о выпуске трех новых продуктов, оптимизированных для выполнения аналитических рабочих нагрузок: PureData for Transactions, PureData for Analytics и PureData for Operational Analytics. Об этих новых решениях можно было услышать, в частности, на конференции «Новые задачи ИТ в эру разумных вычислений: стратегия, решения, технологии», которая прошла 22 ноября 2012 года в Москве. На этом мероприятии ведущий эксперт подразделения по управлению данными IBM в России и странах СНГ Павел Живулин прочитал доклад на тему «Новое поколение экспертных систем для анализа больших объемов данных (BigData)». С ним корреспонденты ICT-Online.ru и побеседовали о подобных решениях для SMB, а также о развитии инструментов бизнес-аналитики.

 Павел, логично решения PureData использовать в крупном бизнесе, а возможны ли конфигурации для SMB? Какими параметрами должна обладать «малая» компания, чтобы ей было интересно данное решение? 

 - Давайте для начала обрисуем понимание, какие компании относить к SMB. В нашем понимании маленькая организация - это несколько сотен (не больше тысячи) сотрудников. Но такая компания тоже может иметь огромный оборот и продажи. Следовательно, она может работать с огромным количеством данных. Размер потенциального клиента определяется по разным критериям. Современные компании нередко отличаются от традиционных по количеству персонала, выработке, доходам. Относительно небольшие студии компьютерных игр для мобильных телефонов, например, зарабатывают сотни миллионов долларов за небольшой период времени. Это сопоставимо с доходами некоторых промышленных предприятий, заводов, где работают десятки тысяч человек.

Поэтому отвечу так: наше решение будет интересно компаниям, которые работают с конечным потребителем - не важно, к малому или среднему бизнесу они относятся. Благодаря PureData for Analytics бизнес сможет сконцентрироваться на работе с клиентскими данными, а не с ИТ-инфраструктурой. Ведь их работа – анализировать поведение клиентов, создавать продукт, который больше отвечает чаяниям клиентов, а не перенастраивать серверы. И мы берем на себя задачу работы с данными, упрощаем ее. Клиенту остается только анализировать и зарабатывать на этом деньги.

Нюанс в том, что многие организации малого бизнеса являются некоторого рода ИТ-стартапами. Они планируют свой путь развития, продажу бизнеса, им важно иметь ИТ-инфраструктуру, где минимум персонала обеспечивает максимум производительности. PureData – программное-аппаратное решение с умеренными входным порогом и стоимостью По сути, все решения для BigData - это программно-аппаратные комплексы или ПО , которое работает на любом «железе». Возможны комбинации программного и аппаратного обеспечения, то есть, можно всегда выбрать что-то, что подойдет данной организации.

 В таком случае, какими минимальными объемами данных должен располагать клиент, чтоб запуск PureData был актуален для него?

 - Данные пользователя PureData должны исчисляться терабайтами и иметь высокие темпы роста. Несколько терабайтов информации, управление и проведение над ними аналитических операций, уже требуют серьезной инфраструктуры. Мы считаем, что 2-3 террабайта данных – это повод задуматься о системе, подобной PureData.

Возможна ситуация, когда данных меньше, но требуются очень высокие скорости их обработки. Тогда PureData тоже будет актуальна, ее производительность гораздо выше производительности традиционных СУБД.

Кроме того, не все организации среднего и малого бизнеса имеют возможность содержать больший ИТ-департамент. Поскольку наша система экспертно интегрированная, де-факто клиенты сокращают необходимость в качественных ИТ-специалистах. ИТ-служба, поддерживающая PureData, может работать в режиме on-demand, либо включать персонал не самой высокой квалификации, поскольку продукт достаточно прост.

 Каким образом можно приобрести решения PureData?

 - У нас есть демо-пул этих продуктов, их можно установить и сперва посмотреть, насколько они удовлетворяют вашим требованиям. В случае принятия решения о покупке можно работать как с нашими партнерами, так и со специалистами IBM по решениям BigData.

Важно иметь ввиду, что IBM рассматривает подобные решения и в «облаке». Малое предприятие может вообще не платить за инфраструктуру и программный продукт, а взять его в аренду, что гораздо дешевле. О запуске «облачных» версий PureData будет объявлено позже. Сloud – неотъемлемая часть стратегии IBM, мы постепенно переносим все больше и больше продуктов в «облако». Мы делаем это для того, чтоб охватить все организации, в том числе те, у которых нет ресурсов на аппаратное обеспечение. Кстати, сами сотрудники IBM активно используют cloud в повседневной работе: у IBM есть социальные сети, которые базируются в «облаке», почтовая система.

 Расскажите детальнее про конфигурации для SMB.

 - Для 80 % клиентов SMB можно использовать младшую систему в линейке PureData for Analytics, она позволяет хранить 8 терабайт несжатых пользовательских данных, примерно 32 терабайта – со сжатием. Эта система наиболее подходит тем организациям, которые только начинают работать с большими данными. Она обеспечивает огромный прирост производительности по сравнению с традиционными системами и позволяет экономить на стоимости приобретения и поддержки. Система полностью интегрированная, что удобно: минимум расходов на какие-то сторонние вещи, лицензирование тоже очень простое. В прайс-листе в одну строчку включено все. В том числе, мы обучаем специалистов клиента. Человек, который имеет представление об SQL, Unix, работе с базами данных – сможет работать в PureData for Analytics уже через 5 дней.

Если процесс внедрения традиционных хранилищ данных занимает месяцы, то в случае с PureData for Analytics он сокращается в разы - до месяца. После того, как систему привезли, установили, включили и начали загружать данные – проходит всего несколько часов, и в ней можно работать. Система совместима с традиционными СУБД, в нее можно перенести уже имеющуюся схему данных. Нужно только учитывать, что даже при больших объемах информации вы можете смело забыть обо всех ограничениях, какие встречались при работе с традиционными системами. Когда люди начинают понимать, что данные можно не по строчке загружать, а миллионами строк, они полностью меняют инжиниринг данных. PureData for Analytics настолько быстрая, что нужно просто правильно распределить в системе данные, все остальное она сделает за вас.

 Как вы оцениваете в целом важность BI-инструментов сегодня?

 - В мире сейчас столько интеллектуальных активов – это и промышленные системы, и компьютерные, и производственные, и все они генерируют какую-либо полезную информацию. Например, двигатель современного самолета за время полета генерирует несколько гигабайт информации, которую потом можно скачать, обработать и применить полученные полезные знания в дизайне новых двигателей или сервисном обслуживании. Даже «ок» в социальных сетях можно использовать по-разному, например, для кликстрим–анализа. По кликам грамотный маркетолог может оптимизировать структуру интернет-магазина, чтобы каждый клик вел посетителя сайта к желанной для бизнеса цели, чтобы демонстрировалась именно та реклама, в которой пользователь в данный момент заинтересован.

Кликстрим-анализ является сейчас одним из основных способов монетизации сайтов у банков и операторов связи. В России есть примеры банков, которые используют интернет-технологии, базирующиеся на продуктах IBM. Например, один из заказчиков IBM из финансового сектора использует наши платформенные решения в своем пакете инфраструктурных решений. У этого клиента очень эффективный и интересный интернет-банк. Также в разных странах мира много сотовых компаний, которые используют наши продукты для оптимизации веб-сайтов. Их усилия направлены на то, чтобы продать услугу или наиболее эффективным способом получить обратную связь от клиента. Поддержку клиентов можно выстроить так грамотно, что люди будут чувствовать, что оператор о них заботится. А определяет это всего лишь эффективность кликов на страничке оператора.

Но порой люди не знают, как с большими объемами данных поступать. С появлением такой системы, как PureData, мы можем эти данные дешево хранить, эффективно обрабатывать и, к тому же, делать это так быстро, как того требует бизнес. С помощью PureData клиент может анализировать работу компании. Допустим, руководитель отдела может сразу видеть, кто из сотрудников показывает хорошую производительность, а кого нужно учить или переводить на другое место работы. Вариантов много: бизнес-аналитика работает практически везде. Основное, что я сейчас вижу – надо учить людей работать с бизнес-аналитикой. Чем больше будет аналитиков, тем бизнес будет умнее.

 Какие компании являются партнерами IBM в этом направлении?

 - У IBM есть схема авторизации по определенным продуктам, и любая компания может зарегистрироваться на нашем веб-сайте, затем пройти экзамены и стать авторизованным представителем по тому или иному продукту. У нас уже есть ряд партнеров по BI-решениям - это либо системные интеграторы широкого профиля, либо компании, которые специализируются на бизнес-аналитике и предиктивной аналитике. Их около 4 тыс., по запросам заказчиков мы готовы выслать полный список партнеров, работающих в настоящий момент с нужным заказчику продуктом.

 Демо-версии BI-решений также доступны на сайте IBM?

 - Нет, нужно послать запрос, и мы выдадим дистрибутив. Это делается потому, что мы хотим сразу обеспечивать поддержку решения. Инженеры, которые занимаются предпродажами, помогают правильно выбрать решение для работы с данными, устанавливают у заказчиков программные решения и помогают начать работу. Также мы можем предоставить демо-оборудование от партнеров, либо предложить то оборудование, которое стоит у нас в инженерном центре. Вы приносите свои данные, мы создаем виртуальную машину, воссоздаем ваше BI-окружение, тестируем, как все это будет работать.

Время, которое нужно для того, чтоб прогнать все типовые тесты, весьма незначительное. Наши инженеры справляются за несколько дней. Основная работа - подготовительная: данные нужно проверить, подготовить, обезличить, для того чтоб соблюсти закон о защите персональной информации. После того как данные залиты в нашу машину, через несколько часов мы получаем первый результат. Серьезный тюнинг занимает несколько дней, но его заказывают редко; как правило, уже после получения первых цифр заказчик понимает целесообразность приобретения продукта.

 По вашим наблюдениям, велик ли интерес к PureData?

 - Интерес очень большой, некоторые заказчики IBM внедрили бизнес-аналитику несколько лет назад и сейчас столкнулись с тем, что те объемы данных, которые накопились в системах бизнес-аналитика или предиктивной аналитики не обрабатываются с необходимой скоростью. То есть, обработка занимает дни, часы, а требуется, чтоб все было готово за минуты. Можно сказать, что мы сделали временной сдвиг, при этом удешевив весь процесс обработки и хранения информации.


Подробности

Павел Живулин

Окончил Московский государственный технический университет радиотехники и автоматики (МИРЭА) (1991-1997 года). В IBM Восточная Европа/Азия работает с 2011 года.

Компания IBM

Пришла в Россию в 1974 году. За десятилетия деятельности в России компания IBM учла российскую специфику и выработала оптимальную схему предложения продукции и услуг. Особое внимание уделяется развитию отношений с бизнес-партнерами.

Автор: Наталия Хильченко, Анна Тумакова.

Тематики: Интеграция, Оборудование

Ключевые слова: IBM