Научная статья на тему 'Sap Hana в контексте тенденций развития информационных технологий'

Sap Hana в контексте тенденций развития информационных технологий Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
378
69
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Sap Hana в контексте тенденций развития информационных технологий»

Владимир Андреевич Поборцев

Старший директор AGS, SAP SE.

SAP HANA В КОНТЕКСТЕ ТЕНДЕНЦИЙ РАЗВИТИЯ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ

Управление жизненным циклом информационных бизнес-систем. Real-Time Enterprise 2.0

Значение информационных технологий постоянно увеличивается, ИТ оказывают огромное влияние практически на все аспекты и области нашей жизни и стали ее неотъемлемой частью. Это влияние будет расти все больше и больше с развитием уровня имеющихся и появлением новых технологий.

Рассмотрим, в каких направлениях пойдет развитие ИТ в ближайшее время. При этом я буду опираться на уже сформировавшиеся тенденции и исходить из имеющихся ныне на рынке технологий. Хочу сразу оговориться: данные рассуждения носят чисто субъективный характер и представляют мое личное видение этого вопроса.

Первая тенденция, которая прослеживается уже сейчас, это отход от разработки сложных платформ в области бизнес-приложений. До настоящего времени крупные производители программного обеспечения предлагали своим клиентам сложные программы-конструкторы с обширным набором инструментов. Упор делался на универсальность. Приобретая такое программное обеспечение, пользователь получал возможность настроить его под свои нужды индивидуально, для выполнения задач, входящих в зону его ответственности. Конечно же, в большинстве случаев каждый отдельный пользователь работал лишь с малой частью функциональности такой программы и вряд ли когда-либо задействовал все ее возможности. Производители — создатели таких программ, как правило, содержат в штате целые команды экспертов для изучения рыночного спроса. Если речь идет о бизнес-приложениях, то изучаются отдельные отрасли экономики, учитываются региональные требования и другие аспекты. В результате появляется программа-конструктор, уровень универсальности которой исключительно высок. Конечно же, как всякий конструктор, такая программа требует преднастройки, порой весьма затратной. Эту рыночную нишу уже несколько десятилетий весьма успешно занимают консалтинговые фирмы, оказывающие клиентам услуги по настройке таких программ. При этом всегда находятся клиенты, которым даже в самом универсальном конструкторе не хватает преднастроенных решений. К тому же на этапе жизненного цикла у пользователей постоянно возникают новые требования, диктуемые бизнесом, внешней средой и другими факторами. Производители программного обеспечения регулярно выпускают заплатки, расширяя функциональные возможности своих продуктов. Однако многое по понятным причинам остается за бортом так называемого стандартного пакета. Такие требования квалифицируются как индивидуальные, и для их реализации часто требуется дополнительная разработка. Именно это становится наиболее затратной статьей расходов большинства клиентов на всем протяжении жизненного цикла программного обеспечения.

Еще одним недостатком сложных программ-конструкторов, как правило, является, как это ни странно звучит, недостаточная гибкость. Ограничения платформенного характера или связанные с техническим дизайном зачастую осложняют реализацию индивидуальных требований пользователей ПО. Речь идет в первую очередь об эргономичности, удобстве и простоте. Зачастую всё это приносят в жертву универсальности и стандартности. А ведь именно удовлетворенность пользова-

В.А. Поборцев. SAP HANA в контексте тенденций развития информационных технологий

телей, работающих с программой ежедневно, является мерилом качества и успеха производителей ПО.

Сейчас, с появлением апплетов, ситуация кардинально изменилась. На пользовательских устройствах появились апплеты — простые приложения с ограниченным объемом функциональности, но чрезвычайно удобные в повседневном использовании. С каждым днем их становится больше, при этом многие апплеты практически полностью дублируют функциональность друг друга и различаются лишь в части пользовательского интерфейса. Происходит нечто наподобие естественного отбора: неудачные апплеты пользователи отсеивают.

Необходимым условием для развития апплетов является универсальная платформа, управляющая и предоставляющая данные по принципу единого источника правды (single source of truth). Ведущие производители ПО, к которым относится и SAP, достаточно давно идут по этому пути, и платформы такого рода уже доступны. SAP предлагает клиентам платформу HANA, созданную на базе технологии inmemory.

Переход от сложных программ-конструкторов к апплетам несет с собой также кардинальные изменения в экосистеме, существующей вокруг информационных технологий. Огромное количество данных, в том числе не агрегированных, поступающих из разных источников в режиме реального времени, открывает новые горизонты, заставляя пересмотреть представление о реляционной модели базы данных как индустриальном стандарте. Но одновременно появляются и дополнительные пожелания к программистам. Очевидно, что все более востребованными становятся навыки по управлению большими потоками данных, умение выбирать из общего потока нужные данные и правильно преподносить их пользователю посредством удобного и эргоноямичного интерфейса. Спрос же на специалистов по настройке сложных программ-конструкторов будет постепенно снижаться. Эти изменения окажутся достаточно масштабными и затронут целый спектр ИТ-компаний, специализирующихся на предоставлении такого рода услуг.

Еще одна ожидаемая тенденция — получение прибыли от управления большими потоками и объемами данных. Словосочетание «большие объемы данных (big data)» все чаще встречается в прессе. Сегодняшний уровень развития технологий позволяет создавать и накапливать действительно большие объемы данных. В первую очередь речь идет о разного рода датчиках, которые могут работать круглый год 7 дней в неделю 24 часа в сутки в режиме реального времени и генерировать огромные массивы данных. Сам по себе этот факт еще не повод говорить о выгоде для бизнеса и о конкурентных преимуществах для компании, которая данными владеет. У компании не увеличится количество клиентов, не вырастут продажи лишь из-за того, что она владеет большими массивами данных. Но как только та или иная компания поймет, что именно с этими данными надо делать для получения выгоды, как они сразу превратятся в капитал.

Некоторые производители автомобилей уже сейчас оснащают их электронными устройствами, непрерывно запоминающими данные телеметрии с датчиков агрегатов автомобиля, временные показатели и данные геолокации. Подспудно каждый

Управление жизненным циклом информационных бизнес-систем. Real-Time Enterprise 2.0

понимает, что иметь эти данные полезно. Но ответить на вопрос, что же с ними надо делать, чтобы получать выгоду, пока мало кто может. На сегодняшний день эти данные если и используются в бизнесе, то не в полной мере. Очевидно, что тот, кто первым научится полноценно их использовать, кто сумеет создать на этой основе бизнес-модель, получит колоссальные конкурентные преимущества и откроет новые возможности ведения бизнеса. На эту тему уже сейчас идут достаточно активные дискуссии. Я уверен, что они продолжатся и в будущем.

Следующую тенденцию можно обозначить как реальную мощь огромных массивов данных, которая будет способна заменить людские ресурсы, экспертов в тех или иных областях.

Каждый, наверное, слышал о шахматных компьютерах. Долгое время они совершенствовались. И если раньше у человека был реальный шанс обыграть такой компьютер, то теперь эта задача стала практически не по силам ни одному гроссмейстеру. Значит ли это, что ученые создали машину, обладающую настолько развитым интеллектом, чтобы понимать все нюансы игры в шахматы как таковой? Отнюдь нет. Компьютер всего лишь делает анализ всех записанных за многие годы шахматных партий и выбирает оптимальный ход на основе неких хитроумных алгоритмов. Теоретически, такую же работу компьютер мог выполнять и десять, и двадцать лет назад. Но если раньше на то, чтобы просчитать оптимальный ход, уходили десятки часов, то сегодняшний уровень развития технологии позволяет делать это за секунды, практически в режиме онлайн.

Вот еще один пример реальной мощи огромных объемов данных. В последние десятилетия ученые вложили много усилий в то, чтобы в полной мере реализовать машинный перевод с одного языка на другой. При этом за основу бралась научная сторона, язык рассматривался с точки зрения его лингвистических характеристик. Ученые пытались научить машину «человеческому» языку. Были созданы комплексные лингвистические модели, и даже достигнут некоторый успех. Но как-то одному программисту пришла в голову простая идея. Он предположил, что кто-то когда-то уже перевел каждое известное человечеству слово на тот или иной язык, и все варианты переводов доступны в различных уголках всемирной сети Интернет. Поэтому вместо того, чтобы создавать сложные лингвистические модели, достаточно поискать в Интернете уже доступные варианты перевода, сделанные кем-то ранее. Обработав результаты поиска по определенному алгоритму, компьютер выдает вполне приемлемый переведенный текст. Именно по такому принципу работает Google Translate. При этом компьютер ничего не знает о языке, а лишь выполняет поиск и обрабатывает его результаты по определенным правилам. Конечно же, эта идея не могла быть реализована на базе нескольких десятков интернет-страниц. Но когда речь идет о миллиардах страниц, все начинает выглядеть совсем иначе.

Оба примера* наглядно показывают, что огромные массивы данных представляют собой реальную мощь. Машина пока что не способна заменить человека, его интеллект. Но в данном случае это и не требуется. Само по себе управление огром-

* Примеры взяты из выступления доктора Штефана Зигга, SAP SE.

В.А. Поборцев. SAP HANA в контексте тенденций развития информационных технологий

ными объемами данных в короткие промежутки времени, что на сегодняшний день стало возможным благодаря развитию технологий, позволит в будущем если не заменить человека полностью в тех или иных профессиях, то предоставить ему существенную поддержку в процессе принятия решений. При этом речь идет, как правило, об экспертах высокого уровня и уникальных экспертизах.

Умение предсказывать будущее — еще один тренд развития ИТ. Нет ничего более страшного для бизнеса, чем упущенные возможности, когда есть спрос на твой товар, а ты не можешь его удовлетворить. Практически все руководители компаний на вопрос, какую задачу они мечтают решить больше всего, в один голос утверждают, что им хотелось бы научиться предсказывать спрос на их товар. Они хотели бы иметь такую систему, которая могла бы предсказывать спрос на товар в определенное время и в определенном месте. Таким образом, они получили бы возможность оптимизировать закупки, производство, логистические цепочки и склады.

Безусловно, это очень интересная область, и ведущие производители ПО должны сконцентрировать усилия на этом направлении. Следует отметить, что качество предсказаний напрямую зависит от качества и объема исходных данных. Причем большие объемы данных должны быть уникальными, то есть без ненужного дублирования. И, как уже было сказано ранее, поверх этих данных устанавливаются апплеты. Думаю, что одним из наиболее востребованных был бы апплет по предсказанию будущего спроса на товар. Но каким он будет, пока еще неизвестно. Ведь речь сегодня идет о тенденциях развития ИТ в будущем. Вообще, тема предсказания будущего намного шире, и она не ограничивается лишь предсказанием спроса на товар. Поставщики также могут удовлетворять наш спрос не безгранично — к примеру, если речь идет о продукции сельского хозяйства, где на урожай влияет множество факторов, в том числе погода. Система, умеющая предсказывать пределы объемов поставок сырья вашими поставщиками, тоже была бы востребована. Этот список можно продолжить.

Давайте поговорим о частных данных пользователей. В последнее время мы часто слышим о всякого рода разоблачениях, о слежке, к примеру, со стороны Агентства национальной безопасности США. При этом мы испытываем неприятные ощущения, представляя, что и к нашим частным данным кто-то имеет доступ без нашего на то разрешения. Но, несмотря на это, вечером мы все равно садимся за компьютер, чтобы запостить свежую информацию и початиться в соцсети. Безусловно, частные данные подлежат защите. Но с другой стороны, можно также понять и компании, которые хотят использовать наши частные данные для того, чтобы делать нам индивидуальные предложения. Ведь сейчас маркетинг делит целевую аудиторию на сегменты и пытается адресовать отдельным сегментам те или иные товары и услуги. На это тратятся огромные средства, а эффект от такого подхода практически минимальный. Так, находя в почтовом ящике очередной проспект с рекламой страховки, мы не глядя бросаем его в урну. Но если бы компании имели возможность не делить целевую аудиторию на сегменты, а работать с отдельными людьми, то эффект был бы намного выше. К примеру, если бы страховая компания знала о том, что я вчера делал запрос в поисковике о страховании дома от пожа-

Управление жизненным циклом информационных бизнес-систем. Real-Time Enterprise 2.0

ра, она могла бы выслать мне рекламный проспект с актуальными предложениями по страхованию недвижимости. Не исключено, что в таком случае я бы насторожился, удивившись, как много знает обо мне страховая фирма. Но возможно и то, что я не выкинул бы такой проспект не читая, а обратил бы на него пристальное внимание.

Таким образом, налицо два взаимозависимых тренда. С одной стороны, это стремление сохранить приватность данных. С другой стороны, это стремление бизнеса перейти от сегментов к индивидуальному подходу к каждому клиенту.

Эти тренды в будущем обязательно будут оказывать влияние на развитие ПО.

Рассмотрим один из примеров развития в вышеуказанных направлениях. SAP HANA отличается от своих конкурентов с точки зрения ее технических характеристик, так как это (1) полностью реализованная в оперативной памяти база данных (2) с поиском по столбцам и (3) высоким уровнем параллельности. Эти три характеристики вместе уже достаточно уникально описывают HANA. Они хорошо задокументированы и описаны в литературе. Поэтому можно себе теоретически представить, что некая сильная команда разработчиков решит создать некий альтернативный продукт с такими же характеристиками.

Трехуровневая информационная система состоит из серверов баз данных, серверов приложений и клиентского ПО. Именно так реализовывались практически все продукты SAP до появления HANA: ERP, CRM, SRM и другие. Рассмотрим пример. Пусть пользователю необходимо рассчитать конфигурации вариантов материала. Приложение делает запрос в базу данных, получает оттуда результат, обрабатывает его и форматирует для представления пользователю. Но на определенном этапе мы начинаем сталкиваться здесь с ограничениями. Если пользователь захочет рассчитать конфигурации вариантов сложного объекта, к примеру, целого автомобиля, в режиме онлайн, расчет будет делаться слишком долго. Объяснение здесь простое: для расчета конфигурации вариантов сложного объекта приложение запрашивает из базы огромное количество данных. И так как по законам физики чтение и передача этих данных занимают некое продолжительное время, весь процесс оказывается сильно растянут.

«Данные к функциям» — до появления HANA все решения SAP работали именно таким образом. Данные извлекались из базы и предоставлялись различным функциям, таким как расчет конфигурации вариантов материала, расчет цены, любые отчеты FI и др. И в большинстве случаев причиной медленной работы функций было то, что они запрашивали слишком большое количество данных из базы.

Каким же образом мы это изменили? Мы больше не доставляем данные к функциям, а наоборот, доставляем функции к данным. HANA, полностью реализованная в оперативной памяти база данных с поиском по столбцам и высоким уровнем параллельности, позволяет нам теперь это делать. Другими словами, мы заново определили границу между приложением и базой данных. Традиционные базы данных созданы под другие реалии. Аппаратные средства 40 лет назад, когда появились первые концепты традиционных баз данных, были совсем другими. Теперь, с использованием современных технологий и аппаратных средств, мы можем де-

В.А. Поборцев. SAP HANA в контексте тенденций развития информационных технологий

Любые приложения

Any App Server

Поддерживает

различные

устройства

У

SAP Business Suite

an BW ABAP App Server

SOL MDX R JSON Open Connectivity

I I I I I

Платформа SAP HANA

SQL, SQL Script, JavaScript

Простран- ственный Поиск Анализ текста Хранимые процедуры и модели данных

Библиотека Библиотека Службы Движок

бизнес- интеллек- базы планирова-

функций туального данных ния

Службы интеграции

Приложения и UI-сервисы

Движок

правил

Транз- Неструктури- Компьютер Hadoop Режим Объекты Другие

акция рованность реального приложения

времени

лать на уровне базы данных намного больше, чем прежде. Сервер стандартной конфигурации сегодня может иметь 16 процессоров (юнитов) по 15 ядер в каждом и управлять 12 терабайтами оперативной памяти. И это лишь один компьютер. А ведь мы теперь умеем распределять данные на несколько компьютеров (т. н. ноды). Если вдруг 12 терабайт будет недостаточно, можно просто добавить еще один, два, или даже двадцать таких компьютеров и распределить задачу между ними.

Переопределив границу между уровнем приложений и уровнем базы данных, мы добавили в последнюю множество объектов и инструментов. Теперь это не только язык SQL, но и те функции, которые раньше были реализованы в приложении. Все функции работают с одними и теми же данными, но все это происходит в оперативной памяти. Мы можем выполнять поиск при помощи поисковой машины (search engine), у нас наконец-то появился планировщик (planning engine) прямо в базе данных, с помощью которого мы можем симулировать, например, расчет бюджета и многие другие операции. Основное отличие HANA от конкурентов — наличие всех библиотек (library)

Платформа SAP HANA.

SAP HANA Platform Converges Database, Data Processing and Application Platform Capabilities & Provides Libraries for Predictive, Planning, Text, Spatial, and Business Analytics to enable business to operate in realtime

Управление жизненным циклом информационных бизнес-систем. Real-Time Enterprise 2.0

и машин (engine), представленных на рисунке в составе SAP HANA Platform. Причем список этот далеко не полный.

Новая платформа позволяет теперь разрабатывать приложения намного быстрее и эффективнее, а также создавать такие приложения, которые раньше невозможно было даже представить. Мы только сейчас по-настоящему начинаем осознавать, с каким огромным потенциалом имеем дело.

ЛИТЕРАТУРА

1. Plattner H., Zeier A. In-Memory Data Management: An Inflection Point for Enterprise Applications. — Berlin: Springer, 2011.

2. Belzer J. Very Large Data Base Systems to Zero-Memory and Markov Information Source // Albert G. Holzman (Hrsg.): Encyclopedia of Computer Science and Technology, 14. — Marcel Dekker Inc., 1980.

3. Plattner H., Meinel Ch., Weinberg U. Design-Thinking. — Munchen: mi-Wirtschaftsbuch, 2009.

4. Dokumentation zu SAP HANA. [Электронный документ]. — http://help.sap.com/ hana_platform.

5. SAP HANA als Entwicklungsplattform — Mehr als eine Datenbank. [Электронный документ] — http://entwickler.de/artikel/Mehr-als-eine-Datenbank-166293.

6. SAP.info — Projekte und Neuigkeiten rund um SAP HANA. [Электронный документ] — http://de.news-sap.com/topics/sap-hana/.

i Надоели баннеры? Вы всегда можете отключить рекламу.