NetApp Tech OnTap NetApp Logo
NetApp Tech OnTap
     
Оптимизация производительности баз данных
с помощью СХД All-Flash
Пол Ферестен (Paul Feresten)
Старший менеджер по маркетингу продукции
Майк Фелан (Mike Phelan)
Старший менеджер по продуктам

При работе с базами данных в разных сферах — от высокочастотного трейдинга до управления риском в реальном времени — доли миллисекунд зачастую решают все.

Производительность баз данных в значительной степени зависит от скорости выполнения операций ввода-вывода, поэтому предприятия все чаще отдают предпочтение системам хранения данных на базе флеш-технологий, которые позволяют снизить латентность ввода-вывода и повысить скорость обработки транзакций.

Выбор правильной СХД all-flash напрямую влияет на результаты деятельности компании: значительное ускорение обработки, уменьшение требуемого серверного оборудования, снижение расходов на лицензирование баз данных и существенная экономия пространства и электроэнергии (подробнее в статье Флеш-технология на службе производительности СХД в условиях стремительного прогресса данного выпуска).

Максимальная производительность баз данных

Многие годы администраторам баз данных приходилось решать проблему планирования и управления в системах хранения данных, чтобы добиться максимальной производительности при использовании относительно медленных дисков. Одним из самых эффективных методов был запуск часто используемых лог-файлов на быстрых, зеркальных дисках. Администраторы предпочитали выделять под задачи избыточные ресурсы, чтобы даже в случае большого количества конкурирующих запросов сохранить стабильное время отклика.

На смену медленным дискам с механическим приводом приходят массивы all-flash на базе твердотельных накопителей (SSD). Результаты говорят сами за себя во всех аспектах производительности. Количество операций ввода-вывода в секунду у SSD в сотни раз больше, чем у жесткого диска (HDD), а время доступа от миллисекунд до микросекунд.

Однако для достижения максимальной эффективности следует учитывать важные особенности архитектуры массивов all-flash для выполнения рабочих нагрузок высокопроизводительных баз данных. Чтобы воспользоваться всеми преимуществами низкой латентности флеш-систем, которая составляет всего доли миллисекунды, необходимо наличие чистого, оптимизированного канала передачи данных. Вообще важно, чтобы другие сервисы, запущенные на СХД, не ухудшали скорость доступа и производительность работы системы.

СХД NetApp EF560

Новый массив all-flash NetApp® EF560® — идеальное решение для обеспечения максимальной производительности решений на базе флеш-технологий при работе с критически важными базами данных. Новая платформа гарантирует полную и устойчивую производительность, соответствующую современным стандартам. Массив EF560 обеспечивает 650 тыс. операций ввода-вывода в секунду (IOPS) в малом форм-факторе 2U, а его среднее время отклика не превышает 800 микросекунд — все это демонстрирует, насколько важна архитектура системы хранения данных.Кроме того, массив EF560 воплотил в себе лучшие достижения надежности и готовности, совершенствуемые на протяжении восьми поколений операционной системы SANtricity.

Массив EF560 рассчитан на самые передовые технологии, реализуемые в высокопроизводительных базах данных. Центральные процессоры СХД используются для быстрого выполнения операций чтения и записи, а ресурсы хоста — для компрессии данных. В процессе обработки данных ничто не мешает операциям ввода-вывода, благодаря чему массив при нагрузке обеспечивает устойчивую латентность, составляющую всего доли миллисекунды. И на 1001-й день работы она остается такой же, как и в 1-й день.

Производительность БД соотносится с показателями диска, что позволяет добиться устойчивых, предсказуемых результатов. Оценив производительность и соотношение «цена-производительность» массива EF560 по ряду внутренних показателей, таких как количество операций ввода-вывода в секунду(IOPS) и пропускная способность, а также эталонным показателям SPC-1, мы получили превосходные результаты.

Производительность по операциям ввода-вывода

В первую очередь следует рассмотреть показатели EF560 при рабочих нагрузках чтения — наиболее часто выполняемых операциях с массивами all-flash. EF560 обеспечивает выполнение 650 тыс. непрерывных операций ввода-вывода в секунду при латентности в 800 микросекунд, занимая в стойке всего 2 юнита (2U). По сравнению с предыдущей моделью EF550 этот показатель усовершенствован на 62,5 %. Даже при пороговом значении производительности 500 микросекунд EF560 может обеспечить 628 тыс. операций ввода-вывода в секунду.

Чтобы спрогнозировать показатели производительности планируемых нагрузок, мы провели более тщательный анализ показателей производительности по операциям ввода-вывода в секунду для массива EF560 (тестируемая система: EF560 с 48 дисками SSD, памятью RAID 5 и блоками данных по 8 КБ).

Таблица 1. Производительность операций ввода-вывода в секунду массива EF560 при различных рабочих нагрузках чтения и записи.

Источник: NetApp, 2015 г.

Оценка производительности по тесту SPC-1

Для более тщательного анализа предлагаем ознакомиться с результатами тестирования массива EF560 по стандартам SPC-1 Комитета по тестированию систем хранения данных (Storage Performance Council, SPC), которые моделируют условия эксплуатации высокопроизводительной базы данных с интенсивными нагрузками чтения и записи (подробнее см. в разделе о тесте SPC-1 на боковой панели). В ходе теста массива показатель EF560 составил 245 011,76 IOPS™ (SPC-1) со средним временем отклика (ART) при нагрузке 100 %, равным 0,93 миллисекунд, или 930 микросекунд. При пороговом значении производительности 500 микросекунд показатель EF560 составил 196 008,41 операций ввода-вывода в секунду(IOPS) SPC-1 при времени отклика 0,53 миллисекунд (530 микросекунд). Как правило, стандартное количество операций ввода-вывода в секунду, требуемое заказчиком, составляет 80-120 тыс., что соответствует характеристикам массива EF560.

Рисунок 1. Кривая времени отклика EF560 по тесту SPC-1.

Источник: Краткий обзор EF560 по результатам теста SPC-1

Решение EF560 демонстрирует минимальное время отклика, предусмотренное тестом SPC-1 (измеряемое при нагрузке 10 %) для любой конфигурации согласно спискам лучших результатов SPC-1 «Top Ten» при времени отклика 0,18 миллисекунд (180 микросекунд). Значение LRT по тесту SPC-1 предусматривает минимально возможное время отклика для СХД. Подробнее см. в кратком обзоре или полном отчете теста SPC-1 массива EF560.

Уменьшение латентности в 20 раз и экономия места в стойке на 70 %
Насколько важны показатели скорости операций ввода-вывода и латентности, составляющие доли миллисекунды? Для повышения скорости платежных транзакций и повышения качества обслуживания клиентов крупный интернет-магазин принял решение о необходимости внедрения системы с низкой латентностью и очень высоким показателем надежности системы, поскольку каждая минута простоя значила для компании потерю значительных сумм дохода. Внедрение массива EF-Series позволило компании увеличить производительность баз данных Oracle, управляющих профилями продаж, и скорость обработки транзакций в 20 раз по сравнению с предыдущими показателями. Подробнее см. в истории успеха.

Соотношение «цена-производительность» по тесту SPC-1

Главной чертой теста SPC-1 является то, что он показывает стоимость на операции ввода-вывода в секунду ($/SPC-1 IOPS) для каждой тестируемой конфигурации. Для массива EF560 этот показатель составил 0,54 долл. США, что соответствует позиции №2 в списке лучших результатов SPC-1 по соотношению «цена-производительность» (SPC-1 Price-Performance™). Если оценивать результаты массивов со средним временем отклика менее миллисекунды, EF560 занимает первое место в списке.

Подробные сведения о тестировании EF560 по тесту SPC-1 см. в статье блога Dimitris Krekoukias на сайте RecoveryMonkey.org.

Пропускная способность

Еще одним важным аспектом производительности флеш-массива является пропускная способность или полоса пропускания. Хотя этот показатель упоминается реже, чем количество операций ввода-вывода в секунду, он определяет, насколько эффективно массив выполняет последовательные, а не случайные операции чтения или записи. Для всех баз данных важно выполнение последовательных операций (например log-файлы). Эффективная потоковая передача при сборе данных обеспечивает значительные преимущества для задач аналитики и встроенных в память баз данных.

Это еще одна область, в которой массивы EF560 отличаются от других систем. Если у конкурентов пропускная способность по операциям чтения составляет около 4 ГБ/с или 8 ГБ/с, то флеш-массив EF560 способен обеспечить значение 12 ГБ/с для чтения и 6 ГБ/с для записи.

Пропускная способность как фактор преимущества для бизнеса

Ежесекундный сбор данных. Руководитель ИТ-отдела бурового подрядчика обратился к специалистам NetApp для поиска решения, которое обеспечит сбор данных с буровой вышки каждую секунду. Ранее данные поступали каждую минуту, а значит, частота сбора данных должна была возрасти в 60 раз. Массив EF-Series позволил компании решить эту задачу, предоставляя компании более подробные данные для анализа каждую секунду и облегчая принятие важных решений.

Повышение частоты создания отчетов в 4 раза. Агентству недвижимости потребовалось повысить производительность базы данных, чтобы усовершенствовать приложение для аналитики национального рынка недвижимости, позволяющее собирать и перекомпоновывать данные для банковской, финансовой отрасли и сферы недвижимости. С внедрением массива EF-Series компания имеет возможность получать актуальные данные 4 раза в день, а не один раз, как раньше, что позволяет ускорить рассмотрение заявок на жилищное кредитование и значительно повысить уровень обслуживания клиентов.Подробнее см. в истории успеха.

Улучшение производительности EF560

Флеш-массив EF560 сочетает в себе четыре преимущества, обеспечивающие оптимизацию производительности.

  1. Повышенная скорость центральных процессоров. EF560 предлагает новые 6-ядерные процессоры Intel Xeon с частотой 2,2 ГГц, которые позволяют повысить скорость операций ввода-вывода почти вдвое.
  2. Поддержка многоядерной архитектуры SANtricity. Новое программное обеспечение SANtricity 8.20 распределяет рабочие нагрузки между ядрами, что, по результатам последних тестов, способствует повышению времени отклика на 50 %.
  3. Накопители SSD с низкой латентностью. Мы продолжаем применять впечатляющие улучшения технологии SSD, чтобы за счет расширения дискового пространства и снижения латентности добиться минимальной в отрасли стоимости операции ввода-вывода в секунду.
  4. Поддержка самых быстрых каналов связи с сетями передачи данных. Флеш-массивы EF560 отличаются расширенным набором дополнительных средств подключения к хосту для 8 портов SAS 12 Гбит/с и 4 портов InfiniBand 56 Гбит/с, в дополнение к стандартным 8 портам Fibre Channel 16 Гбит/с и 8 портам iSCSI 10 Гбит/с.

Усовершенствование управляемости и готовности EF560

Улучшения управляемости и готовности новых флеш-массивов EF560:

  • Возможность онлайн обновления микропрограммы накопителя;
  • перенос данных с неисправного диска (drive evacuator);
  • восстановление важнейших сегментов пулов DDP (рассмотрим эту функцию подробнее).

Массивы EF560 оснащаются сдвоенными контроллерами dual-active, размещаемыми в 2U полку с возможностью масштабирования до 120 SSD-накопителей (в данный момент доступны конфигурации емкостью 400 ГБ, 800 ГБ и 1,6 ТБ). Каждый массив обеспечивает сырое дисковое пространство объемом до 192 ТБ. Накопители SSD объединены в тома по технологии динамических дисковых пулов (Dynamic Disk Pools, DDP) или RAID уровней 0, 1, 5, 6, и 10.

Рисунок 2. Технические характеристики EF560.

Источник: NetApp, 2015 г.

Выбор способа защиты данных

При разработке флеш-массивов EF560 мы стремились наиболее полно описать возможности производительности и рабочие характеристики, чтобы облегчить выбор оптимальной конфигурации с учетом потребностей заказчиков. Конфигурация DDP стремительно набирает обороты, и сейчас она составляет 35 % от общего объема развернутых систем EF-Series, при установке которых клиенты получают рекомендации о преимуществах использования DDP по сравнению с другими уровнями RAID для тех или иных условий эксплуатации.

Чтобы выбрать оптимальный способ защиты данных, воспользуйтесь рисунком 2, на котором представлены уровни производительности. Оцените требования вашей системы и сопоставьте их с каждой схемой защиты данных. Затем выберите уровень защиты с требуемыми показателями производительности и дискового пространства.

Рисунок 3. Производительность EF560 в конфигурациях с RAID5, DDP и RAID 10.

Источник: NetApp, 2015 г.

Обратите внимание, что этот рисунок составлен с учетом рабочей нагрузки с использованием блоков данных размеров 8 КБ, соотношения операций чтения и записи 75 % к 25 %, а также порогового значения латентности 0,6 миллисекунд (600 микросекунд). Если увеличить процент операций записи, разделительные линии будут перемещены вниз для каждой конфигурации.

Решения для повышения производительности баз данных — выбор администраторов

Высокая скорость и устойчивая производительность массива all-flash зависит от его архитектуры. Массивы EF560 отличаются архитектурой, созданной для повышения производительности, что делает их идеальным решением для работы с критически важными высокопроизводительными базами данных. Количество систем EF560, установленных по всему миру, составляет около миллиона, а уровень их надежности можно назвать практически абсолютным (99,999%) — благодаря этому администраторы доверяют производительность своих СХД именно этим решениям.

Ресурсы

Пол Ферестен (Paul Feresten), ведущий менеджер по маркетингу продуктов, и Майк Фелан (Mike Phelan), ведущий менеджер по продуктам

Пол работает в компании NetApp с 2005 г. и в настоящее время отвечает за маркетинг продуктов, созданных на базе твердотельной технологии. Ранее он специализировался на базовом программном обеспечении NetApp, включая Data ONTAP, безопасности в многопользовательских средах и эффективности хранения данных. Пол имеет более 30 лет опыта работы в сфере управления, продажи и маркетинга продуктов, а также в области административного управления. До прихода в NetApp Пол работал в компаниях Data General, Digital Equipment Corporation, MSI Consulting и SEPATON. Он получил степень бакалавра наук в Бостонском университете и MBA в колледже Бабсон.

Майк пришел в компанию NetApp в апреле 2012 г. и в данный момент является менеджером по продуктам EF-Series. На предыдущей должности инженера по техническому маркетингу Майк отвечал за тестирование, создание материалов, обучение и проведение презентаций по продуктам E-Series и EF-Series. Он специализировался на SSD Cashe, динамических дисковых пулах и асинхронном удаленном зеркалировании томов.

Tech OnTap
Подписаться
Tech OnTap — это ежемесячные обзоры новейших информационных технологий, советы и практические рекомендации, знакомство с инструментарием, неформальные интервью с разработчиками, демонстрационные ролики, рецензии и многое другое.

Посетите Tech OnTap в сообществе NetApp, чтобы подписаться на рассылку.

Апрель 2015 г.

Будьте в курсе

О тесте SPC-1

SPC-1 — принятая в отрасли система контролируемых эталонных показателей, разработанная Комитетом по тестированию систем хранения данных и используемая для тестирования СХД в условиях случайных операций ввода-вывода различной интенсивности. Рабочие нагрузки содержат обработку запросов и обновлений, которые являются стандартными операциями при работе с приложениями, такими как OLTP, и базами данных. Тест SPC-1 предполагает значительно более строгие требования, чем обычная рабочая нагрузка при чтении малых блоков данных. Около 60 % нагрузок приходится на запись данных, что усложняет соответствие флеш-решений для СХД этому тесту.

Восстановление важнейших сегментов пулов DDP

Продукты EF-Series и E-Series созданы с использованием технологии динамических дисковых пулов (DDP), обеспечивающих равномерное распределение данных, сведений о четности и свободного дискового пространства по пулу дисков, упрощая процесс установки, исключая наличие критических участков и повышая КПД хранилища.

В последней версии SANtricity добавлена возможность восстановления важных сегментов пулов DDP. При одновременном отказе двух дисков система SANtricity автоматически определяет, какие сегменты содержали данные на обоих дисках и восстанавливает их в первую очередь для уменьшения рисков.

 
TRUSTe
Связаться с нами   |   Как купить   |   Обратная связь   |   Карьера в NetApp  |   Подписка   |   Политика конфиденциальности   |   ©© NetApp, Inc, 2015