Что такое GlusterFS?

GlusterFS — это распределенная, произвольно масштабируемая файловая система, которая объединяет компоненты хранения данных с нескольких серверов в одну, единую файловую систему. Файловые системы работают в фоновом режиме. Почти никто не задумывается о них после установки. Однако чаще всего ситуация меняется, когда данные теряются или файловая система достигает своих пределов, например, из-за достижения максимального размера раздела или из-за ограничений на глубину сегментов пути хранения.

Кто и что стоит за GlusterFS?

Название «Gluster» — это комбинация слов «GNU» (само по себе сокращение от «GNU — не Unix!») и «кластер». Система была опубликована под лицензией GNU-General Public License (GNU-GPLS), что делает ее бесплатной для использования. Термин «кластер», применительно к носителям данных, используется для описания комбинации физических единиц хранения. По отношению к компьютерам он используется для обозначения связанной сети из нескольких систем. GlusterFS объединяет эти понятия, объединяя пространство для хранения данных с компьютеров, соединенных по сети, и используя его как единую логическую сущность.

Проект был опубликован в 2005 году компанией Gluster Inc. В 2011 году дистрибьютор Linux RedHat взял на себя управление компанией и с тех пор продолжает развивать файловую систему. Версия 7 GlusterFS дебютировала в январе 2020 года и была предварительно скомпилирована для следующих дистрибутивов Linux:

  • CentOS
  • Debian
  • Fedora
  • RedHat/RHEL
  • SUSE
  • Ubuntu

Ограничением для систем на базе Unix является интеграция памяти в модуль FUSE, который еще не стал достаточно стабильным для систем Windows.

Примечание

FUSE — это аббревиатура от Filesystem in Userspace. Операционные системы обычно подразделяются на пользовательский режим и режим ядра. Последний режим особенно хорошо защищен; например, доступ к нему может получить только человек с правами администратора. Поэтому монтирование и управление дисками обычно может выполнять только администратор сети. Однако FUSE позволяет другим пользователям управлять файловой системой.

Компьютеры могут работать и как серверы, и как клиенты. Доступ к файловой системе также возможен из других поддерживаемых систем, таких как NFS (Network File System) и SMB/CIFS (Server Message Block/Common Internet File System).

Функциональные возможности GlusterFS

Распределенная файловая система действительно имеет смысл только тогда, когда несколько компьютеров подключены друг к другу. В документации, опубликованной GlusterFS, говорится, что требуется не менее трех серверов. Однако термин «сервер» в этом смысле не следует воспринимать буквально. Практически любой вид физического или эмулируемого оборудования может быть интегрирован. Помимо обычных компьютеров, возможно также использование виртуальных машин. Это также дает множество преимуществ, особенно в отношении гибкости.

Интегрированные серверы выступают в роли узлов, которые соединены друг с другом через сеть TCP/IP. Интегрированные устройства создают так называемый пул доверенного хранения, память которого предоставляется в виде кирпичиков. Затем из этих кирпичиков создаются тома. Впоследствии они могут быть интегрированы и использованы как обычные носители данных. Компьютеры, имеющие доступ, определяются как клиенты, но один ПК может быть и сервером, и клиентом.

Особенностью программного обеспечения является его огромная масштабируемость. В дальнейшем можно добавлять любое количество узлов и кирпичей, а размер пространства хранения данных может быть скорректирован в соответствии с любыми новыми требованиями. Максимальный размер управляемого пространства хранения может достигать нескольких петабайт.

Кроме того, GlusterFS гарантирует надежность за счет избыточности. Риск неисправности изначально распределяется между несколькими системами, которые также могут быть пространственно отделены друг от друга. Также возможно создание RAID-сетей. Однако, в отличие от стандартного распределенного тома, в этом случае необходимо хранить реплицированный том. Таким образом, каждый файл будет сохранен дважды, что называется зеркалированием RAID.

Факт

Избыточный массив независимых дисков (RAID) — это сеть физически независимых жестких дисков, из которых создается один объединенный диск. В зависимости от вашей цели, основное внимание может быть сосредоточено на скорости или безопасности данных. Пространство для хранения данных соответственно уменьшается за счет повторного сохранения данных или хранения дополнительной информации, необходимой для восстановления файла.

Для операций, выполняемых в пространстве хранения, GlusterFS предлагает десять предопределенных трансляторов, которые переводят команды, отдаваемые пользователями для выполнения. Двумя примерами являются транслятор «хранение», который хранит данные на локальной файловой системе и контролирует доступ к ним, и транслятор «шифрование».

Новой функцией является георепликация, с помощью которой можно выполнить асинхронное распределение данных между серверами в разных местах. Это обеспечивает дополнительную защиту от внешних, физических воздействий на серверы, например, в случае пожара или кражи. В этом случае один компьютер выступает в роли ведущего, а другой — в роли ведомого. Передача данных защищена с помощью SSH (Secure Shell).

Плюсы и минусы GlusterFS

Мы собрали несколько плюсов и минусов распределенной файловой системы по сравнению с обычной сетевой памятью в таблице ниже:

Плюсы Gluster Минусы Gluster
Хорошее использование имеющихся мощностей Создание сложной сетевой структуры
Повышенная надежность Увеличение административных усилий при настройке
Распределение нагрузки на сеть Необходима быстрая сетевая инфраструктура
Очень хорошая масштабируемость Требуются дополнительные усилия для обеспечения технической безопасности

Применение GlusterFS

GlusterFS, по сути, создает классическое облако. Пространство для хранения данных в сети становится доступным для подключенных клиентов. Это особенно подходит для больших сетей, которые уже имеют достаточно ресурсов для создания объединенной сети.

Поскольку устройства подключаются через интернет-протокол, использование распределенной файловой системы особенно подходит для структур компаний, включающих несколько филиалов. Однако в сетях с локальными ограничениями таким образом можно сохранить и выделенную сетевую память, даже не отказываясь от резервирования.

Совет

Хотите поработать с GlusterFS самостоятельно? Компания IONOS написала исчерпывающую статью по установке и настройке файловой системы GlusterFS.

Альтернативы GlusterFS

Одной из заметных альтернатив GlusterFS является Ceph, которая находится в свободном доступе и также предлагает многие из вышеупомянутых преимуществ распределенных файловых систем. Ceph и Gluster имеют свои собственные плюсы и минусы.

BeeGFS (ранее FhGFS) была разработана Обществом Фраунгофера в Германии специально для мощных компьютерных систем. Она доступна бесплатно и ориентирована на простоту использования.

В коммерческом секторе существуют дополнительные системы, такие как Storage Spaces Direct (S2D) от Microsoft. Однако использование этой системы ограничено платными лицензированными серверами Windows.

Оцените статью
cdelat.ru
Добавить комментарий