Учебное пособие по HBase | Введение в HBase | Что такое HBase? | Учебное пособие по HBase для нач...
Автор: ACADGILD
Загружено: 2017-09-11
Просмотров: 37199
Учебное пособие по HBase | Введение в HBase | Что такое HBase? | Учебное пособие по HBase для начинающих
https://acadgild.com/big-data/big-dat...
Здравствуйте и добро пожаловать на этот семинар от AcadGild. В предыдущем видео мы обсуждали базы данных NoSQL. Если вы пропустили предыдущий семинар, перейдите по ссылке: • NoSQL Tutorial for Beginners | Introductio...
В этом обучающем видео по HBase мы обсудим особый тип базы данных NoSQL — HBase. HBase — это согласованная и толерантная к разделам база данных NoSQL. Это хранилище типа «ключ-значение», в котором есть значение и ключ. Ключ в HBase аналогичен первичному ключу в СУРБД. Мы уже немного знаем о том, что такое таблицы и столбцы. Теперь столбцы в HBase можно группировать в семейства столбцов, если требуется к ним доступ. Для столбцов одного семейства столбцов HBase работает довольно быстро, поскольку не требует сканирования всех остальных семейств столбцов.
Что такое HBase?
HBase — это распределенная, ориентированная на столбцы, масштабируемая база данных Hadoop, представляющая собой хранилище больших данных. Если вам нужен произвольный доступ к большим данным в режиме реального времени, чтение и запись, HBase может стать хорошим решением. Что касается хранения, HBase может хранить миллиарды строк и столбцов на кластере стандартного оборудования. Это база данных с открытым исходным кодом, обладающая возможностями контроля версий и являющаяся полностью нереляционной базой данных.
Архитектура HBase?
HBase работает по принципу архитектуры «ведущий-ведомый». Существует ведущий сервер (Hmaster), который выполняет административные функции, такие как создание и удаление таблиц, а также разделение регионов. Региональные серверы выполняют роль ведомых серверов. Каждый региональный сервер взаимодействует с Hmaster, как и namenode и datanode, где datanode взаимодействует с namenode.
Самые данные размещаются на региональном сервере в виде файлов, известных как Hfiles, оптимизированных для хранения данных. Координацию распределения данных осуществляет Zookeeper. Данные в таблице HBase горизонтально распределены по разным регионам. Эти регионы отсортированы по разным региональным серверам. Один региональный сервер обслуживает тысячи регионов. Размер регионального сервера по умолчанию составляет один гигабайт, но может изменяться в зависимости от потребностей.
Каждый регион сортируется по ключу, а его содержимое определяется начальным и конечным ключами. Помните, что HBase — это хранилище типа «ключ-значение», где значение представляет собой набор семейств столбцов, а ключ — уникальный идентификатор записи. Клиент может читать с регионального сервера любое количество данных по любому ключу. Регионы — это горизонтальные подмножества таблицы, которые хранятся на региональных серверах и отсортированы по ключам. Каждый региональный сервер отправляет свои сигналы Zookeeper, как и Hmaster. Zookeeper отслеживает, активны ли они или нет. У вас может быть несколько Hmaster, поэтому сбой одного из них не повлияет на время простоя кластера. Hmaster отвечает за создание и удаление таблиц, предназначенных для административных задач, а клиент подключается к Hmaster.
Что такое метатаблица в HBase?
Метатаблица содержит информацию, например, в каком регионе или на каком региональном сервере будут найдены начальный и конечный ключи. Это крайне важно, поскольку при отсутствии метатаблицы вам придётся сканировать каждый регион конкретной таблицы, чтобы получить данные. Если вам нужны данные по определённому ключу, и если у вас есть метатаблица, вы можете напрямую обратиться к указанному региональному серверу. Get — это операция, которую клиент выполняет для чтения определённой записи из таблицы HBase, а put — это операция, выполняемая клиентом для записи данных в таблицу HBase. При необходимости этих операций клиент подключается к Zookeeper для получения адреса метатаблицы. Получив адрес метатаблицы, он сохраняет сведения о данных, содержащихся в ней, и ищет эти данные для подключения к определённому региональному серверу. Внутри регионального сервера может быть несколько регионов, которые могут присутствовать как в одной, так и в разных таблицах. Региональный сервер состоит из четырёх важных компонентов: хранилища памяти, Hfile, блочного кэша и журнала предварительной записи.
Надеюсь, это видео помогло вам получить чёткое представление об архитектуре HBase. Спасибо за просмотр. Следите за новостями и смотрите ещё больше интересных видео об экосистеме Hadoop на сайте acadgild.com
#hbasearchitecture, #hbasebasics, #hbasefundamentals, #hbaseinhadoop, #hbasetutorial, #Hbase
Чтобы получать новости о курсах и советы, подпишитесь на нас:
Facebook: / acadgild
Twitter: / acadgild
LinkedIn: / acadgild
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: