Создание кластера
На этой странице:
Настройка программного обеспечения
Выберите
.Нажмите на кнопку Create Cluster.
Выберите режим Custom Config.
Далее укажите:
Cluster Name — имя кластера.
Cluster Type — в Analysis cluster выберите все компоненты.
На странице ниже сделайте следующее и нажмите кнопку Next:
Kerberos Authentication — отключите проверку аутентификации Kerberos.
Username — по умолчанию имя пользователя admin для авторизации в MRS Manager.
Password и Confirm Password — укажите и подтвердите пароль для авторизации в MRS Manager.
Настройка средств аппаратного обеспечения
Заполните следующие поля:
AZ — выберите зону доступности.
VPC — выберите из списка сеть.
Subnet — выберите из списка подсеть.
На странице ниже заполните следующие поля и нажмите кнопку Next:
Login Mode — выберите режим Password.
Username — по умолчанию имя пользователя «root» для авторизации в узле ECS.
Password и Confirm Password — укажите и подтвердите пароль для авторизации в узле ECS.
В новом окне нажмите кнопку Create Now.
Нажмите кнопку Back to Cluster List.
Создание кластера займет некоторое время. Необходимо дождаться пока его статус не изменится на Running. Для обновления статуса кластера воспользуйтесь значком
(Refresh).
Подготовка программы и файлов с данными
На данном этапе будут использоваться тестовые примеры файлов с данными, а также программа Hadoop с установленным на нее компонентом wordcount
.
Перейдите по ссылке для скачивания программы Hadoop с установленным компонентом
wordcount
.Выберите, например,
hadoop-3.1.3.tar.gz
. Распакуйте его. Программуhadoop-mapreduce-examples-3.1.3.jar
вы найдете в директорииhadoop-3.1.3\share\hadoop\mapreduce
.Подготовьте пару файлов формата
txt
. В данном примере используем файлыwordcount1.txt
иwordcount2.txt
.Выберите сервис
.Нажмите кнопку Create Bucket.
В поле Bucket Name укажите имя корзины и нажмите кнопку Create.
Нажмите на имя корзины.
Перейдите в раздел Objects и нажмите кнопку Create Folder.
В поле Folder Name введите «program» и нажмите кнопку ОК. После чего создайте еще одну папку с именем «input».
Перейдите в папку «program», нажмите кнопку Upload Object. Нажмите Add file и выберите скачанную ранее программу Hadoop, после чего нажмите кнопку Upload.
Перейдите в папку «input» и загрузите созданные ранее файлы
wordcount1.txt
иwordcount2.txt
по аналогии с предыдущим пунктом.Теперь нужно создать и запустить задание (job).