Introdução ao AWS Redshift

Introdução ao AWS Redshift

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br


Este artigo fornece uma visão geral do AWS Redshift e descreve o método de criação de um Redshift Cluster passo a passo.

Introdução

O AWS Redshift é um serviço colunar de armazém de dados na nuvem da AWS que pode ser dimensionado para petabytes de armazenamento, e a infraestrutura para hospedar esse armazém é totalmente gerenciada pela nuvem da AWS. O Redshift opera em um modelo em cluster com um nó líder e em vários nós trabalhados, como qualquer outro modelo de banco de dados distribuído ou em cluster em geral. É baseado no Postgres, por isso compartilha muitas semelhanças com o Postgres, incluindo a linguagem de consulta, que é quase idêntica à SQL (Structured Query Language). Esse Redshift suporta a criação de quase todos os principais objetos de banco de dados, como Bancos de Dados, Tabelas, Exibições e até mesmo Procedimentos Armazenados. Neste artigo, exploraremos como criar seu primeiro cluster Redshift na AWS e começaremos a operá-lo.

Pré-requisitos

É necessária uma conta da AWS com os privilégios necessários para usar o serviço AWS Redshift. Para criar uma conta da AWS, você precisa ter um cartão de crédito ou um método de pagamento suportado pela AWS. Usuários iniciantes que pretendem abrir uma nova conta da AWS podem ler este artigo, que explica o processo de abertura e ativação de uma nova conta da AWS.

Depois de ter uma nova conta da AWS, a AWS oferece muitos serviços de nível gratuito, nos quais você recebe um determinado limite de uso de serviços específicos gratuitamente. Os usuários de novas contas recebem 2 meses de avaliação gratuita do Redshift; portanto, se você for um usuário novo, não será cobrado pelo uso do Redshift por 2 meses para um tipo específico de cluster do Redshift.

Criando seu primeiro AWS Redshift Cluster

Supõe-se que o leitor tenha uma conta da AWS e tenha privilégios administrativos necessários para operar no Redshift. Se você é um novo usuário, é altamente provável que você seja o usuário root / admin e tenha todas as permissões necessárias para operar qualquer coisa na AWS. Depois de fazer logon na AWS usando suas credenciais de usuário (ID e senha do usuário), você verá a tela de aterrissagem, também chamada de Home Page do AWS Console.

Na nuvem da AWS, quase todos os serviços, exceto alguns, são serviços regionais, o que significa que tudo o que você cria na nuvem da AWS é criado na região selecionada por você. A região padrão na AWS em N. Virginia, que você pode ver no canto superior direito. Se você deseja criar seu cluster Redshift em uma região diferente, você pode selecionar a região de sua escolha. Você pode aprender mais sobre as regiões da AWS neste artigo. Depois de selecionar a região de sua escolha, a próxima etapa é navegar até a página inicial do AWS Redshift. Digite Redshift no console de pesquisa, como mostrado abaixo, e você encontrará o nome do serviço listado.

Leia Também  Às vezes você PODE aumentar o tamanho de uma coluna no local

Pesquisando Redshift no AWS Console

Clique no nome do serviço e você será direcionado para a página inicial ou a página do painel do Redshift, conforme mostrado abaixo.

Página Inicial Redshift

Quando estiver na página inicial do AWS Redshift, você encontrará vários ícones na página esquerda, que oferecem opções para operar em vários recursos do Redshift. Para começar, precisamos criar um cluster primeiro e depois fazer logon no cluster para criar objetos de banco de dados nele. No lado direito da tela, você encontrará um botão chamado Criar cluster, como mostrado acima. Clique neste botão para começar a especificar a configuração usando a qual o cluster seria construído.

Configuração de Cluster

Configuração de Cluster

Quando estiver no assistente de criação de cluster, você precisará fornecer detalhes diferentes para determinar a configuração do seu cluster do AWS Redshift. Primeiro, forneça um nome de cluster de sua escolha. O próximo detalhe é Tipo de nó – que determina a capacidade dos nós no seu cluster. DC2 significa nós de computação densa, DS2 significa armazenamento denso e RA3 é a oferta mais avançada e mais recente da Redshift, que oferece os nós mais poderosos com uma capacidade de computação e armazenamento muito grande. Por padrão, isso seria mostrado como a opção recomendada. Porém, para os usuários iniciantes que estão apenas começando o Redshift, eles geralmente não precisam de nós de alta capacidade, pois isso pode gerar muitos custos devido à capacidade associada a ele. O uso do DC2 é coberto no nível gratuito e oferece uma configuração bastante razoável a um custo acessível para volumes de dados modestos. Portanto, selecione o tipo de nó dc2.large que oferece 160 GB de armazenamento por nó. Você pode ler mais sobre os tipos de nós Redshift aqui.

A próxima etapa é selecionar o número de nós em um cluster. Podemos criar um cluster de nó único, mas tecnicamente isso não conta como cluster, portanto, consideraríamos um cluster de 2 nós. O valor padrão para o número de nós é 2, que você pode alterar conforme necessário. Abaixo está o número de nós, mostra que o custo de execução desse cluster para o mês inteiro é de US $ 320. É recomendável finalizar o cluster quando o cluster não estiver em uso. O processo de criação do cluster é muito conciso e dificilmente leva alguns minutos para criar ou finalizar um cluster. Você pode pausar / encerrar um cluster quando não for necessário, dependendo do seu caso de uso. Os usuários iniciantes são cobertos pelo nível gratuito; portanto, eles não receberão nada pelo uso do Redshift do cluster de 2 nós do DC2 por algumas horas.

Leia Também  Aprenda SQL: disparadores de SQL

Configuração do banco de dados

Configuração do banco de dados Redshift

A próxima etapa é especificar a configuração do banco de dados. O nome do banco de dados padrão é dev e a porta padrão na qual o AWS Redshift escuta é 5439. Você pode alterar essa configuração conforme necessário ou usar os valores padrão. Nesse caso, estaríamos usando os valores padrão.

Credenciais do banco de dados Redshift

Depois de especificar o nome e a porta do banco de dados, o próximo detalhe necessário é o nome de usuário e a senha mestre, que é a credencial administrativa que fornece acesso total ao cluster do AWS Redshift. O nome de usuário padrão é um awsuser. Forneça uma senha de sua escolha, de acordo com as regras mencionadas abaixo da caixa de senha. Isso conclui a configuração no nível do banco de dados do Redshift.

Configurações adicionais

Configuração Adicional Redshift

Permissões de cluster é uma configuração opcional que permite especificar funções de gerenciamento de acesso e identidade (IAM) que permitem que os clusters do AWS Redshift se comuniquem / se integrem a outros serviços da AWS. Ele pode ser modificado mesmo após a criação do cluster, portanto, não o configuramos por enquanto.

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

Na seção de configurações adicionais, desative a opção Usar padrões, pois pretendemos alterar a acessibilidade do cluster. Pretendemos usar o cluster de nossa máquina pessoal por meio de uma conexão aberta à Internet. Geralmente, essa não é a configuração recomendada para cenários de produção, mas para usuários iniciantes que estão apenas começando o Redshift e não possuem dados confidenciais no cluster, não há problema em usar o cluster Redshift com dados não sensíveis na Internet aberta por uma duração muito curta. A configuração adicional permite especificar detalhes como configuração de rede, segurança, gerenciamento de backup, grupos de parâmetros e opções que permitem controlar o comportamento do cluster Redshift e também as janelas de manutenção.

A única opção que precisamos alterar aqui é a configuração Acessível ao público, como mostrado abaixo. O valor padrão para essa configuração será Não. Altere-o para o valor Sim, para que faça as alterações de rede necessárias para permitir o uso do cluster do AWS Redshift pela Internet aberta usando o ponto de extremidade do cluster que seria criado.

Redshift Public Accessibility

Quando essa configuração estiver concluída, clique no botão Criar cluster. Isso começará a criar seu cluster e você será direcionado para a janela de clusters, onde encontrará o status do seu cluster em Modificando status. Não se assuste com o status, pois você pode estar se perguntando que está apenas criando seu cluster e, em vez de mostrar um status de criação / pendente / em andamento, ele está mostrando modificações. Essa é a terminologia usada pela AWS para criar ou modificar qualquer tipo de cluster.

Leia Também  Uma introdução aos aplicativos sem servidor

Status do Cluster de Redshift

Depois que o cluster for criado, você o encontrará no status Disponível, como mostrado abaixo.

Redshift Status do Cluster Disponível

Depois de clicar no Painel, você poderá ver as estatísticas do cluster, por exemplo, 1 Cluster (s), 2 Total de nós etc. Considere explorar esta página para verificar mais detalhes sobre o cluster.

Página do painel Redshift

Consultando o AWS Redshift Cluster

Clique no ícone Editor no painel esquerdo para conectar-se ao Redshift e acionar consultas para interrogar o banco de dados ou criar objetos de banco de dados. Esta página exigirá que você forneça seu nome de usuário e senha mestre para efetuar logon e começar a usar o banco de dados no próprio navegador, sem a necessidade de usar um IDE externo para operar no Redshift. Forneça os detalhes conforme mostrado abaixo e clique no botão Conectar ao banco de dados.

Redshift Editor Login

Depois de fazer logon com êxito, você será direcionado para uma janela, como mostrado abaixo. Os objetos de dados listam os objetos e esquemas do sistema. A janela do editor de consultas facilita o acionamento de consultas no esquema selecionado.

Janela Editor de consulta Redshift

Você pode começar a disparar consultas DDL (Data Definition Language) e DML (Data Manipulation Language) na janela do Query Editor, como mostrado abaixo. Você pode ler mais sobre o idioma de consulta do AWS Redshift aqui.

Consultas SQL Redshift

Excluindo o AWS Redshift Cluster

Depois de concluir o uso do cluster, é recomendável finalizá-lo para evitar incorrer em qualquer custo ou desperdício do uso da camada gratuita. Navegue até a página do painel clicando no ícone do painel no painel esquerdo. Selecione seu cluster e clique no ícone Excluir botão do Ações cardápio.

Excluindo cluster de desvio para o vermelho

Você será solicitado com uma caixa de diálogo pop-up que solicitará a criação de um instantâneo final. Se você não tiver nenhum dado que deseja reter em uma captura instantânea terá um custo adicional, poderá desmarcar essa opção, como mostrado abaixo. Clique no botão Excluir e isso iniciará o processo de exclusão e em um ou dois minutos o cluster do AWS Redshift será excluído.

Confirmação de exclusão do desvio para o vermelho

Conclusão

Neste artigo, abordamos o processo de criação de um cluster do AWS Redshift e os vários detalhes necessários para a criação de um cluster. Compreendemos brevemente a maneira de acessar o cluster a partir do navegador e acionar consultas SQL no cluster. E, finalmente, quando o cluster não é mais necessário, aprendemos como excluir o cluster para parar de incorrer em qualquer custo de uso do cluster.

Rahul Mehta
Últimas mensagens de Rahul Mehta (ver todos)