Como se tornar um analista de dados – SQLServerCentral

Como se tornar um analista de dados – SQLServerCentral


Todos os dias, mais de 2,5 quintilhões (1018) bytes de dados são gerados. Dada a grande quantidade de dados, a necessidade de análise de dados nunca foi tão clara. Ele fornece impulso para analistas de dados. Indeed.com informou que a taxa de crescimento dessa profissão havia atingido mais de 4.000%. Este guia mostra como começar com os dados, especialmente para aqueles que desejam seguir uma carreira em análise de dados.

O que é o analista de dados?

A análise de dados é uma parte fundamental de todos os setores. Como tal, um analista de dados tem uma ampla experiência profissional em diferentes setores.

fonte: PayScale

Algumas indústrias estão em alta demanda por analistas de dados da seguinte maneira:

Analista de Pesquisa de Mercado – Realize pesquisas para analisar o cenário atual do mercado. Eles coletam comportamentos do consumidor, hábitos de compra etc. Eles então estimam a demanda do produto para ajudar as empresas a otimizar as vendas. O salário inicial é de US $ 51.000 a US $ 65.000.

Analista financeiro – trabalha com dados financeiros para fornecer modelos e previsões. As indústrias de investimento, como o investimento bancário, dependem muito de dados para explorar oportunidades de investimento. O salário inicial é de US $ 54.700 a US $ 69.000

Analista de negócios – converte dados em informações comerciais acionáveis. Requer extensas habilidades em Excel, Power BI e SQL. O salário inicial é de $ 52.700 a $ 66.000

Que habilidades tecnológicas você precisa para ter sucesso?

  1. SQL: a linguagem de consulta estruturada foi projetada para acessar, gerenciar e manipular o banco de dados. Este é o requisito básico para um analista de dados.
  2. Excel: para uma análise de dados mais leve e rápida, são necessárias habilidades avançadas do Excel, como digitação de macro e pesquisa VBA.
  3. Programação estatística: R, MATLAB e SAA são linguagens estatísticas para explorar grandes conjuntos de dados e exibir em gráficos elegantes para melhor compreensão.
  4. Visualização de dados: a capacidade de apresentar e descrever o resultado também é essencial. Ferramentas como Power BI e Tableau são consideradas ferramentas analíticas padrão.
Leia Também  T-SQL Tuesday # 123: Hackers da vida - SQLBlog

Além de tudo isso, você deve criar um grupo de dados que permita executar análises.

A raspagem da Web não pode substituir todas as habilidades analíticas, mas complementá-las. Na maioria das vezes, os analistas de dados precisam lidar com dados confusos, a menos que conheçam uma maneira melhor de localizar e extrair dados estruturados. Felizmente, existe uma maneira rápida de começar a usar uma ferramenta de raspagem da Web como o Octoparse. Existem também muitas outras opções. Aqui está uma lista rápida para referência prática.

Dê um exemplo de raspagem

Vamos dar um exemplo para entender a análise de dados usando a raspagem da Web, Excel e Tableau juntos. O objetivo final aqui é examinar a relação entre o PIB per capita de um país e sua taxa de crescimento de usuários da Internet.

Extração de dados

Para fazer isso, precisamos de dados de dois dados:

  1. PIB per capita (https://www.cia.gov/library/publications/the-world-factbook/)
  2. Taxa de crescimento de usuários da Internet (https://www.internetworldstats.com/top20.htm)

Em seguida, precisamos configurar um rastreador usando o Octoparse para cada site. Eu recomendo que você assista a este vídeo e aprenda como criar um rastreador, se você ainda não o experimentou.

Esta é uma prévia do fluxo de trabalho completo. O Octoparse permite que você interaja com a página da web e extraia as informações desejadas através de apontar e clicar. O fluxo de trabalho é visual e você pode editar com arrastar e soltar.

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br
octoparse_workflow

fonte: Octoparse

Depois de concluir a configuração do rastreador, clique no botão “Iniciar extração”. A Octoparse trabalhará sua mágica e obterá os dados para você. A melhor parte é que os dados extraídos são estruturados. Isso significa que você economiza muito tempo limpando os dados como faria antes de conhecer a Octoparse.

Leia Também  Semana de treinamento gratuita: Como eu uso o kit primeiro respondedor - sp_BlitzFirst (1h41m)

Para essa extração, fiz uma pequena edição com a ferramenta de expressão regular incorporada. Novamente, você não precisa gastar tempo escrevendo o Modelo de Expressão Regular com Javascript.

regextool_Octoparse

fonte: Octoparse

Raspe os dados e coloque-os em planilhas, bem-vindo ao praticar com eles.

Excel para encontrar os valores

Em seguida, precisamos usar o formato de índice e correspondência para unificar e os valores correspondentes de duas planilhas separadas (taxa de crescimento de usuários da Internet e PIB per capita)

ÍNDICE (coluna para retornar um valor, MATCH (valor da pesquisa, coluna para pesquisar, 0))

Primeiro, precisamos usar o formato de correspondência para encontrar o “país” da planilha 2 e retornar a posição da planilha 2

Em seguida, usamos o formato Índice para encontrar a “posição” e retornar o valor correspondente da Folha 1

planilha

Dados1 e Dados 2 é o intervalo de pesquisa que eu nomeei da Folha1. Isso ocorre porque estamos fazendo referência cruzada a duas tabelas. É mais fácil ligar do que escrever o intervalo de células.

Fórmula

Usando essa fórmula, ele procurará a posição do país (DATA2) retornada pela função Match e retornará o valor correspondente de GDP_per_capita (DATA1). Depois de digitar o formato, arraste o sinal de adição no canto direito da célula.

Visualização de dados

Quando terminarmos de corresponder os valores, podemos visualizar os dados. O Tableau é fácil de pegar. Podemos simplesmente arrastar os valores desejados para o quadro. Parece com a tabela a seguir.

análise octoparse_data

Você pode interpretar o resultado:

Existe uma forte correlação negativa entre a taxa de crescimento da Internet% e o PIB per capita de um país. Isso pode significar que, quanto mais rápido o número de usuários da Internet aumentar, menor será o PIB per capita. Faz sentido, uma vez que os países com alto PIB geralmente são mais desenvolvidos com espaço limitado para crescer. Enquanto os países de baixo PIB têm todo o potencial para aumentar a infraestrutura da Internet. Portanto, a taxa geral de crescimento da Internet aumenta mais rapidamente do que os países avançados.

Leia Também  Configurando o ambiente RDS no AWS para SQL Server

Em conclusão: se você planeja seguir uma carreira em análise de dados. É melhor planejar sua carreira, pois cada setor possui uma definição exclusiva do cargo. Em seguida, aprimore as habilidades básicas mencionadas acima. Existem abundantes recursos gratuitos disponíveis online. Além disso, a raspagem da Web pode ser um ponto positivo em seu currículo, pois aumenta significativamente a eficiência da análise de dados, economizando tempo com a coleta e limpeza de dados.

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br