Depois que finalizei minha pós-graduação em Data Science e Machine Learning, veio a grande questão: qual carreira seguir?
Eu tinha zero noção de quão amplo era o universo de dados em si, e meu background em Design de Interiores e Marketing Digital não contribuía muito. Faltava conhecimento sobre cada carreira, as skills necessárias e o dia-a-dia dos profissionais.
O que me ajudou muito a tomar a decisão de seguir na carreira de Data Analyst, ou Analista de Dados em português, foi o artigo “Data Science Career” do blog da Coursera (plataforma de cursos online voltados para o universo de tecnologia), e tomei a liberdade de traduzir os pontos principais desse artigo, para compartilhar com vocês e elucidar suas dúvidas.
Data Scientist (Cientista de Dados)
Essa já foi eleita a carreira mais sexy do século XXI pela Harvard Business Review e depois disso muito burburinho foi gerado em volta do termo. Mas eu trago algumas ressalvas também.
A Ciência de Dados é tanto uma área de conhecimento multidisciplinar quanto uma carreira em si. São tantas as expertises que lá no início era chamado de “Profissional Unicórnio”, todo mundo já ouviu falar, mas é difícil de encontrar.
Áreas de Conhecimento:
- Análises estatísticas
- Machine Learnign
- Deep Learning
- Ferramentas de Business Intelligence como Power BI, Tableau e Looker
- Data Visualization
- Matemática
- Linguagens de programação como Python e R
- Tecnologias para processamento de grandes volumes de dados como Hadoop, Hive, Pig, Cassandra e MapReduce
- Conhecimentos de SQL
Média salarial: R$6.144,00 (Fonte: Vagas.com)
Formação: Mais comumente graduação em áreas correlatas como Estatística, Engenharia de Produção e Ciência da Computação, mas também é possível entrar na área através de bootcamps, cursos de pós-graduação ou mestrado. A Ciência de Dados como graduação vem surgindo entre as instituições de ensino mais modernas e podem ser uma ótima opção.
O papel de um Cientista de Dados envolve atuar com grandes conjuntos de dados, sejam eles estruturados ou não estruturados, fazendo a coleta, processamento e posterior aplicação de métodos analíticos avançados e modelos preditivos para auxiliar nas decisões de negócios. Espera-se desse profissional um perfil analítico forte, com foco em resolução de problemas e skills avançadas de comunicação.
É uma carreira bastante interdisciplinar, e justamente por isso é difícil começar já como Cientista de Dados. Normalmente as empresas buscam por profissionais que já tenham alguma experiência no mercado de tecnologia ou em algumas das outras áreas de dados.
Data Analyst (Analista de Dados)
Um Analista de Dados ajuda a coletar, limpar e interpretar bases de dados com o intuito de responder perguntas, solucionar problemas e apoiar melhores decisões de negócios.
Outro recurso fortíssimo entre profissionais de análise de dados é a parte da visualização e storytelling, o que muitas vezes implica em skills de comunicação também.
Áreas de conhecimento:
- Análises estatísticas simples
- Processos de limpeza de dados
- SQL
- Linguagens de programação como Python e R
- Excel e/ou Google Sheets
- Ferramentas de Business Intelligence como Power BI, Tableau e Looker
Média salarial: R$3.094,00 (Fonte: Vagas.com)
Formação: Mais comumente graduação em áreas como Estatística, Economia, Administração, mas também é um dos menos exigentes em questão de formação. Cursos livres na área, bootcamps e domínio de linguagem e ferramentas para quem está mudando de carreira já são ótimos recursos para uma oportunidade do tipo entry-level.
A principal diferença entre um Analista de Dados e o Cientista de Dados é que o primeiro normalmente trabalha com dados existentes para solucionar problemas de negócios definidos, enquanto que o segundo cria algoritmos e modelos para fazer previsões do futuro.
Data Engineer (Engenheiro de Dados)
Profissional que chega para sanar a necessidades das empresas de armazenar a grande quantidade de dados que são gerados diariamente. Constrói sistemas de coleta e armazenamento capazes de converter dados brutos em informações utilizáveis, e isso aplicado em grande escala. é visto por aí como o melhor amigo dos Cientistas de Dados.
Áreas de conhecimento:
- SQL e NoSQL
- Linguagens de programação como Python, R, Java e Scala
- Banco de dados relacional e não relacional
- Sistemas de ETL (Extract, Transform and load)
- Data Storage
- Automação
- Ferramentas de Big Data como Hadoop, Hive, Pig, Cassandra e MapReduce
- Computação em nuvem
- Segurança de dados
Média salarial: R$7.701,00 (Fonte: Vagas.com)
Formação: Graduação em áreas como Matemática, Ciência da Computação e Engenharia de Produção.
Data Architect (Arquiteto de Dados)
Um Arquiteto de Dados é responsável por desenhar o sistema de gerenciamento de dados de uma empresa, assim como um arquiteto tradicional desenha plantas de residências.
O resultado é um framework com a estrutura de dados, incluindo seus fluxos e futuros databases. O profissional também dialoga com as demais áreas da empresa para elaborar e implementar estratégias de coleta e armazenamento, assim como a aquisição de novos dados.
Áreas de conhecimento:
- Data Mining
- Gerenciamento de dados
- Linguagens de programação como Python e Java
- SQL
- Conhecimentos de Machine Learning para criar sistemas escaláveis
- Ferramentas de modelagem de dados como ERWin e Visio
Média salarial: R$6.646,00 (Fonte: Blog Unopar)
Formação: Profissionais vem geralmente de graduações como Ciência da Computação. Para mudanças de carreira, certificações são ótimos aliados.
Machine Learning Engineer (Engenheiro de Machine Learning)
Talvez a posição mais avançada dentre todas as que mencionei aqui.
Sua função envolve não apenas construir modelos de Machine Learning à nível de produção, mas também manter, aperfeiçoar e otimizar modelos existentes. Ele roda constantes testes e análises estatísticas em empresas que já consolidaram as aplicações de ciência de dados no dia-a-dia.
Áreas de conhecimento:
- Modelagem de dados
- Engenharia de software
- Linguagens de programação como Python, R e Java
- SQL
- Matemática e estatística
- Conhecimento de frameworks de Machine Learning como TensorFlow e Keras
- Ferramentas como Spark, Hadoop e Apache Kafka
- Computação em nuvem
Média salarial: R$7.660,00 (Fonte: Glassdoor)
Formação: Um mestrado ou pós-graduação em Ciência da Computação ou áreas correlatas é esperado.
A principal diferença entre um Cientista de Dados e um Engenheiro de Machine Learning é que o primeiro está na no universo da experimentação, construção de teorias, compreensão do fenômeno e aplicação de análises matemáticas e estatísticas, enquanto que o Engenheiro tem a função de viabilizar o trabalho do cientista.