Como conseguir seu primeiro emprego em Data Science?

Como conseguir seu primeiro emprego como cientista de dados ou analista de dados? Se você percorrer os fóruns de ciência de dados, encontrará muitas perguntas sobre esse tópico. Os leitores do meu blog de ciência de dados (data36.com) me perguntam de tempos em tempos. E posso lhe dizer que este é um problema totalmente válido!

Decidi resumir minhas respostas para todas as principais perguntas!

NOVO! Criei um abrangente curso em vídeo on-line (gratuito) para ajudar você a começar com a Data Science. Clique aqui para obter mais informações: Como se tornar um cientista de dados.

CADASTRE-SE AQUI (DE GRAÇA): https://data36.com/how-to-become-a-data-scientist/

# 1: Quais são as habilidades e ferramentas mais importantes do cientista de dados? E como você pode obtê-los?

Boas notícias - más notícias.

Vou começar com o ruim. Em 90% dos casos, as habilidades que eles ensinam nas universidades não são realmente úteis em projetos de ciência de dados da vida real. Como já escrevi várias vezes, em projetos reais, essas 4 habilidades de codificação de dados são necessárias:

  • bash / linha de comando
  • Pitão
  • SQL
  • R
  • (e às vezes Java)
fonte: KDnuggets

Quais 2 ou 3 você achará mais útil realmente depende da empresa ... Mas se você aprendeu um, será muito mais fácil aprender outro.

Portanto, a primeira grande questão é: como você pode obter essas ferramentas? Aí vem as boas notícias! Todas essas ferramentas são gratuitas! Isso significa que você pode baixar, instalar e usá-los sem pagar um centavo por eles. Você pode praticar, criar um projeto de hobby de dados ou qualquer coisa!

Escrevi recentemente um artigo passo a passo sobre como instalar essas ferramentas no seu computador. Confira aqui.

# 2: Como aprender?

Existem duas maneiras principais de aprender ciência de dados com facilidade e economia.

1º: Livros.

Meio que velha escola, mas ainda é uma boa maneira de aprender. Nos livros, você pode obter um conhecimento muito detalhado e detalhado sobre análise de dados on-line, estatísticas, codificação de dados, etc. Eu destaquei 7 livros que recomendo no meu artigo anterior, aqui.

Os 7 principais livros de dados que eu recomendo

2º: seminários on-line e cursos em vídeo.

Os cursos on-line de ciência de dados estão chegando com preços justos (US $ 10 a US $ 500) e cobrem vários tópicos, desde a codificação de dados até a inteligência de negócios. Se você não deseja gastar dinheiro com isso no início, listei cursos gratuitos e materiais de aprendizagem neste post.

(3º: Curso do primeiro mês do Junior Data Scientist Eu criei um curso on-line de 6 semanas de ciência de dados para aspirantes a cientistas de dados praticarem e resolverem tarefas reais em um conjunto de dados realista: O primeiro mês do Junior Data Scientist .)

# 3: Como praticar e como obter experiência da vida real

Este é um assunto complicado, certo? Toda empresa quer ter pessoas com pelo menos um pouco de experiência na vida real ... Mas como você obtém experiência na vida real, se precisar de experiência na vida real para conseguir seu primeiro emprego? Catch-22 clássico. E a resposta é: projetos para animais de estimação.

"Projeto de estimação" significa que você tem uma ideia de projeto de dados que o deixa empolgado. Então você simplesmente começa a construí-lo. Você pode pensar nisso como uma pequena startup, mas certifique-se de manter o foco na parte de ciência de dados do projeto e simplesmente ignore a parte de negócios. Para lhe dar algumas idéias, aqui estão alguns dos meus projetos de animais de estimação dos últimos anos:

  • Criei um script que monitorava um site imobiliário e enviava-me por e-mail as melhores ofertas em tempo real - para que eu pudesse recebê-las antes de todo mundo.
  • Eu criei um script que estava puxando todos os artigos do ABC, BBC e CNN e, com base nas palavras usadas, conectei os artigos que tinham exatamente o mesmo tópico nos três portais de notícias diferentes.
  • Criei um chatbot de auto-aprendizado em Python. (Porém, não é muito inteligente - pois ainda não o treinei.)

Seja criativo! Encontre um projeto para animais de estimação relacionado à ciência de dados e comece a codificar! Se você se deparar com um problema de codificação - que pode acontecer facilmente, quando você começa a aprender uma nova linguagem de dados - basta usar o google e / ou o stackoverflow. Um pequeno exemplo meu - sobre a eficácia do stackoverflow:

lado esquerdo: minha pergunta - lado direito: a resposta (em 7 minutos)

Observe o timestamp! Enviei uma espécie de pergunta complicada e recebi a resposta em sete minutos. A única coisa que eu precisava fazer era copiar e colar o código no meu código de produção e boom, apenas funcionou!

(Observação: o Validado cruzado é outro ótimo fórum para perguntas relacionadas à ciência de dados.)

+1 sugestão:

Mesmo que seja um pouco difícil, tente conseguir um mentor. Se você tiver sorte, encontrará alguém que trabalhe como cientista de dados em uma boa empresa e que possa passar 1 hora semanal ou quinzenalmente com você e discutir ou ensinar coisas.

# 4: Para onde e como você envia seu primeiro pedido de emprego?

Se você não conseguiu encontrar um mentor, ainda pode encontrar o primeiro na sua primeira empresa. Este será o seu primeiro trabalho relacionado à ciência de dados, então sugiro que não se concentre em muito dinheiro ou em uma atmosfera de inicialização super sofisticada. Concentre-se em encontrar um ambiente onde você possa aprender e melhorar a si mesmo.

Assumir o seu primeiro emprego em ciência de dados em uma empresa multinacional pode não se alinhar com essa idéia, porque as pessoas geralmente estão muito ocupadas com suas coisas, para que não tenham tempo ou motivação para ajudá-lo a melhorar (é claro, sempre há exceções).

Começar em uma pequena startup como primeira pessoa de dados da equipe também não é uma boa ideia, porque essas empresas não têm pessoal de dados sênior para aprender.

Aconselho que você se concentre em 50 a 500 empresas de tamanho. Essa é a média de ouro. Cientistas seniores de dados estão a bordo, mas não estão ocupados demais para ajudar e ensinar você.

Ok, você encontrou algumas boas empresas ... Como se inscrever? Alguns princípios para o seu currículo: destaque suas habilidades e projetos, não sua experiência (como você ainda não tem muitos anos para colocar no papel). Liste as linguagens de codificação relevantes (SQL e Python) que você usa e vincule alguns dos repositórios relacionados do github, para poder mostrar que realmente usou essa linguagem.

Além disso, na maioria dos casos, as empresas solicitam uma carta de apresentação. É uma boa oportunidade de expressar seu entusiasmo, é claro, mas você também pode adicionar alguns detalhes práticos, como o que você faria nas primeiras semanas se fosse contratado. (Por exemplo: “Olhando para o seu fluxo de registro, acho que a página ____ desempenha um papel importante. Nas minhas primeiras semanas, eu realizaria ___, ___ e ___ (análises específicas) para provar essa hipótese e entendê-la mais profundamente. Isso poderia ajudar a empresa a melhorar _____ e, eventualmente, empurrar os _____ KPIs. ”)

Espero que isso lhe traga uma entrevista de emprego, onde você pode conversar um pouco sobre seus projetos de animais de estimação, sugestões de carta de apresentação, mas será principalmente sobre verificação de ajuste de personalidade e, provavelmente, algum teste básico de habilidades. Se você praticou o suficiente, vai passar por isso ... mas se você é do tipo nervoso e quer praticar mais, pode fazê-lo em hackerrank.com.

Conclusão

Bem, é isso. Sei que parece mais fácil quando está escrito, mas se você está realmente determinado a ser um cientista de dados, não haverá nenhum problema para que isso aconteça! Boa sorte com isso!

Se você quiser experimentar, como é ser um cientista de dados júnior em uma startup verdadeira, confira meu curso on-line de 6 semanas de ciência de dados: O primeiro mês do cientista de dados júnior!

E se você quiser saber mais sobre ciência de dados, consulte meu blog (data36.com) e / ou assine minha Newsletter! E não perca a nova série de tutoriais de codificação: SQL for Data Analysis!

Obrigado pela leitura!

Gostou do artigo? Entre em contato conosco clicando no abaixo. Também ajuda outras pessoas a ver a história!

Tomi Mester autor do data36.com Twitter: @ data36_com