Ao mesmo tempo em que são poucos os que ainda duvidam do poder dos dados como insumo para transformações positivas em uma empresa, produto, squad, área e/ou vertical, as percepções equivocadas sobre o que é ciência de dados continuam se multiplicando. É natural, já que todo esse processo de transformação digital e aplicação de dados de forma mais ampla é um fenômeno relativamente recente. Diante disso, inspirado em um estudo muito bacana do Global Tech Council, resolvi compartilhar a minha visão a respeito dos 10 principais mitos sobre Data Science que atrapalham o desenvolvimento do nosso mercado.

Top 10 Data Science Myths Busted

Vamos aos top 10 mitos:

Aprender a usar uma ferramenta de dados é o bastante para se tornar um cientista de dados

Da mesma forma que aprender o AutoCAD não transforma ninguém em arquiteto, dominar as ferramentas de data science não torna você um cientista de dados. É claro que, quando se trata de programas tão específicos, dificilmente um leigo completo vai conseguir sequer começar a usar qualquer um desses softwares, mas, assim como a maioria das carreiras mais técnicas, uma série de conhecimentos prévios são necessários para alcançar resultados positivos. Entre esses conhecimentos estão: programação (em diferentes linguagens como, por exemplo, Python e R), que permitirá criar soluções adequadas para cada situação; bancos de dados (SQL e NoSQL, Data Warehouses, Hadoop e etc.), já que em diversos momentos do trabalho será necessário interagir com bancos; inteligência artificial, machine learning e deep learning para implementar algoritmos; matemática e estatística; além de capacidades relacionadas ao entendimento de negócios e comunicação. Este post e este artigo detalham ainda mais as competências necessárias para um cientista de dados. Abaixo uma leitura bastante interessante sobre como se tornar um cientista de dados, sem necessariamente uma faculdade técnica no assunto.

Como se tornar um Cientista de Dados

Data Science é só um termo da moda

No nosso mercado o que não faltam são modas efêmeras ou mesmo tecnologias que, ainda que úteis, não estavam em sintonia com o Zeitgeist (veja, por exemplo, as idas e vindas da Realidade Aumentada e da Realidade Virtual). Mas no meio dessa enxurrada de novidades passageiras nadam também as grandes revoluções, como os serviços de streaming, para citar só uma. Você iria a uma locadora de filmes (se conseguir encontrar uma) hoje em dia para programar a diversão do sábado à noite? Então você provavelmente também não confiaria só na experiência e na intuição na hora de tomar decisões de negócios já que atualmente é possível utilizar dados e minimizar os riscos. Ciência de dados não só é real como também é um grande diferencial para empresas de sucesso, e para as pessoas de sucesso. Pessoas com mindset data-driven são extremamente importantes em todo processo e cultura.

Como ser uma pessoa mais “data driven”?

É difícil encontrar cientistas de dados

A profissão de cientista de dados, apesar de “nova”, não foi criada do zero. Não se trata de um conhecimento que surgiu do nada nos últimos anos, então não será preciso esperar que novas “turmas” de profissionais se formem até que possam atuar no mercado, já temos muitos cientistas trabalhando e buscando colocação. Trata-se de pessoas que vieram da matemática, da estatística, da tecnologia e de outras áreas correlatas e que foram migrando para o estudo das aplicações dos dados. É claro que, com a popularização do tema, mais e mais escolas têm incorporado cursos de data science e a cada dia temos um número maior de profissionais altamente especializados e capacitados no mercado. E para ter uma ideia da média salarial de profissionais da área você pode checar o site de carreiras Glassdoor, entre outros do tipo.

Os segredos para montar uma equipe de análise de dados altamente bem-sucedida.

Ferramentas de data science são muito caras

Como em todas as áreas de atividade humana, existem recursos mais caros e aqueles mais em conta. Tudo vai depender da escala das suas operações, da natureza do seu negócio e de quanto você está disposto a investir. É importante ter em mente que é possível (e até mesmo recomendável) começar aos poucos. Você não compra a melhor raquete de tênis do mundo para o seu filho ou filha que começou a se interessar pelo esporte no mês passado, não é mesmo? Se a criança demonstrar comprometimento e aptidão, naturalmente o investimento pode aumentar proporcionalmente. Com dados é a mesma coisa. Existem alternativas muito acessíveis e até mesmo gratuitas para quem quer começar a usar dados. Veja abaixo alguns exemplos de ferramentas de custo bastante acessível ou até mesmo free para uso em um processo de data science.

The 17 Best Free Tools for Data Science - Dataquest

7 ferramentas gratuitas de análise de dados | CIO

Conforme aumenta o comprometimento da organização e começam a surgir os primeiros resultados, alternativas mais parrudas podem ser necessárias para continuar potencializando os investimentos. Mas nossa dica sempre é, começar pequeno, mostrar valor, e crescer. Just a little data. Step by step.

Uma vez construídos, sistemas de Inteligência Artificial evoluem sozinhos

Se fosse o caso, estaríamos lutando contra algo parecido com a Skynet (inteligência artificial da franquia de filmes O Exterminador do Futuro), não é mesmo? Ainda não chegamos a tanto e, na verdade, não sabemos o quanto perto ou longe disso estamos. Uma IA mais autônoma seria bastante útil, mas a verdade é que a grande maioria dos sistemas empregados hoje possuem uma supervisão para acompanhamento e estudo da sua evolução. Tudo é muito recente ainda, por isso são raros os sistemas sem acompanhamento do seu aprendizado.

Obviamente, a predição (antecipar resultados futuros com base em dados) é uma grande parte da ciência de dados atual, mas esse campo do conhecimento envolve muitos outros conceitos e processos, e na maioria das empresas, ele ainda direciona insights para a tomada de decisão humana, e não com uma atuação autônoma.

Analisar os dados do passado ou mesmo do presente (em tempo real) é importantíssimo para, por exemplo, medir resultados e extrair aprendizados, poder interferir e alterar o curso de um determinado processo e, evidentemente, informar decisões futuras e os próprios modelos preditivos.

A era do Robô Sapiens: a inteligência artificial vai dominar a Terra?

Modelos complexos são melhores do que modelos simples

Assim como no caso das ferramentas de data science, aqui tudo depende de objetivo, escala, recursos disponíveis e previsão de retorno. Projetos simples não precisam de modelos complexos, da mesma forma que um projeto extremamente complexo vai se beneficiar de um modelo capaz de levar em conta todas as variáveis envolvidas. Aqui vale a dica, que serve para tantas outras situações, de começar pelo mais simples, colocar no ar, testar, ver os resultados e ir aumentando a complexidade gradualmente. Não é necessário esperar ter um modelo totalmente complexo para começar a testar. Dessa forma gradual, inclusive, já é possível ir colhendo resultados enquanto o modelo vai sendo melhorado.

Ciência de dados é complicada e difícil de adotar

Mais uma vez é importante relativizar. Construir uma casa ou um prédio é complicado, mas definitivamente não é impossível, porque hoje existe um conhecimento formal, profissionais capacitados, matérias primas e ferramentas específicas. No caso dos dados, tudo é mais recente, mas definitivamente todos os componentes necessários já estão aí. Só não dá pra tentar construir “a casa” sozinho, sem engenheiro, pedreiros, cimento e betoneira. E aqui também vale reforçar: o tamanho e a complexidade do projeto é diretamente proporcional à dificuldade de execução. Comece pelo casebre antes de partir pro arranha-céu.

Como começar a usar dados para o sucesso da sua empresa agora mesmo

É preciso um poder computacional enorme para fazer ciência de dados

Tudo depende da escala e da complexidade do projeto. A computação avançou tanto nos últimos anos (e continua evoluindo exponencialmente) que é possível realizar projetos pequenos e até médios utilizando somente um computador pessoal. Também já existem serviços em nuvem (AWS, Azure, GCP entre outros) para iniciativas mais complexas. Muitas dessas estruturas dão crédito para o início do uso, e há também iniciativas de crédito maiores para projetos específicos.

Google Cloud vs Azure em 2020 (Comparando os Gigantes)

Data Science só serve para grandes empresas ou organizações

Talvez o maior dos mitos e um dos que mais atrasa o desenvolvimento do nosso mercado. É evidente que os gigantes de cada setor geralmente são os pioneiros na adoção de novos processos, filosofias e tecnologias. Mas, o avanço tecnológico e a transformação digital fazem com que todos esses recursos se tornem acessíveis de alguma maneira ao resto do mercado (em maior ou menor grau) muito rapidamente logo em seguida, como ficou claro na discussão sobre os mitos anteriores. Além disso, é preciso enxergar o uso de dados de forma clara e lúcida não é coisa de outro mundo. Se você tem uma pequena loja e consulta seus arquivos para saber quais produtos vendem mais no inverno e quais vendem mais no verão para organizar seus pedidos ao fornecedor de acordo com a demanda futura, você já está usando dados em benefício do seu negócio. Trocando em miúdos, se você tem uma pergunta cuja resposta pode ajudar a encontrar um caminho melhor para os seus negócios e os dados que possam responder a essa pergunta, você está pronto para começar a buscar na ciência de dados um instrumento para o sucesso do seu empreendimento.

Ficou com alguma dúvida ou tem algum mito sobre ciência de dados que você gostaria de esclarecer? Fale com a gente e vamos buscar juntos essas respostas!

www.just.bi