O fato de que a estatística é fundamental para ciência de dados é indiscutível. Mas você de fato entende o que é a estatística? Neste artigo vamos descrever brevemente o que ela é e quais são seus principais elementos.
Ela está presente nas nossas vidas desde tempos antigos, quando os povos coletavam dados para possível tomada de decisão. Porém mesmo presente na vida de todos, ainda que indiretamente, ela só começou a ser aplicada nas empresas como uma vantagem competitiva a partir do século XX.
Afinal, o que é a estatística?
A estatística é uma ciência que objetiva a coleta, análise e interpretação de dados qualitativos e quantitativos. Pensando nessa definição, percebemos o motivo dela ter se tornado um diferencial competitivo apenas a partir do século XX: os avanços computacionais. Com os avanços tecnológicos, os bancos de dados, a melhoria nos processadores, entre outros aspectos torna a sua aplicação mais acessível e rápida para os diversos usuários.
E o que é possível conquistar com a estatística? Desenvolveremos essa frase falando das suas principais áreas: a estatística descritiva e a estatística inferencial.
Podemos observar, explorar, identificar padrões e comportamentos de pessoas que compram um determinado tipo de produto na internet usando a estatística descritiva. No entanto, com a inferencial podemos aprender o comportamento dessas pessoas e testar hipóteses em uma amostra para replicar as conclusões para toda a população.
Amostra, população… qual a diferença entre esses termos? Bem, usando essa dúvida, vamos definir alguns elementos básicos nos tópicos abaixo.
População e amostra
A população é o conjunto que contém todos os elementos que serão estudados e que apresentam características em comum, por exemplo, todas as pessoas da cidade do Rio de Janeiro. Entretanto, imagina usar toda a população da cidade para realizar um estudo? Dependendo do tamanho da cidade, pode se tornar inviável. Para contornar esse problema, usamos uma amostra, que é um subconjunto extraído da população.
Dados e variável
Os dados são a matéria prima de uma análise estatística e são o conjunto de características que estamos querendo estudar. A partir de todas essas características, conseguimos definir as características que queremos estudar. Utilizando o mesmo exemplo do estudo da população da cidade do Rio de Janeiro, é possível ter registros de idade, endereço, nomes, peso, entre outras informações sobre um indivíduo em estudo, por exemplo. Essas características únicas são as variáveis.
Gostou de saber um pouco mais sobre o tema? Finalizo indicando esses dois livros para os que desejam se aprofundar sem esbarrar tanto na parte técnica.