Artigos

2.2: Definições de Estatística, Probabilidade e Termos-Chave - Matemática


A ciência da estatística lida com a coleta, análise, interpretação e apresentação de dados. Vemos e usamos dados em nossa vida cotidiana.

Exercício Colaborativo

Em sua sala de aula, tente este exercício. Peça aos alunos que anotem o tempo médio (em horas, com precisão de meia hora) que dormem por noite. Seu instrutor registrará os dados. Em seguida, crie um gráfico simples (chamado de plot plot) dos dados. Um gráfico de pontos consiste em uma linha numérica e pontos (ou pontos) posicionados acima da linha numérica. Por exemplo, considere os seguintes dados:

5; 5.5; 6; 6; 6; 6.5; 6.5; 6.5; 6.5; 7; 7; 8; 8; 9

O gráfico de pontos para esses dados seria o seguinte:

Figura ( PageIndex {1} )

  • Seu gráfico de pontos é igual ou diferente do exemplo? Por quê?
  • Se você fizesse o mesmo exemplo em uma aula de inglês com o mesmo número de alunos, você acha que os resultados seriam os mesmos? Por que ou por que não?
  • Onde seus dados parecem se agrupar? Como você pode interpretar o agrupamento?

As perguntas acima pedem que você analise e interprete seus dados. Com este exemplo, você começou seu estudo de estatística.

Neste curso, você aprenderá como organizar e resumir dados. Organizar e resumir dados é chamado estatísticas descritivas. Duas maneiras de resumir os dados são fazendo gráficos e usando números (por exemplo, encontrando uma média). Depois de estudar a probabilidade e as distribuições de probabilidade, você usará métodos formais para tirar conclusões a partir de dados "bons". Os métodos formais são chamados Estatística inferencial. A inferência estatística usa a probabilidade para determinar o quão confiantes podemos ter de que nossas conclusões estão corretas.

A interpretação eficaz dos dados (inferência) é baseada em bons procedimentos para a produção de dados e exame cuidadoso dos dados. Você encontrará o que parecerá muitas fórmulas matemáticas para interpretar dados. O objetivo da estatística não é realizar vários cálculos usando as fórmulas, mas obter uma compreensão de seus dados. Os cálculos podem ser feitos usando uma calculadora ou um computador. O entendimento deve vir de você. Se você conseguir entender completamente os fundamentos da estatística, poderá ter mais confiança nas decisões que toma na vida.

Probabilidade

Probabilidade é uma ferramenta matemática usada para estudar a aleatoriedade. Lida com a chance (a probabilidade) de um evento ocorrer. Por exemplo, se você jogar uma moeda justa quatro vezes, os resultados podem não ser duas caras e duas coroas. No entanto, se você jogar a mesma moeda 4.000 vezes, os resultados serão quase meia cara e meia coroa. A probabilidade teórica esperada de cara em qualquer lançamento é ( frac {1} {2} ) ou 0,5. Mesmo que os resultados de algumas repetições sejam incertos, há um padrão regular de resultados quando há muitas repetições. Depois de ler sobre o estatístico inglês Karl Pearson que jogou uma moeda 24.000 vezes com um resultado de 12.012 caras, um dos autores jogou uma moeda 2.000 vezes. Os resultados foram 996 cabeças. A fração ( frac {996} {2000} ) é igual a 0,498 que é muito próxima de 0,5, a probabilidade esperada.

A teoria da probabilidade começou com o estudo de jogos de azar como o pôquer. As previsões assumem a forma de probabilidades. Para prever a probabilidade de um terremoto, de chuva ou se você obterá um A neste curso, usamos as probabilidades. Os médicos usam a probabilidade para determinar a chance de uma vacinação causar a doença que a vacinação deve prevenir. Um corretor de ações usa a probabilidade para determinar a taxa de retorno dos investimentos de um cliente. Você pode usar a probabilidade para decidir comprar um bilhete de loteria ou não. Em seu estudo de estatística, você usará o poder da matemática por meio de cálculos de probabilidade para analisar e interpretar seus dados.

Termos chave

Em estatística, geralmente queremos estudar um população. Você pode pensar em uma população como uma coleção de pessoas, coisas ou objetos em estudo. Para estudar a população, selecionamos um amostra. A ideia de amostragem é selecionar uma porção (ou subconjunto) da população maior e estudar essa porção (a amostra) para obter informações sobre a população. Os dados são o resultado da amostragem de uma população.

Como leva muito tempo e dinheiro para examinar uma população inteira, a amostragem é uma técnica muito prática. Se você deseja calcular a média geral das notas em sua escola, faria sentido selecionar uma amostra de alunos que frequentam a escola. Os dados coletados da amostra seriam as médias das notas dos alunos. Nas eleições presidenciais, são coletadas amostras de pesquisas de opinião de 1.000 a 2.000 pessoas. A pesquisa de opinião deve representar as opiniões das pessoas em todo o país. Os fabricantes de bebidas gaseificadas em lata coletam amostras para determinar se uma lata de 16 onças contém 16 onças de bebida gaseificada.

A partir dos dados da amostra, podemos calcular uma estatística. UMA estatística é um número que representa uma propriedade da amostra. Por exemplo, se considerarmos uma aula de matemática como uma amostra da população de todas as classes de matemática, então o número médio de pontos ganhos pelos alunos naquela aula de matemática no final do semestre é um exemplo de estatística. A estatística é uma estimativa de um parâmetro populacional. UMA parâmetro é um número propriedade da população. Como consideramos todas as classes de matemática como a população, o número médio de pontos ganhos por aluno em todas as classes de matemática é um exemplo de parâmetro.

Uma das principais preocupações no campo das estatísticas é a precisão com que uma estatística estima um parâmetro. A precisão realmente depende de quão bem a amostra representa a população. A amostra deve conter as características da população para ser um exemplo representativo. Estamos interessados ​​tanto na estatística da amostra quanto no parâmetro da população na estatística inferencial. Em um capítulo posterior, usaremos a estatística da amostra para testar a validade do parâmetro populacional estabelecido.

UMA variável, notado por letras maiúsculas como (X ) e (Y ), é uma característica de interesse para cada pessoa ou coisa em uma população. Variáveis ​​podem ser numérico ou categórico. Variáveis ​​numéricas assumir valores com unidades iguais, como peso em libras e tempo em horas. Variáveis ​​categóricas coloque a pessoa ou coisa em uma categoria. Se deixarmos (X ) igual ao número de pontos ganhos por um aluno de matemática no final de um período letivo, então (X ) é uma variável numérica. Se deixarmos (Y ) ser a filiação partidária de uma pessoa, alguns exemplos de (Y ) incluem Republicano, Democrata e Independente. (Y ) é uma variável categórica. Poderíamos fazer matemática com valores de (X ) (calcular o número médio de pontos ganhos, por exemplo), mas não faz sentido fazer matemática com valores de (Y ) (calcular uma afiliação partidária média não faz senso).

Dados são os valores reais da variável. Eles podem ser números ou podem ser palavras. Dado é um único valor.

Duas palavras que aparecem com frequência nas estatísticas são mau e proporção. Se você fizesse três exames em suas aulas de matemática e obtivesse pontuações de 86, 75 e 92, você calcularia sua pontuação média somando as três pontuações de exames e dividindo por três (sua pontuação média seria de 84,3 com uma casa decimal) . Se, em sua classe de matemática, há 40 alunos e 22 são homens e 18 são mulheres, então a proporção de alunos homens é ( frac {22} {40} ) e a proporção de alunos mulheres é ( frac {18} {40} ). Média e proporção são discutidas em mais detalhes em capítulos posteriores.

As palavras "mau" e "média"são frequentemente usados ​​indistintamente. A substituição de uma palavra pela outra é uma prática comum. O termo técnico é" média aritmética "e" média "é tecnicamente um local central. No entanto, na prática entre não estatísticos," média "é comumente aceito para "média aritmética".

Exemplo ( PageIndex {1} )

Determine a que os termos-chave se referem no seguinte estudo. Queremos saber a quantidade média (média) de dinheiro que os estudantes universitários do primeiro ano gastam no ABC College com materiais escolares que não incluem livros. Nós pesquisamos aleatoriamente 100 alunos do primeiro ano da faculdade. Três desses alunos gastaram $ 150, $ 200 e $ 225, respectivamente.

Responder

  • O população são todos os alunos do primeiro ano do ABC College neste semestre.
  • O amostra podem ser todos os alunos matriculados em uma seção de um curso de estatística para iniciantes no ABC College (embora esta amostra possa não representar toda a população).
  • O parâmetro é a quantia média (média) de dinheiro gasto (excluindo livros) por alunos do primeiro ano de faculdade no ABC College neste semestre.
  • O estatística é a quantidade média (média) de dinheiro gasto (excluindo livros) por estudantes universitários do primeiro ano da amostra.
  • O variável pode ser a quantia de dinheiro gasta (excluindo livros) por um aluno do primeiro ano. Seja (X ) = a quantidade de dinheiro gasta (excluindo os livros) por um aluno do primeiro ano do ABC College.
  • O dados são os valores em dólares gastos pelos alunos do primeiro ano. Exemplos de dados são $ 150, $ 200 e $ 225.

Exercício ( PageIndex {1} )

Determine a que os termos-chave se referem no seguinte estudo. Queremos saber a quantidade média (média) de dinheiro gasta em uniformes escolares a cada ano por famílias com crianças na Knoll Academy. Pesquisamos aleatoriamente 100 famílias com crianças na escola. Três das famílias gastaram $ 65, $ 75 e $ 95, respectivamente.

Responder

  • O população são todas as famílias com crianças que frequentam a Knoll Academy.
  • O amostra é uma seleção aleatória de 100 famílias com crianças que frequentam a Knoll Academy.
  • O parâmetro é a quantia média (média) de dinheiro gasta em uniformes escolares por famílias com filhos na Knoll Academy.
  • O estatística é a quantia média (média) de dinheiro gasta em uniformes escolares pelas famílias da amostra.
  • O variável é a quantidade de dinheiro gasta por uma família. Let (X ) = a quantia de dinheiro gasta em uniformes escolares por uma família com filhos que frequentam a Knoll Academy.
  • O dados são os valores em dólares gastos pelas famílias. Exemplos de dados são $ 65, $ 75 e $ 95.

Exemplo ( PageIndex {2} )

Determine a que os termos-chave se referem no seguinte estudo.

Um estudo foi realizado em uma faculdade local para analisar a média cumulativa de GPAs de alunos que se formaram no ano passado. Preencha a letra da frase que melhor descreve cada um dos itens abaixo.

1 ._____ População 2 ._____ Estatística 3 ._____ Parâmetro 4 ._____ Amostra 5 ._____ Variável 6 ._____ Dados

  1. todos os alunos que frequentaram a faculdade no ano passado
  2. o GPA cumulativo de um aluno que se formou na faculdade no ano passado
  3. 3.65, 2.80, 1.50, 3.90
  4. um grupo de alunos que se formaram na faculdade no ano passado, selecionados aleatoriamente
  5. o GPA acumulado médio de alunos que se formaram na faculdade no ano passado
  6. todos os alunos que se formaram na faculdade no ano passado
  7. o GPA acumulado médio de alunos no estudo que se formaram na faculdade no ano passado

Responder

1. f; 2. g; 3. e; 4. d; 5. b; 6. c

Exemplo ( PageIndex {3} )

Determine a que os termos-chave se referem no seguinte estudo.

Como parte de um estudo elaborado para testar a segurança de automóveis, o National Transportation Safety Board coletou e revisou dados sobre os efeitos de um acidente de automóvel em manequins de teste. Aqui está o critério que eles usaram:

Velocidade na qual os carros bateramLocalização da “unidade” (ou seja, manequins)
35 milhas / horaAssento Dianteiro

Carros com manequins nos bancos dianteiros colidiram com uma parede a uma velocidade de 35 milhas por hora. Queremos saber a proporção de manequins no assento do motorista que teriam ferimentos na cabeça, se fossem motoristas reais. Começamos com uma amostra aleatória simples de 75 carros.

Responder

  • O população são todos os carros contendo manequins no banco dianteiro.
  • O amostra são os 75 carros, selecionados por uma amostra aleatória simples.
  • O parâmetro é a proporção de manequins motoristas (se fossem pessoas reais) que teriam sofrido ferimentos na cabeça na população.
  • O estatística é a proporção de manequins de motorista (se fossem pessoas reais) que teriam sofrido ferimentos na cabeça na amostra.
  • O variável (X ) = o número de manequins de motorista (se fossem pessoas reais) que teriam sofrido ferimentos na cabeça.
  • O dados são: sim, teve traumatismo craniano, ou não, não teve.

Exemplo ( PageIndex {4} )

Determine a que os termos-chave se referem no seguinte estudo.

Uma seguradora gostaria de determinar a proporção de todos os médicos que estiveram envolvidos em uma ou mais ações judiciais por negligência médica. A empresa seleciona aleatoriamente 500 médicos em um diretório profissional e determina o número da amostra que se envolveu em um processo por negligência médica.

Responder

  • O população são todos os médicos listados no diretório profissional.
  • O parâmetro é a proporção de médicos que estiveram envolvidos em um ou mais processos por negligência na população.
  • O amostra são os 500 médicos selecionados aleatoriamente no diretório profissional.
  • O estatística é a proporção de médicos que estiveram envolvidos em um ou mais processos por negligência na amostra.
  • O variável (X ) = o número de médicos que estiveram envolvidos em um ou mais processos por imperícia.
  • O dados são: sim, esteve envolvido em um ou mais processos de negligência, ou não, não foi.

Exercício Colaborativo

Faça o seguinte exercício colaborativamente com até quatro pessoas por grupo. Encontre uma população, uma amostra, o parâmetro, a estatística, uma variável e os dados para o seguinte estudo: Você deseja determinar o número médio (médio) de copos de leite que os estudantes universitários bebem por dia. Suponha que ontem, em sua aula de inglês, você perguntasse a cinco alunos quantos copos de leite eles beberam no dia anterior. As respostas foram 1, 0, 1, 3 e 4 copos de leite.

Prática

Use as informações a seguir para responder aos próximos cinco exercícios. Os estudos são frequentemente realizados por empresas farmacêuticas para determinar a eficácia de um programa de tratamento. Suponha que uma nova droga anti-AIDS esteja atualmente em estudo. É administrado aos pacientes assim que os sintomas da AIDS se manifestarem. De interesse é o tempo médio (médio) em meses que os pacientes vivem depois de iniciar o tratamento. Dois pesquisadores acompanham, cada um, um grupo diferente de 40 pacientes com AIDS, desde o início do tratamento até a morte. Os seguintes dados (em meses) são coletados.

Pesquisador A:

3; 4; 11; 15; 16; 17; 22; 44; 37; 16; 14; 24; 25; 15; 26; 27; 33; 29; 35; 44; 13; 21; 22; 10; 12; 8; 40; 32; 26; 27; 31; 34; 29; 17; 8; 24; 18; 47; 33; 34

Pesquisador B:

3; 14; 11; 5; 16; 17; 28; 41; 31; 18; 14; 14; 26; 25; 21; 22; 31; 2; 35; 44; 23; 21; 21; 16; 12; 18; 41; 22; 16; 25; 33; 34; 29; 13; 18; 24; 23; 42; 33; 29

Determine a que os termos-chave se referem no exemplo do Pesquisador A.

Exercício ( PageIndex {2} )

população

Responder

Pacientes com AIDS.

Exercício ( PageIndex {3} )

amostra

Exercício ( PageIndex {4} )

parâmetro

Responder

O tempo médio (em meses) de vida dos pacientes com AIDS após o tratamento.

Exercício ( PageIndex {5} )

estatística

Exercício ( PageIndex {6} )

variável

Responder

(X = ) o período de tempo (em meses) que os pacientes com AIDS vivem após o tratamento

Glossário

A teoria matemática da estatística é mais fácil de aprender quando você conhece a linguagem. Este módulo apresenta termos importantes que serão usados ​​ao longo do texto.

Média
também chamado de média; um número que descreve a tendência central dos dados
Variável categórica
variáveis ​​que assumem valores que são nomes ou rótulos
Dados
um conjunto de observações (um conjunto de resultados possíveis); a maioria dos dados pode ser colocada em dois grupos: qualitativo(um atributo cujo valor é indicado por um rótulo) ou quantitativo (um atributo cujo valor é indicado por um número). Os dados quantitativos podem ser separados em dois subgrupos: discreto e contínuo. Os dados são discretos se forem o resultado de uma contagem (como o número de alunos de um determinado grupo étnico em uma classe ou o número de livros em uma estante). Os dados são contínuos se forem o resultado da medição (como distância percorrida ou peso da bagagem)
Variável Numérica
variáveis ​​que assumem valores indicados por números
Parâmetro
um número que é usado para representar uma característica da população e que geralmente não pode ser determinado facilmente
População
todos os indivíduos, objetos ou medidas cujas propriedades estão sendo estudadas
Probabilidade
um número entre zero e um, inclusive, que dá a probabilidade de que um evento específico ocorra
Proporção
o número de sucessos dividido pelo número total na amostra
Exemplo representativo
um subconjunto da população que tem as mesmas características da população
Amostra
um subconjunto da população estudada
Estatística
uma característica numérica da amostra; uma estatística estima o parâmetro populacional correspondente.
Variável
uma característica de interesse para cada pessoa ou objeto em uma população


Assista o vídeo: CÁLCULO DE PROBABILIDADES (Novembro 2021).