quarta-feira, 5 de janeiro de 2011

Malditos Intervalos de Confiança!

Esse primeiro post irá tentar ajudar a todos, que como eu, precisam ou precisarão calcular Intervalos de Confiança e não sabem nem o que é isso ou como fazer isso.

Há cerca de um ano e meio eu tento escrever uma coisa chamada de Trabalho de Conclusão de Curso (TCC). Eu sei, já faz tempo e eu já deveria ter terminado isso. O problema é que sou uma grande preguiçosa e me dou muito mal com palavras.

Ao longo da minha caminhada tive inúmeras dificuldades, mas a maior delas foram os malditos Intervalos de Confiança. Afinal, o que são e para que servem eles? Se você jogar esse termo no Google irá encontrar muitas definições, mas se você for como eu (uma pessoa que detesta cálculos e não entende fórmulas facilmente, muito menos definições de fórmulas), terá grandes problemas. Ao pesquisar sobre o termo encontrei uma definição no site da Wikipédia: 
"Em estatística, um intervalo de confiança (IC) é um intervalo estimado de um parâmetro estatístico. Em vez de estimar o parâmetro por um único valor, é dado um intervalo de estimativas prováveis. Quão prováveis são estas estimativas é determinado pelo coeficiente de confiança. Quanto maior a probabilidade do intervalo conter o parâmetro, maior será o intervalo."

E uma linda fórmula: 
\Pr(U<\theta<V|\theta)=x (onde x é um número entre 0 e 1)

Após ler essa definição e ver essa fórmula surgiram mais dúvidas do que soluções. Eu, realmente, precisava de ajuda, por isso, procurei meu professor de Estatística e Probabilidade, cadeira que eu paguei em 2006.2 e sempre acreditei que ela não me serviria para nada. Descobri que, para obter o Intervalo de Confiança de um dado eu precisaria saber a Média e o Desvio Padrão (Mais nomes estranhos para complicar o caminho) dos mesmos. Eu tinha muitos números e até consegui aprender a calcular todos esses nomes feios (Para mim, estas coisas deviam estar na lista de palavrões), nem se eu nunca mais saísse de casa conseguiria terminar esses cálculos no prazo estimado, então pedi ajuda aos amigos, alguém deveria ter um script que fizesse isso, e consegui, porém, o script só calculava a Média e o Desvio Padrão, eu continuava sem solução para os malditos Intervalos de Confiança e eu, definitivamente, não iria fazer aquilo no braço.

Então, descobri que com uma Planilha de Texto (Eu usei o Excel!), conseguiria fazer aquilo facilmente (E odiei meu professor de Estatística e Probabilidade, por não ter me ensinado daquela maneira). Para calcular os Intervalos de Confiança no Excel é simples:
Clique na Figura para aumentá-la
Dessa forma, você consegue de maneira fácil e rápida obter o seu Intervalo de Confiança com uma Planilha de Texto. Nesse momento, você deve estar se perguntando: O que é esse Nível de confiança? E como conseguir o Desvio Padrão?

O Nível de Confiança é a probabilidade de que o Intervalo de Confiança tenha o valor do parâmetro autêntico. Na minha pesquisa eu adotei o valor de 95% para o Nível de Confiança da informação, ao converter (Você tem que converter para calcular na Planilha de Texto), chega-se a esse valor de 0,05. 

Para descobri o Desvio Padrão, primeiro você precisará saber a Média dos seus dados, com essa fórmula:
\overline{x} = \dfrac{1}{n}\sum_{i=1}^n x_i = \dfrac{x_1+x_2+\cdots+x_n}{n}
E assim, poderá usar essa outra fórmula para obter o seu Desvio Padrão Amostral: 
s = \sqrt{\dfrac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2}
Por que o Desvio Padrão Amostral? Porque, no meu caso, eu tinha dados que iam de  \operatorname{x}_1,\dots,\operatorname{x}_n . Se você pretende saber apenas o Desvio Padrão de uma variável aleatória, pode usar essa fórmula:
\overline{x} = \dfrac{1}{n}\sum_{i=1}^n x_i = \dfrac{x_1+x_2+\cdots+x_n}{n}

Assim como eu, sei que vocês não entenderam nada do que falei acima. Então, esqueçam!

Com a Planilha de Texto, dá pra conseguir esses dados rapidamente, e o melhor, sem a necessidade de entender para que serve essas fórmulas (Para a felicidade de vocês, no meu caso, eu tive que aprender e só depois descobri a maneira fácil de ser feita). Para calcular a Média é simples:
Clique na Figura para aumentá-la
E o Desvio Padrão segue da mesma maneira:
Clique na Figura para aumentá-la
Essa Planilha de Texto disponibiliza muitas fórmulas para cálculos diferenciados, você só precisa colocar um sinal de "=" na célula que você quer que o resultado apareça, no meu caso, usei as seguintes operações: =INT.CONFIANÇA(parâmetros), =MÉDIA(parâmetros) e =DESVPAD(parâmetros) e, entre parênteses, colocar os dados necessários para a obtenção dos resultados, exigidos pela fórmula que pretende usar.

Após conseguir gerar todos os Intervalos de Confiança necessários, era precisa colocá-los num gráfico. Encontrei diversos programas que fazem isso, mas todos eram versões pagas e eu não ia comprar um programa para fazer isso. Eu não conseguia informações na web sobre a Planilha de Texto que eu estava usando, precisava saber se ela dava suporte a criação de gráficos com os Intervalos de Confiança. Quando eu desisti, consegui descobrir que a Planilha de Texto dava suporte à criação desses gráficos, e o maior incentivo para a criação deste blog foi essa descoberta, porque eu não consegui achar em lugar algum essa informação, por isso, decidi disponibilizá-la.

Vou seguir a premissa que todos os leitores já saibam gerar gráficos numa Planilha de Texto. Então, colocar Intervalos de Confiança no seu gráfico é simples e grátis, assim:
Clique na Figura para aumentá-la
Com o seu gráfico selecionado, clique na aba Layout > Análise > Barra de Erros, aparecerá vários tipos de barras de erros que você pode usar, a escolha fica a seu critério. E o melhor, você nem vai precisar calcular todos os Intervalos de Confiança, ao escolher a opção Barra de Erros com Porcentagem o seu gráfico já é gerado automaticamente, de acordo com os dados que você tem e uma porcentagem de erro de 5%. Mas, se assim como eu, você já calculou e já tem os seus Intervalos de Confiança, para não ter um trabalho inútil, você pode clicar em cima de qualquer barrinha do seu gráfico com o botão direito e selecionar "Formatar série de dados" e aparecerá a aba "Barra de Eixos Y", clique em "Personalizar" e "+" e selecione as células de variação positiva e, em "-" e selecione as células de variação negativa.

Após toda essa saga, conclui que o Excel é uma ótima ferramenta quando o assunto são cálculos ou gráficos, dá pra fazer muita coisa de maneira fácil e rápida. Graças a essa ferramenta conclui os meus cálculos e gráficos em uma semana, quando na primeira vez que tentei fazer perdi dois meses. E, para que você, ao tentar fazer o mesmo que eu, não perca dois ou mais meses, decidi ajudá-lo.

Espero ter ajudado, qualquer dúvida coloquem nos comentários. 

Ah! Eu não sou 'expert' com Planilhas de Texto, não entendo de Intervalo de Confiança, muito menos de Desvio Padrão e não sei escrever. Por isso, relevem!

Todas as fórmulas que aparecem neste post foram tiradas das seguintes páginas: