quinta-feira, 14 de abril de 2011

CONTINUANDO A DISTINGUIR CONCEITOS MUITO CONFUNDIDOS PELAS PESSOAS E APROVEITANDO PARA ESCLARECER DÚVIDAS DE UMA CLIENTE

INTERVALO DE CONFIANÇA x NÍVEL DE CONFIANÇA x NÍVEL DE SIGNIFICÂNCIA


Alguns dias atrás, uma engenheira de um laboratório de ensaios da Universidade do Estado do Rio de Janeiro, que atendo com treinamento e consultoria, entrou em contato comigo, buscando algumas informações sobre a distribuição estatística t de Student.

Dentre elas: Por que, em geral, trabalhamos com um nível de confiança de  95% (95,45%), nas estimativas de valores que fazemos a partir de um conjunto de dados obtidos experimentalmente, como no caso das determinações de incerteza de medição? Poderíamos adotar um outro nível de confiança? Como o determinaríamos?

Esclareci de pronto, as dúvidas mais urgentes da engenheira e deixei para esclarecer as outras aqui no blog, já que dentro desse trabalho que venho desenvolvendo em minhas últimas postagens, de esclarecimento de conceitos que percebo que as pessoas costumam confundir, eu já tinha a intenção de distinguir NÍVEL DE CONFIANÇA de INTERVALO DE CONFIANÇA, bem como, NÍVEL DE CONFIANÇA de NÍVEL DE SIGNIFICÂNCIA, que são conceitos muito confundidos.

Vamos lá, então!

Definirei agora, exatamente cada um desses três conceitos, usando para isso, a distribuição t DE STUDENT e esclarecerei as dúvidas de minha cliente a respeito desta, que ainda não sanei. Para tanto, irei abordar também alguns outros conceitos relacionados.

ESTIMATIVA PONTUAL e ESTIMATIVA INTERVALAR

Quando fazemos uma estimativa do valor de um parâmetro, podemos fazer uma única estimativa, ou melhor, estimar um único valor, para o mesmo ou estimar um intervalo de valores possíveis, no qual se admite que o parâmetro está.

No primeiro caso, fazemos uma ESTIMATIVA PONTUAL do valor do parâmetro. No segundo, que é mais comum, fazemos uma ESTIMATIVA INTERVALAR do valor do parâmetro.

Por exemplo, o resultado que fornecemos para qualquer medição que executamos, é uma ESTIMATIVA INTERVALAR do valor da grandeza medida. Não é possível fazermos uma ESTIMATIVA PONTUAL do valor da mesma, já que nenhuma medição é perfeita. Toda medição sempre apresenta erro, que gera uma dúvida quanto ao valor preciso da grandeza mensurada. Essa dúvida, sempre existente, é retratada pela INCERTEZA DE MEDIÇÃO, que constitui o intervalo de valores em que assumimos que o valor real daquilo que medimos se encontra.

Assim sendo, devemos expressar sempre, da forma abaixo, o resultado de toda medição que executarmos:

Resultado da medição= valor mais provável da grandeza (valor médio das replicatas testadas) ± incerteza de medição= VM ± U



NÍVEL DE CONFIANÇA X INTERVALO DE CONFIANÇA

Ao fazermos uma ESTIMATIVA INTERVALAR de um valor, determinamos, como acabamos de ver, um intervalo de valores, no qual afirmamos que o valor preciso está, mas, com uma determinada margem de erro. Esta margem de erro é expressa pelo nível de probabilidade do valor preciso estar nesse intervalo que definimos.

Esse nível de probabilidade é o NÍVEL DE CONFIANÇA do intervalo definido e essse intervalo é o INTERVALO DE CONFIANÇA.

O NÍVEL DE CONFIANÇA é assim, o nível de probabilidade do valor preciso estar dentro de um dado INTERVALO DE CONFIANÇA e é expresso pelo percentual que exprime essa probabilidade.


DISTRIBUIÇÃO ESTATÍSTICA t DE STUDENT     

Valores obtidos experimentalmente, como por exemplo, em medições, usualmente apresentam uma DISTRIBUIÇÃO ESTATÍSTICA NORMAL ou alguma outra, derivada dela.

A definição e o uso de outras distribuições estatísticas derivadas da DISTRIBUIÇÃO NORMAL para valores experimentais se fazem necessários porque a DISTRIBUIÇÃO NORMAL foi definida para um número infinito de dados (ESTATÍSTICA POPULACIONAL) e experimentalmente, obtemos um número finito de valores, originados do número finito de amostras que testamos, ou seja, de replicatas que executamos (ESTATÍSTICA AMOSTRAL). Utilizamos inclusive, o menor número de amostras/replicatas que for possível, para agilizar ao máximo, a execução do experimento.

As distribuições derivadas da normal descrevem melhor a distribuição, ao longo de um intervalo, de um número finito de valores. Por isso, para dados experimentais obtidos de um número de replicatas (chamado de TAMANHO DE AMOSTRA) < 30, adotamos a distribuição estatística t DE STUDENT. Ela descreve bem a distribuição dos "n" valores <30, que obtemos nessas replicatas, ao longo do intervalo que estimamos para os mesmos, que é o INTERVALO DE CONFIANÇA, onde o real valor está contido, com um determinado nível de probabilidade, que é o NÍVEL DE CONFIANÇA.

A DISTRIBUIÇÃO NORMAL, bem como, suas derivadas, portanto, a t DE STUDENT, são distribuições simétricas. A área da curva que usamos para representá-las, que tem forma de sino, representa o intervalo de confiança máximo onde o valor estará, com um nível de confiança de 100%. 

Frações dessa área sob a curva da distribuição representam um intervalo de confiança com um nível de confiança < 100%, ou seja, com uma probabilidade menor que 100%, do valor preciso estar dentro dele. O percentual que representa a probabilidade do valor preciso estar contido num dado pedaço da área sob a curva expressa o nível de confiança daquele intervalo de confiança.

Sendo a distibuição normal e todas as distribuições derivadas dela, simétricas, a área sob suas curvas também é. Como o INTERVALO DE CONFIANÇA é um pedaço da área sob a curva da distribuição estatística dos dados, assim como ela, também é sempre simétrico.

Seu centro é a média dos "n" valores determinados experimentalmente e constitui o valor mais provável do parâmetro ou grandeza que estivermos determinando. A extensão do intervalo é medida em números de desvios padrão desses "n" valores em relação à sua média, já que representa o grau de dispersão dos valores, cujo parâmetro estatístico que mede é o desvio padrão dos mesmos.



OUTROS NÍVEIS DE CONFIANÇA ALÉM DO DE  95% (95,45%)

Temos assim, diferentes INTERVALOS DE CONFIANÇA possíveis, cada um deles, correspondente a um determinado número de desvios padrão em que os valores estão dispersos em torno do valor central (média), igualmente abaixo e acima do mesmo, devido à simetria.

Cada um desses diversos INTERVALOS DE CONFIANÇA possíveis tem seu NÍVEL DE CONFIANÇA. Portanto, também temos diferentes NÍVEIS DE CONFIANÇA possíveis, um para cada intervalo possível. 

Na distribuição t de Student, destacam-se três INTERVALOS DE CONFIANÇA e seus respectivos NÍVEIS DE CONFIANÇA:

- Um intervalo de 1 desvio padrão acima e abaixo da média dos dados, que tem um nível de confiança de  90%.
- Um intervalo de 2 desvios padrão acima e abaixo da média dos dados, que é o que em geral, usamos, com um nível de confiança de  95%.
- Um intervalo de 3 desvios padrão acima e abaixo da média dos dados, que tem um nível de confiança de  99%.



PORQUE O NÍVEL DE CONFIANÇA DE  95% (95,45%) É O QUE USUALMENTE EMPREGAMOS?

A razão é o fato de ser ele o nível de confiança que melhor representa o equilíbrio entre a dispersão dos valores (largura do intervalo de confiança) e a confiabilidade estatística do intervalo determinado (nível de confiança).



NÍVEL DE CONFIANÇA X NÍVEL DE SIGNIFICÂNCIA

O NÍVEL DE SIGNIFICÂNCIA de um INTERVALO DE CONFIANÇA é o complemento de seu NÍVEL DE CONFIANÇA, ou seja, é a diferença percentual entre este e 100% (NÍVEL DE CONFIANÇA DA ÁREA TOTAL SOB A CURVA).

Representa assim, o percentual da área total sob a curva correspondente às duas partes iguais da mesma, uma de cada lado, não incluídas no INTERVALO DE CONFIANÇA considerado.

Espero ter conseguido diferenciar claramente os três conceitos e vocês não os confundam mais. Também espero tê-los feito compreender melhor outros conceitos que abordei aqui e espero ainda ter sido capaz de esclarecer as dúvidas ainda pendentes de minha cliente.

Tudo o que foi abordado nesta postagem é discutido com um nível maior de detalhamento nos cursos de Estatística para Laboratórios e de Quimiometria (Estatística Aplicada a Medições Químicas) e também de Determinação de Incerteza de Medição que ministro. Quem sabe não terei o prazer de tê-los como alunos em um desses meus cursos e poder lhes ainda mais e melhor esses e outros conceitos.

Abraços a todos!

Luiz Ramalho


          

            

Nenhum comentário:

Postar um comentário