En el mundo de la investigación científica, el valor de p ha sido objeto de debate continuo. Aunque ampliamente utilizado, muchos investigadores aún no comprenden completamente su significado. Este artículo busca clarificar este concepto y su aplicación en el contexto de la hipótesis de trabajo estadística.
¿Qué es el Valor de P?
El valor de p es similar al concepto de probabilidad que manejamos en la vida diaria. Es la probabilidad de que ciertos resultados hayan ocurrido si se cumple la “hipótesis que se trata rechazar”. Si esta probabilidad es muy baja (cercana a cero), se rechaza la hipótesis. Es la probabilidad de obtener ciertos resultados dado que se cumple la hipótesis que “se quiere” rechazar; si ese valor de p es muy pequeño, se rechaza la hipótesis y se logra lo buscado.
¿Cómo se Calcula (Estima) el Valor de P?
En términos generales, todas las probabilidades se estiman a partir de repetidas observaciones. Las probabilidades se estiman (nos aproximamos a ellas) como la probabilidad de que “llueva hoy”. No podemos calcularla pero sí podemos estimarla. Un observatorio meteorológico puede tener hoy día muchas (cientos, miles quizás) observaciones que le permiten calcular la proporción de veces que llueve en “días como hoy” y esa proporción (o porcentaje) será la estimación de la probabilidad de que llueva hoy. Entonces, precisamente lo que necesitamos para esa estimación son observaciones.
Si vamos al contexto de la evaluación de una nueva intervención sanitaria, necesitaremos en primer lugar observaciones sobre resultados de esa intervención y también observaciones sobre la eficacia de la intervención que había hasta ese momento. Entonces, la hipótesis que se quiere rechazar es que la nueva intervención es igual de eficaz que la anterior. Se compararán entonces ambas “eficacias” y se obtiene la diferencia entre estas. Ahora se procede a estimar la probabilidad de que esa diferencia ya observada (o una mayor) pueda ocurrir si la nueva intervención fuera igual a la anterior y ese precisamente es el valor de p.
Para las estimaciones se necesitan al menos modelos teóricos que se ajusten a la realidad y también la teoría de probabilidades o sea, distribuciones probabilísticas de variables aleatorias que se ajusten a cada situación o realidad. Los investigadores, junto a los estadísticos, parecen haberse conformado con aceptar un valor de p menor de 0,05 como pequeño aunque ese valor también es amplio objeto de discusión y controversia .
No es Tan Sencillo
Para las estimaciones se necesitan al menos modelos teóricos que se ajusten a la realidad y también la teoría de probabilidades o sea, distribuciones probabilísticas de variables aleatorias que se ajusten a cada situación o realidad. Se necesita decidir también a qué se le llama probabilidad “pequeña”. Los investigadores, junto a los estadísticos, parecen haberse conformado con aceptar un valor de p menor de 0,05 como pequeño aunque ese valor también es amplio objeto de discusión y controversia .
Por tanto, el valor de p debería ajustarse a las consecuencias de cometer un error en caso de que se rechazara la igualdad de eficacias. De modo que, aceptar siempre un riesgo de 5% no es compatible con el sentido práctico común. Se necesita formalizar y clasificar la forma en que se estima lo que hemos llamado “diferencia de eficacias”. No todas las eficacias pueden medirse de igual manera, depende de cómo consideremos la medición del efecto de la intervención.
Se necesita lograr que las diferencias que se encuentren entre intervenciones sean debidas a las intervenciones mismas y no a la multiplicidad de factores que pueden incidir en la eficacia de una intervención. Esto concierne al diseño de la investigación y al reconocimiento de los sesgos que deben evitarse en las comparaciones. Se necesitan observaciones que representen a toda la realidad puesto que estamos en el campo de la investigación científica, no se necesita conocer si una intervención nueva es más eficaz que la anterior en un centro durante un mes (por ejemplo) sino en general.
De modo que, si bien el razonamiento que subyace detrás del valor de p y el interés que despierta en la investigación puede considerarse relativamente sencillo, su estimación y su implementación en la práctica contienen vericuetos realmente complejos y de difícil solución.
Vale añadir que ese valor de 0,05, mencionado antes, es el que respalda la conocida “significación estadística”. Si el valor de p encontrado en una comparación de eficacias como la que se ha tomado de ejemplo, es menor de 0,05 se dice que la diferencia entre ambas eficacias es significativa o más precisamente, estadísticamente significativa.
Los Problemas del Valor de P: Significación Estadística vs Significación Clínica
Valores de p pequeños pueden obtenerse en casos donde las diferencias encontradas son realmente pequeñas, o mejor dicho pequeñas para tener importancia práctica. La toma de decisiones en cualquier circunstancia está condicionada a una relación riesgo/beneficio, costo/beneficio o riesgo+costo/beneficio.
El hecho es que, en buena ley, el valor de p depende del tamaño de la muestra de modo tal que solo con aumentar la muestra se puede obtener significación estadística para cualquier diferencia por muy pequeña que esta sea. Siempre existirá una diferencia y a medida que aumente la muestra, mayor será la probabilidad de encontrarla . Entonces, en realidad el objetivo no es -ni puede ser- encontrar la diferencia a toda costa sino detectar la diferencia cuando esta puede tener algún beneficio para la práctica o al menos para la teoría.
El Remedio
Encontrar un remedio (alternativo) para estas contradicciones detectadas cuarenta años después de utilizar el valor de p en las diversas pruebas de hipótesis que necesitaba la investigación y también la toma de decisiones, todavía es motivo de artículos y discusiones metodológicas.
Un remedio de enfoque radical consiste en cambiar todo el sistema de pruebas de hipótesis estadísticas para evaluar la eficacia de nuevas tecnologías o para probar hipótesis en cualquier esfera del conocimiento científico. Se trata de un nuevo paradigma que promueve sustituir las técnicas frecuentistas (como suelen llamar en general a todas estos métodos de pruebas de hipótesis que hemos mencionado) por las técnicas bayesianas .
Otro remedio, quizás el más aceptado hoy, promueve el uso de los llamados intervalos de confianza. Estos intervalos supuestamente son capaces de cuantificar nuestra confianza en los resultados de un estudio y, sobre todo, nos permiten acercarnos a la magnitud del llamado “tamaño del efecto” .
En realidad tenemos confianza en que no tendremos un accidente porque la probabilidad de tenerlo (dadas las condiciones) es muy baja. No obstante en estadística el término “confianza” sustituye al de probabilidad una vez que se ha obtenido la muestra y se tienen resultados, básicamente porque la probabilidad es un término ligado a lo desconocido.
Más concretamente en el ejemplo de la comparación de eficacias entre una nueva intervención y la ya existente, la idea es obtener intervalos de confianza para la diferencia entre ambas intervenciones. Una vez obtenido el intervalo se habla de confianza, es decir, en lugar de decir “este es el intervalo obtenido con un método que proporciona alta probabilidad de que la diferencia verdaderamente esté en este rango de valores” se dice “este es el intervalo de confianza”.
¿Cómo se Formula una Hipótesis?
Para analizar la etapa correspondiente a la formulación de una hipótesis, es necesario considerar como punto inicial al proceso de percepción del entorno, que en términos sencillos involucra la utilización de nuestros sentidos. Ya que la comprensión habitual de la evolución del hombre es resultado del hecho de que entendemos dicho proceso explorando la realidad física con nuestros cinco sentidos. Este camino de la evolución nos ha permitido comprender los principios básicos del Universo de manera concreta. Gracias a nuestros cinco sentidos, sabemos que cada acción es una causa que provoca un efecto, y que cada efecto posee una causa.
Entonces, la observación, permite abordar la realidad, esto es, la totalidad de hechos existentes y concretos que rodean los fenómenos que se estudian. Realidad, por lo tanto, significa "todo aquello en lo que se puede pensar".
Desde el punto de vista de la Epistemología, existen tres herramientas básicas para abordar a los hechos, o todo aquello que sucede en la naturaleza: observando, midiendo y experimentando. Por lo que, la observación metódica y sistemática de los hechos, permitirá a través del tiempo, generar información (o datos) acerca de su comportamiento.
La formulación de cualquier hipótesis debe respetar estándares establecidos por la epistemología; el cuadro 1 presenta los aspectos más sobresalientes.
Tomando algunos conceptos de la lógica matemática, se puede decir que la _forma sintáctica de una hipótesis es la de una proposición simple_. Por lo que la formulación de cualquier hipótesis es equivalente a tener un enunciado que tiene la presentación de una oración declarativa.
Se tienen dos grandes vías a partir de las cuales se descubren hipótesis y por lo tanto se formulan o redactan: 1. A partir de la razón (razonando) y 2.
Sin embargo, recordemos que en la construcción de una hipótesis ocupa un lugar especial la formulación de la idea nueva, que hace las veces de proposición.
Pruebas de Hipótesis
Los datos obtenidos en el transcurso de una investigación médica frecuentemente son usados para comparar el efecto de diferentes maniobras o situaciones: tratados versus no tratados, casos versus controles o normales versus enfermos. Aunque existen numerosas alternativas para hacer esas comparaciones y a pesar de la enorme variedad en el tipo de problemas médicos que pueden plantearse o de las soluciones estadísticas que se aplique, existen básicamente dos aproximaciones: pruebas de hipótesis y estimación.
Una hipótesis es una proposición que puede o no ser verdadera pero que se adopta provisionalmente hasta recabar información que sugiera lo contrario. Si hay inconsistencia, se rechaza la hipótesis.
Pasos para las pruebas de hipótesis
- Formular la hipótesis y su alternativa. Normalmente la hipótesis de trabajo es contrastada con una hipótesis estadística que supone que no existe tal efecto o tal diferencia.
- Elegir la prueba estadística apropiada de acuerdo al diseño experimental, el tipo de datos y el número de grupos que se comparan.
- Elegir el nivel de significación α de la prueba, el límite para rechazar H0. En general, se acepta α = 0,01 ó 0,05, cifras que implican un 1%, o un 5% respectivamente, de posibilidades de equivocarse cuando se rechaza H0, de decir que hay una diferencia cuando en realidad no la hay.
- Calcular el valor de P. Si p es menor que α, rechazar H0 y aceptar la alternativa; en caso contrario, se acepta la hipótesis nula.
Es necesario tener claro que se rechaza la hipótesis nula porque es poco probable que sea verdadera con los datos obtenidos. En ningún caso se está probando la hipótesis alternativa de que sí hay efecto.
Estas pruebas también se denominan de significancia pues los valores de P por sobre o debajo del límite se denominan como significativos, altamente significativos o no significativos. Desgraciadamente, su connotación estadística ha sido trasladada a la clínica, creando mucha confusión entre lo que es estadísticamente significativo y lo que es clínicamente significativo.
Otro problema, derivado de la dependencia de P para declarar un estudio significativo o no significativo, es lo que se denomina sesgo de publicación, por el que con mayor frecuencia son publicados o enviados a publicación los trabajos con una P significativa comparados con los negativos.
Errores Tipo I y Tipo II
Frente a dos posibilidades reales, no hay diferencias (H0) o bien sí las hay (H1), las pruebas de hipótesis pueden dar dos resultados: rechazar o aceptar H0. En estas circunstancias, las alternativas son cuatro:
- Se rechaza H0 cuando ésta es falsa, una diferencia verdadera es declarada estadísticamente significativa.
- Se acepta H0 cuando ésta es verdadera, no hay una diferencia estadísticamente significativa y en realidad no la hay.
- Se rechaza H0 cuando ésta es verdadera, concluyendo que hay una diferencia que en realidad no existe, un falso positivo. Se ha cometido un error que se denomina de tipo I (α).
- Se acepta H0 cuando en realidad es falsa, un falso negativo, concluyendo que no hay diferencia cuando en realidad existe. Este es el error tipo II (β), que la mayoría de las veces se debe a un tamaño insuficiente de la muestra.
Estos dos errores deben ser considerados al evaluar el resultado de un trabajo de investigación que haya empleado pruebas de hipótesis, considerando la posibilidad de un error I cuando los resultados son significativos y de un error tipo II cuando son no significativos.
La potencia de un test es igual a 1- β y describe la probabilidad de detectar una diferencia verdadera de una magnitud determinada. Mientras mayor es la potencia de un test menor es la probabilidad de tener un falso negativo.
Como existe una relación inversa entre α y β, se puede aumentar la potencia elevando el nivel de significación.
Cuadro 1: Estándares para la Formulación de Hipótesis
| Aspecto | Descripción |
|---|---|
| Términos Generales | Deben ser operacionalizables. |
| Forma Sintáctica | Debe ser una proposición simple. |
| Tautologías | Deben ser excluidas. |
| Conocimiento Científico | Debe basarse en conocimiento comprobado. |
| Falibilidad | Debe ser falible. |
TAG: #Trabajo

