¿Cómo se determina el valor P en el análisis de la vía IPA?

Extracellular vesicles

En IPA (Análisis de Ruta de Ingenuity), los valores de P se calculan utilizando análisis estadísticos. El valor de P es un indicador que evalúa si los datos observados son estadísticamente significativos en comparación con lo que se obtendría en una situación aleatoria.

Flujo general

En el análisis de vías de IPA, los valores de P se calculan mediante los siguientes pasos:

  1. Preprocesamiento de los datos de entrada: Se ingresan los datos sin procesar, como los datos de expresión génica o de expresión de proteínas, para el análisis de vías.
  2. Selección de la vía: Se elige la vía biológica de interés para el análisis. Esto puede incluir, por ejemplo, rutas de transducción de señales o rutas metabólicas relacionadas con una enfermedad específica.
  3. Asignación de puntuación a la vía: Se calcula una puntuación para los genes o proteínas incluidos en la vía seleccionada. Esto puede implicar el análisis de expresión diferencial de genes o el análisis de variaciones en la expresión de proteínas, entre otros métodos.
  4. Prueba de permutación: Se generan conjuntos de datos aleatorios basados en las puntuaciones de los genes o proteínas dentro de la vía. Estos conjuntos de datos aleatorios preservan las características de los datos de entrada, pero asignan puntuaciones de genes o proteínas de manera aleatoria.
  5. Cálculo del valor de P: Utilizando los conjuntos de datos aleatorios generados en la prueba de permutación, se crea una distribución aleatoria de las puntuaciones. Luego, se evalúa en qué posición se encuentra la puntuación observada en la distribución aleatoria y se calcula el valor de P. El valor de P muestra la probabilidad de que la puntuación observada se obtenga en una distribución aleatoria.

A menor valor de P, menor es la probabilidad de que la puntuación observada se obtenga en una situación aleatoria. Generalmente, se considera que los valores de P por debajo de 0.05 (generalmente por debajo de 0.01) son estadísticamente significativos. En estos casos, se considera que la puntuación observada tiene una probabilidad muy baja de obtenerse en una situación aleatoria, lo que sugiere una asociación biológica significativa.

¿Cómo se realiza la puntuación de las vías?

La puntuación de las vías implica cuantificar y evaluar la importancia y contribución de los genes en una vía.

Como ejemplo concreto, consideremos tres genes (A, B, C) asociados a una vía, y sus niveles de expresión son los siguientes:

Nivel de expresión del gen A: 10 Nivel de expresión del gen B: 5 Nivel de expresión del gen C: 8

En este caso, supongamos que asignamos una puntuación a los genes en función de sus niveles de expresión, utilizando una escala de 0 a 10. Dado que el gen A tiene el nivel de expresión más alto, le asignamos una puntuación de 10. El gen B tiene un nivel de expresión moderado, por lo que le asignamos una puntuación de 5. El gen C también tiene un nivel de expresión alto, por lo que le asignamos una puntuación de 8.

A continuación, normalizamos estas puntuaciones, por ejemplo, en un rango de 0 a 1. En este caso, el gen A tendría una puntuación de 1.0, el gen B tendría una puntuación de 0.5 y el gen C tendría una puntuación de 0.8.

De esta manera, podemos asignar puntuaciones a los genes dentro de la vía, lo que nos permite evaluar la importancia de los genes y su función dentro de la vía biológica.

¿Qué es la prueba de permutación?

La prueba de permutación implica reorganizar los datos de manera aleatoria para realizar análisis estadísticos. Esta reorganización aleatoria nos permite predecir los resultados que se obtendrían en una situación aleatoria.

Por ejemplo, cuando tenemos datos de expresión de los genes A y B de pacientes y queremos evaluar si están involucrados en la Vía X, podemos realizar la prueba de permutación siguiendo estos pasos:

  1. Preprocesamiento de datos: Se extraen los datos de expresión de los genes A y B de los datos de pacientes.
  2. Puntuación de los genes: Utilizando los datos de expresión de los genes A y B, se asigna una puntuación a cada gen. Los métodos de cálculo de puntuación pueden basarse en los niveles de expresión o en la importancia de los genes.
  3. Preparación para el test de permutación: Se preparan los datos de puntuación de los genes A y B para el test de permutación.
  4. Ejecución del test de permutación: Se reorganizan aleatoriamente los datos de puntuación de los genes A y B, y se realiza el test de permutación. Esto nos permite predecir los resultados que se obtendrían en una situación aleatoria para la asociación entre los genes A y B.
  5. Repetición del test de permutación: Se repite el test de permutación múltiples veces para generar conjuntos de datos aleatorios. Por lo general, se repite miles de veces.
  6. Evaluación de resultados: Se compara el conjunto de datos aleatorios generado por el test de permutación con los datos originales. Específicamente, se evalúa la posición de las puntuaciones de los genes A y B en el conjunto de datos aleatorios. Esto permite realizar una evaluación estadística de si los genes A y B están asociados con la Vía X.

El test de permutación permite evaluar estadísticamente si hay una asociación significativa entre las puntuaciones de los genes A y B y la Vía X. Esto nos permite verificar estadísticamente si genes específicos están involucrados en una vía particular.

¿Cómo se calculan los valores de P?

  1. Después de realizar el test de permutación, se evalúa la posición de los datos originales en el conjunto de datos aleatorios.
  2. Para la evaluación, se calcula una medida estadística sobre los datos originales (por ejemplo, la diferencia absoluta entre las puntuaciones de los genes A y B o el coeficiente de correlación).
  3. Se calcula el porcentaje de veces que se obtiene una medida estadística igual o mayor a la observada en el conjunto de datos aleatorios generado por el test de permutación.
  4. Ese porcentaje es el valor de P. El valor de P muestra la probabilidad de obtener la medida estadística observada en una situación aleatoria.

Por ejemplo, consideremos el cálculo de la diferencia absoluta entre las puntuaciones de los genes A y B.

  1. En el test de permutación, los datos de puntuación de los genes A y B se reorganizan aleatoriamente.
  2. Se calcula la diferencia absoluta entre las puntuaciones de los genes A y B en los datos originales.
  3. Se cuenta cuántas veces se obtiene una diferencia absoluta igual o mayor a la observada en el conjunto de datos aleatorios generado por el test de permutación.
  4. Se divide esa cuenta por el número de repeticiones del test de permutación para calcular el porcentaje.

El valor de P muestra la probabilidad de obtener la diferencia absoluta observada en una situación aleatoria. A menor valor de P, menor es la probabilidad de obtener la diferencia absoluta en una situación aleatoria. En los análisis estadísticos, si el valor de P es pequeño en comparación con un nivel de significancia predefinido (generalmente 0.05 o 0.01), se considera que el resultado es estadísticamente significativo.

Esto es un ejemplo de cómo se calculan los valores de P. Mediante este cálculo, podemos evaluar estadísticamente los resultados del test de permutación y determinar la probabilidad de obtener los datos originales en una situación aleatoria.

¿Entiendes la idea a través de este diagrama?

タイトルとURLをコピーしました