Regresión en Ciencias sociales: qué-cuándo-cómo

¿Qué es la regresión?

La regresión es una clase de modelos estadísticos; es la base del análisis de datos y la inferencia en las ciencias sociales. La regresión describe relaciones sistemáticas entre una o más variables predictoras con un resultado. La flexibilidad y sus numerosas extensiones la convierten en la principal herramienta estadística que los científicos sociales utilizan para modelar sus hipótesis sustantivas con datos empíricos.

¿Cuándo surgió este modelo estadístico?

La aplicación original de la regresión fue el estudio de Francis Galton sobre las alturas de padres e hijos a fines del siglo XIX. Galton notó que los padres altos tienden a tener hijos un poco más cortos, y viceversa. Describió la relación entre las alturas de padres e hijos utilizando un tipo de línea de regresión y denominó el fenómeno regresión a la mediocridad.

El término regresión describió un hallazgo específico: la relación entre las alturas de los padres y los hijos. Muchos métodos estadísticos contemporáneos se derivan del modelo de regresión lineal.

Históricamente, la regresión ha utilizado la estimación de mínimos cuadrados; es decir, se encuentran valores de coeficientes que minimizan los errores al cuadrado y la inferencia frecuentista: la variabilidad de los coeficientes de regresión de la muestra se examina dentro de las distribuciones de muestreo teóricas y se resume por valores de p o intervalos de confianza. Si bien las estimaciones de regresión de mínimos cuadrados y los valores de p basados ​​en inferencia frecuentista son las configuraciones predeterminadas más comunes dentro de los paquetes estadísticos, no son los únicos métodos de estimación e inferencia disponibles, ni son aspectos inherentes de la regresión.

¿Cómo se amplia el modelo de regresión lineal básica?

Si la regresión solo resumiera las asociaciones entre dos variables continuas, sería una herramienta muy limitada para los científicos sociales. Sin embargo, la regresión se ha extendido de muchas maneras.

  1. Una expansión inicial e importante del modelo permitió múltiples predictores y múltiples tipos de predictores, incluyendo continuo, binario y categórico. Con la inclusión de predictores categóricos, los estadísticos señalaron que los análisis de modelos de varianza con un solo término de error y modelos similares son casos especiales de regresión, y los dos métodos: la regresión y el análisis de varianza, se vean como facetas diferentes de un modelo lineal general.
  2. Una segunda expansión permitió diferentes tipos de variables de resultado como las variables binarias, ordinales, nominales y de conteo. El modelo de regresión lineal básica utiliza la distribución normal como su modelo de probabilidad. El modelo lineal generalizado, que incluye resultados no normales, aumenta la flexibilidad de la regresión al permitir diferentes modelos de probabilidad (por ejemplo, distribución binomial para resultados binarios). Los predictores están conectados al resultado a través de una función de enlace (por ejemplo: transformación para resultados binarios y logaritmo natural para resultados de conteo).

Se han hecho muchas otras extensiones al modelo de regresión básica que permite una mayor complejidad, incluidos los resultados multivariados:

  • Modelos de ruta que permiten múltiples predictores y los resultados con asociaciones complejas.
  • Modelos de ecuaciones estructurales que anidan modelos de medición para construcciones latentes dentro de modelos de ruta.
  • Modelos multinivel que permiten datos correlacionados debido a diseños anidados (por ejemplo, estudiantes dentro de las aulas).
  • Modelos de regresión no lineal que usan regresión para ajustar modelos matemáticos complejos, en los que los coeficientes no están relacionados de manera aditiva con el resultado.

Aunque cada uno de los métodos anteriores tiene cualidades únicas, todos se derivan del modelo de regresión lineal básico.

¿Cuál es la importancia de la regresión como herramienta en la investigación en ciencias sociales?

La investigación es un maridaje entre: (1) las preguntas de investigación, (2) la teoría y (3) el diseño del estudio, que dicta los métodos estadísticos. Los métodos estadísticos asignan las preguntas de investigación a los datos empíricos, y los resultados estadísticos dan respuestas a esas preguntas en un estudio bien diseñado. En el contexto de la investigación científica, la regresión es principalmente una herramienta aplicada para probar la teoría con datos empíricos. Esta simbiosis entre los modelos teóricos y los modelos estadísticos ha sido la fuerza impulsora detrás de muchos de los avances y extensiones de la regresión.

Aunque la regresión se puede aplicar a datos observacionales o experimentales, ha jugado un papel especialmente importante en los datos observacionales. Con los datos de observación no hay aleatorización ni intervención, y puede haber una variedad de posibles causas y explicaciones para el fenómeno en estudio. Los métodos de regresión permiten a los investigadores controlar estadísticamente las variables adicionales que pueden influir en el resultado.

Por ejemplo, en un estudio observacional de la infidelidad que se centra en la edad como predictor, podría ser importante controlar la satisfacción de la relación, ya que investigaciones anteriores han sugerido que está relacionada tanto con la probabilidad de infidelidad como con la edad.

La regresión también puede desempeñar un papel práctico en la transmisión de resultados de investigación. Los coeficientes de regresión, así como los resúmenes de regresión (por ejemplo, el porcentaje de la variabilidad del resultado explicado por los predictores) transmiten cuantitativamente la importancia de un modelo de regresión y, en consecuencia, el modelo teórico subyacente.

Los modelos de regresión son ecuaciones de predicción (es decir, los coeficientes de regresión son factores de escala para predecir el resultado basándose en los predictores). Pueden proporcionar estimaciones del resultado basadas en predictores, lo que permite al investigador considerar cómo varía el resultado entre las combinaciones de valores predictores específicos.

¿Qué limitaciones tienen los modelos de regresión?

Aunque la regresión es una herramienta extremadamente flexible para la investigación de las ciencias sociales, no está exenta de limitaciones. No todas las preguntas de investigación están bien descritas por los modelos de regresión, particularmente las preguntas que no especifican variables de resultado. Como ejemplo, el análisis de conglomerados es una herramienta estadística que se utiliza para revelar si existen grupos o conglomerados coherentes dentro de los datos. Debido a que no hay un resultado o variable objetivo, la regresión no es apropiada. Al mismo tiempo, debido a que la regresión se enfoca en una variable de resultado, los usuarios de regresión pueden creer que ajustar un modelo de regresión connota causalidad; es decir, los predictores causan el resultado. Esto es claramente falso, y los resultados en algunos análisis pueden ser predictores en otros. Probar la causalidad requiere mucho más que el uso de la regresión.

Otra crítica de la regresión se centra en su uso para la inferencia estadística. Para proporcionar una inferencia válida (por ejemplo, valores de p-val o intervalos de confianza), los datos deben ser una muestra aleatoria de una población, o implicar la asignación al azar a una condición de tratamiento en estudios experimentales. La mayoría de las muestras en las ciencias sociales son ejemplos de conveniencia (por ejemplo, estudiantes universitarios que toman psicología introductoria). Por supuesto, esto no es una crítica de la regresión per se, sino del diseño del estudio y las limitaciones de la inferencia estadística con el muestreo no aleatorio. A pesar de las limitaciones, la regresión y sus extensiones continúan siendo una herramienta increíblemente útil para los científicos sociales.


Comentarios

mood_bad
  • No hay comentarios todavía.
  • Agrega un comentario