Aplicaciones estadísticas en las Ciencias Sociales

La Estadística Matemática

Resumen unidad uno

Juan Camacho Rosales*

Aunque no es necesario que el investigador en Ciencias Sociales sea un especialista en áreas matemáticas concretas, es importante que sepa acercarse con mentalidad matemática a los problemas que se le plantean para entender su estructura formal en el modelo matemático y las condiciones que lo hacen posible, simplificando la realidad concreta, lo suficiente para que dicho modelo, creado a partir de la realidad, sea manejable desde el punto de vista instrumental matemático.
Las principales aplicaciones estadísticas, en cualquier campo, descansan sobre el hecho de hacer observaciones o experimentos bajo las mismas condiciones. En algunas áreas de la investigación, los objetos o fenómenos observados bajo las mismas condiciones variarán en pequeña medida (en las ciencias físicas, las observaciones controladas dan prácticamente los mismos resultados). En las Ciencias Sociales, aunque el experimentador haga un esfuerzo sobrehumano para observar repetidamente bajo las mismas condiciones, encontrará diferencias entre las observaciones y las diferencias, ordinariamente no despreciables.
La Estadística Matemática es una teoría acerca de la incertidumbre, tendencia de los resultados a variar cuando observaciones repetidas se hacen bajo condiciones idénticas. La Estadística es el estudio de fenómenos donde, bajo un mismo conjunto de condiciones, las medidas obtenidas presentan variabilidad, y por tanto, resultados impredecibles a priori; es decir, existe incertidumbre asociada al conocimiento del objeto de estudio. Aceptado que la Estadística trata sobre la incertidumbre, cabe preguntarse si la naturaleza está indeterminada o, la incertidumbre es inherente a la misma. Definamos la Estadística como aquella manera de pensar de la cual se deriva una forma de representar los sistemas y razonar sobre ellos en una naturaleza indeterminada. La Estadística puede considerarse una Ciencia que guía la extracción de conocimiento, e implica una manera de conceptuar cualquier problema donde la incertidumbre es inherente a la comprensión del objeto de estudio y, por lo tanto, nuestro discernimiento sólo puede ser probabilístico y expresado mediante leyes estadísticas. Aunque la organización de la información, transformaciones y depuración de los datos no sean características esenciales de la Estadística, no implica que no puedan ser incluidas en una definición de la disciplina. El objetivo de la Estadística como Ciencia es mejorar el nivel de vida de la sociedad. Estadística deriva de Estado, y etimológicamente significa recoger información para tomar decisiones de cómo repartir comida o trabajo. Actualmente se ocupa de la recolección, análisis e interpretación de información, tanto cuantitativa como cualitativa. Los métodos estadísticos son particularmente útiles cuando hay variabilidad en la medición.

Utilidad de la Estadística en las Ciencias Sociales 

En el campo de las Ciencias Sociales se ocupa de las siguientes cuestiones:
  • • ¿Qué datos se necesita recoger?
  • • ¿Cómo se pueden usar los recursos disponibles eficientemente para recolectar los datos?
  • • ¿Cómo especificar un modelo matemático que describa el proceso que ha generado los datos?
  • • Depuración y transformación de los datos
  • • ¿Cómo presentar los datos de manera que transmitan sus rasgos más esenciales de una manera clara?
  • • ¿Qué conclusiones se pueden extraer de los datos y cuál es el grado de incertidumbre de estas conclusiones?
  • • ¿Qué acciones se deben tomar en base a las conclusiones extraídas de los datos?
La Estadística es, probablemente, una de las disciplinas científicas más utilizada y estudiada en todos los campos del conocimiento humano. Por ejemplo:
  • • Administración de Empresas, se utiliza para evaluar la aceptación de un producto antes de comercializarlo.
  • • Economía, medir la evolución de los precios mediante números índice o estudiar los hábitos de consumo mediante encuestas
  • • Ciencias Políticas, conocer las preferencias de los electores antes de la votación mediante sondeos y así orientar las estrategias de los candidatos
  • • Sociología, estudiar las opiniones de los colectivos sociales sobre temas de actualidad.
  • • Psicología, elaborar las escalas de los tests y cuantificar aspectos del comportamiento humano.
  • • Ciencias Sociales, medir la relación entre variables y hacer predicciones sobre ellas.
En Ciencias Sociales la Estadística se estudia en tres secciones:
Estadística Descriptiva, sirve de herramienta para describir, resumir o reducir las propiedades de un conglomerado de datos al objeto de que se pueda manejar.
Estadística Inferencial, estima las propiedades de una población a partir del conocimiento de las propiedades de una muestra de ella.
Diseño Experimental, se desarrolla para determinar y confirmar relaciones causales entre variables.

En la investigación la Estadística es importante porque:  
  • • Permite el tipo más exacto de descripción
  • • Fuerza a ser exactos y definidos en nuestros procedimientos y pensamientos
  • • Permite resumir resultados de una forma conveniente
  • • Permite extraer conclusiones generales
  • • Permite predecir.
  • • Permite analizar algunos de los factores causales que subyacen a eventos complejos.

Investigación:
¿Por qué las ecuaciones estructurales permiten la modelación de la causalidad?
¿Por qué en la regresión logística, los modelos log-linear y el análisis de correspondencias se utilizan para el análisis de datos cualitativos?
¿Por qué las series temporales investigan el aspecto longitudinal?
¿Cuál es el modelo de la regresión múltiple?

Estadística Descriptiva

La estadística puede estudiar tanto las características de las muestras, como hacer inferencias acerca de las características de las poblaciones. Población es el conjunto de valores que tienen una propiedad común y muestra es un subconjunto (aleatorio o no) de la población. Si se estudia la variable:
“Edad de los estudiantes que estudian Administración de empresas en México, población es el conjunto de edades de todos esos estudiantes, y muestra es el conjunto de las edades de los que estudian en la UnADM.”
Las características de las poblaciones se estudian mediante indicadores de uno o más aspectos particulares. A estos indicadores se les llama parámetros cuando se refieren a la población, y estadísticos cuando se refieren a una muestra.
Las variables se dividen en
Cualitativas (o nominales)
Variables de cuyos valores sólo se puede decir que son distintos.
Ejemplo: la afiliación política
Cuantitativas
Sus valores, además de ser distintos, se pueden ordenar (de mayor a menor).
Se dividen en tres tipos:
Ordinales, los valores son distintos y se pueden ordenar.
De intervalo, además de esos dos rasgos (distintos, ordenados) existe una unidad común.
De razón además de esos tres rasgos existe un cero real.
En la estadística descriptiva el interés del estudio puede estar en una variable o más variables. En cuanto al estudio de una sola variable las características que se pueden estudiar de cada variable son:
  • 1. Distribuciones de frecuencias a través de histogramas, gráficas de barras o polígonos de frecuencias.
  • 2. La tendencia central, es decir, el valor más representativo de la muestra, se indica mediante la media, la mediana o la moda dependiendo del tipo de variable estudiada.
  • 3. La dispersión de los datos, si están o no muy agrupados los números, se estudia mediante la desviación típica, la varianza, la amplitud semiintercuartílica o el rango dependiendo del tipo de variable.
  • 4. La forma de las distribuciones, a través de los coeficientes de asimetría y apuntamiento.
La forma de la distribución toma como patrón la distribución normal o campana de Gauss. En la distribución normal, la mayoría de las puntuaciones se agrupan en torno a la media y cuánto más lejos se encuentra la puntuación de la media, más rara es. Además, existen igual número de puntuaciones a ambos lados de la media. La asimetría y el apuntamiento valen cero para una distribución normal.
Los estadísticos anteriores son aplicados a muestras, pero cuando el interés está en el individuo, cada sujeto se puede estudiar con respecto a la muestra que pertenece. Se puede estudiar su puntuación directa, puntuación diferencial (diferencia con respecto a la media), y la puntuación típica (distancia en desviaciones típicas a la media) que permite comparar verazmente las puntuaciones en distintas variables con medias y desviaciones típicas diferentes.
Otro índice de la posición del sujeto en su grupo es el percentil, que indica el porcentaje de casos que tienen puntuaciones inferiores a la suya.
En el estudio de dos variables interesa usualmente hallar la relación que hay entre dichas variables. Se utiliza el coeficiente de correlación de Pearson cuando las variables son cuantitativas. Este coeficiente varía entre uno y menos uno; cuando vale cero indica que no hay relación entre las variables, y cuando vale uno o menos uno que la relación es perfecta.
El estudio de la relación se puede complementar con su representación gráfica mediante la nube de puntos o gráfico de dispersión. El estudio de la relación entre variables cualitativas se realiza mediante tablas de contingencia y estadísticos basados en el estadístico chi cuadrado. Hay otra serie de estadísticos cuando se intenta estudiar la relación entre variables cuantitativas y cualitativas. Cuando se estudia la relación entre varias variables la técnica por excelencia es la regresión múltiple. Da un índice que varía entre cero y uno, de la relación entre una variable y un conjunto de variables. Otros índices estadísticos son: la correlación parcial, que estudia la relación entre dos variables cuantitativas eliminando el influjo sobre ellas de otras variables, y el coeficiente de correlación canónica, que analiza la relación entre dos conjuntos de variables, cada uno de ellos con dos o más variables.

Estadística Inferencial

Cuando se quieren hacer inferencias, es decir, suposiciones acerca de lo que ocurre en la población de la que se han tomado las muestras que se están estudiando, se utilizan los contrastes de hipótesis que permiten contestar a preguntas como: ¿Pertenece una cierta muestra a una determinada población? ¿Pertenecen a la misma población dos muestras? Para contestar a las anteriores preguntas se adopta un nivel de significación (el máximo nivel de error que se asume en la decisión), y se compara con la probabilidad del estadístico de contraste. Entonces, si es menor la probabilidad del estadístico de contraste que el nivel de significación, se habla de que existen diferencias, o de que se han producido resultados significativos. Este proceso se formaliza de la siguiente manera:
  • 1. Fijar el nivel de significación o error alfa.
  • 2. Establecer una hipótesis nula y una hipótesis alternativa.
  • 3. Recoger los datos adecuados.
  • 4. Hallar el estadístico de contraste.
  • 5. Comparar la probabilidad del estadístico de contraste con el nivel de significación.
El estadístico de contraste es una fórmula que da como resultado un valor. Este valor sigue una distribución. Las distribuciones que siguen estos estadísticos son, en la mayoría de los casos:
La distribución normal.
Distribución t de Student
Distribución chi cuadrado
Distribución F.
Hay diferentes tipos de contrastes dependiendo del objetivo de estudio: diferencia entre medias, diferencia entre desviaciones típicas, diferencia entre proporciones, diferencia entre correlaciones, y así sucesivamente.
Para dejar más claros estos conceptos los invito a visualizar las diferencias entre estadística descriptiva e inferencial. 

Diseño Experimental

Los principales tipos de problemas con que se enfrenta la Estadística en el campo de las Ciencias Sociales son los de: diferencia entre grupos, relación entre variables, estructura de los datos y separación entre grupos. En el estudio de la diferencia entre grupos lo que usualmente se trata de analizar es la diferencia entre medias. Para ello se utiliza la prueba t de diferencia entre medias o el análisis de varianza. En ambas técnicas lo que se investiga en realidad es si la diferencia entre las medias de los grupos (la llamada variabilidad intergrupos) es significativamente mayor que la diferencia dentro de los grupos (la denominada variabilidad intragrupos). El análisis de varianza ocupa una gran parte del contenido de la Estadística Inferencial en las Ciencias Sociales ya que el número y características de las variables experimentales pueden ser muy variados. Además es la base del diseño experimental, diseño que trata de establecer relaciones de causa a efecto entre variables. En el estudio de las relaciones entre variables hay dos objetivos principales, uno de índole teórica y otro de naturaleza práctica. El primero halla índices analíticos que miden la relación entre variables mediante las técnicas ya mencionadas:
Correlación de Pearson
Correlación canónica.
Regresión múltiple.- Se halla la relación entre una variable (la variable predicha o dependiente) y una o más variables (las variables predictoras o variables independientes). La regresión múltiple ofrece no sólo un índice numérico global de la relación, sino un estudio pormenorizado de la importancia de cada una de las variables predictoras.
La cuestión práctica en el estudio de la relación entre variables consiste en poder realizar predicciones del valor de la variable predicha. Es decir, una vez establecido que existe una relación significativa y substantiva entre la variable predicha y las variables predictoras, basta con aplicar una fórmula con los valores de las variables predictoras para obtener un valor en la variable predicha sin necesidad de medirla de antemano. El problema de la estructura de los datos se estudia básicamente con una técnica estadística multivariada: el análisis de componentes principales. Esta técnica permite reducir un conjunto de variables relacionadas a un número de componentes (variables también) independientes entre sí. Con ello se consigue agrupar las variables originales en subconjuntos de variables relacionadas entre sí y no relacionadas con las variables de los otros subconjuntos.
Ejemplo: en Psicología este técnica ha servido para constatar la existencia de distintos tipos de inteligencia: espacial, verbal, manual, etcétera.
En el problema de la separación entre grupos se aplican dos tipos de técnicas. Con la primera se trata de establecer la existencia de grupos que no son evidentes a priori; para ello se utiliza el análisis de conglomerados. Con esta técnica no sólo es posible descubrir estos grupos, sino fijar de antemano el número de ellos. Con la segunda técnica, el análisis discriminante, se estudia la estructura de la diferencia entre los grupos; puede ocurrir que la diferencia entre los grupos se explique por subconjuntos de distintas variables. Y tal como ocurre en la regresión múltiple, también se puede utilizar para predecir la pertenencia a grupos.

Bibliografía empleada por el autor

J. Amón: Estadística para Psicólogos: 1 Estadística Descriptiva. Pirámide, Madrid, 1980. J. Arnau: Técnicas de Análisis Avanzadas y Diseño de Investigación: Tendencias Actuales y Líneas Futuras de Desarrollo. En J. Arnau (editor): Métodos y Técnicas Avanzadas de Análisis de Datos en Ciencias del Comportamiento. EUB, Barcelona, 1996. G. Glass, J. Stanley: Métodos Estadísticos aplicados a las Ciencias Sociales. Prentice Hall, Madrid, 1980. W. Hays: Statistics for the Social Sciences. Holt, Rinehart & Winston, London, 1973. D. Peña, J. Romo: Introducción a la Estadística para las Ciencias Sociales. McGraw-Hill, Madrid, 1997. A. Solanas et al.: La Enseñanza de la Estadística en las Ciencias del Comportamiento a Inicios del Siglo XXI. Metodología de las Ciencias del Comportamiento 4, no. 2 (2002), 157- 183.

*Profesor Titular de Metodología de las Ciencias del Comportamiento Departamento de Didáctica e Investigación Educativa y del Comportamiento Universidad de La Laguna.

0 comentarios:

Publicar un comentario

Con la tecnología de Blogger.

Copyright © / Libreta de salón

Template by : Urang-kurai / powered by :blogger