miércoles, 16 de abril de 2014

El SPSS (Statistical Product and Service Solutions)



Desde su introducción en 1968, SPSS ha sido un popular paquete de software estadístico para los investigadores universitarios, agencias gubernamentales, y empresas consultoras. Este software potente y de fácil uso es compatible con los sistemas operativos Windows, Macintosh y Linux. Una vez cargados los datos, SPSS puede llevar a cabo una amplia gama de análisis estadísticos con una serie de menús desplegables. Sin embargo, tiene un beneficio adicional de permitir a los usuarios guardar los procedimientos de uso frecuente como los programas que pueden ser modificados y utilizados de forma repetida.



Identificación
Un programa SPSS es un conjunto de instrucciones de sintaxis, o "lenguaje SPSS", para la ejecución de un determinado procedimiento, transformación de datos o una fórmula estadística.
Función
Al igual que muchos paquetes de software, el SPSS es guiado por menues. Esto significa que los usuarios pueden ejecutar análisis estadísticos, simples o complejos, haciendo clic en una serie de menues desplegables y seleccionando los comandos deseados preprogramados. Sin embargo, muchos investigadores y analistas pueden utilizar ciertos procedimientos estadísticos que no son preprogramados en el programa SPSS. Como resultado, permite a los usuarios crear programas personalizados, o para unir múltiples operaciones  preprogramados para ser aplicados en secuencia.

Beneficios
Un programa SPSS permite a un usuario llevar a cabo el mismo procedimiento en repetidas ocasiones, sin tener que recordar los menues desplegables o los comandos que debe hacer clic y elegir con el fin de establecer la serie de los procedimientos necesarios. Esto ahorra tiempo al organizar y analizar los datos. Estos programas también pueden ser modificados para funcionar con diferentes modelos estadísticos, analizar diferentes variables o acceder a archivos de datos diferentes. Para ejecutar un programa, simplemente haz clic en la sintaxis y arrastra para resaltarlo. Después de esto, haz clic en el comando "execute" (ejecutar), una clave en forma de flecha en el menú de archivo de sintaxis.
Conceptos erróneos
Aunque el programa SPSS parece complejo, no tienes que ser un programador maestro o dominante de la sintaxis de SPSS para utilizar un programa. No es necesario escribir la sintaxis aunque un experto en dicha sintaxis podría escribir un programa. Para guardar un procedimiento como el programa SPSS para su uso futuro, todo lo que tienes que hacer después de seleccionar los comandos apropiados es hacer clic en el comando "Paste" (Pegar) en el programa SPSS en lugar del comando "OK" (Aceptar). El comando "Paste" (Pegar) salva a la sintaxis en un archivo separado, que se puede guardar y modificar para su uso futuro.

Tipos
Los usuarios pueden crear una amplia variedad de programas SPSS para satisfacer sus necesidades de gestión de datos y análisis de necesidades. Se pueden guardar programas de la sintaxis de SPSS para la exportación de datos de otra fuente, como una hoja de cálculo Excel. Otros programas que se pueden guardar como sintaxis incluyen procedimientos para las variables de la recodificación, fusión de archivos de datos o el cálculo de valores. Por último, los usuarios pueden guardar los programas SPSS para los procedimientos estadísticos de los cuales es capaz SPSS. Estos son desde simples estadísticas descriptivas hasta regresiones multivariantes.

Cómo importar un origen de datos de Excel a SPSS

El programa de estadísticas IBM SPSS ofrece dos métodos para importar datos de archivos de Excel: como una base de datos ODCB, o como una fuente de datos. La importación de un archivo de Excel como fuente de datos es la opción más sencilla, que es útil para los usuarios novatos. Para las importaciones de base de datos, tendrás que estar más familiarizado con el programa SPSS.

Instrucciones

  1. Abre SPSS.  Aparece una ventana que pregunta "¿Qué te gustaría hacer?", Elige la segunda opción, "Tipo de datos".
  2. Selecciona el menú Archivo, ve a "Abrir", luego haz clic en "Data".
  3. En el menú desplegable en la parte inferior de esta ventana, selecciona el tipo de archivo (por ejemplo, "Excel" en formato *. xls, *. xlsx, o *. xlsm") y navega hasta el archivo de Excel que deseas importar. Haz clic en "Abrir".
  4. El diálogo "Opening Excel Data Source" debe aparecer, lo que te permite seleccionar una hoja de cálculo de Excel para importar. Marca la casilla "Leer nombre de variables de la primera fila de datos" sólo si la hoja de cálculo de Excel que has seleccionado tiene nombres de variables en la primera fila. Cuando estés satisfecho con tu selección, haz clic en "Aceptar".

COMO PROBAR SI TU INFORMACION ESTÁ NORMALMENTE DISTRIBUIDA CON SPSS
Los investigadores, científicos y estudiantes son algunas de las personas que utilizan SPSS.
El programa de paquete estadístico para las Ciencias Sociales es una potente aplicación que le permite a los usuarios realizar encuestas, análisis complejos y pruebas estadísticas. Sin embargo, si deseas llevar a cabo las pruebas estadísticas, tienes que probar primero los datos para determinar si se distribuyen normalmente. Esto significa que los datos no están llenos de anomalías que pueden crear resultados inexactos. Afortunadamente, SPSS tiene opciones integradas a las que puedes tener acceso para determinar si los datos son normales.

Instrucciones
  1.  Abre el archivo SPSS que contenga los datos que deseas probar y haz clic en "Analizar" en la barra de menú.
  2. Selecciona "Servicios descriptivos" en el menú desplegable y, a continuación, selecciona "Explorar". La ventana emergente de exploración se abrirá.  
  3.  Haz clic en la variable que deseas probar en cuanto a su normalidad en el cuadro en el costado derecho de la ventana, luego arrástrala al cuadro de "Lista de dependencias" en el lado derecho
  4. Haz clic en el botón "Estadísticas" en la esquina superior derecha de la ventana para abrir la ventana emergente de Estadística. No realices cambios a las opciones que se muestran y haz clic en el botón "Continuar".
  5. Haz clic en el botón "Gráficos" en la ventana de Explorar. La ventana se abre. Selecciona "Ninguno" en la sección "Boxplots" y anula la selección de todas las opciones en la sección "Descriptivo".
  6. Selecciona la opción "Gráficas con pruebas de normalidad" y haz clic en "Continuar". Haz clic en "Aceptar" y la ventana de resultados se abrirá automáticamente. La ventana de resultados muestra los resultados.
  7. Revisa los resultados de la sección "Pruebas de Normalidad" para determinar si los datos se distribuyen normalmente. El cuadro muestra dos resultados: la prueba de Kolmogorov-Smirnov y la prueba de Shapiro-Wilk. La prueba de Kolmogorov-Smirnov se utiliza para probar los conjuntos de datos grandes, mientras que la prueba de Shapiro-Wilk es más apropiada para una muestra más pequeña, como 50 números o menos. Si la columna "Sig" de cualquiera de las pruebas es superior a 0,05, los datos se distribuyen normalmente.

 Desde el punto de vista puramente estadístico vamos a distinguir cuatro niveles de medida de las variables:

  • Nominal: Cada valor de la variable nominal se corresponde con una categoría de la variable, este emparejamiento es por lo general arbitrario, como ejemplos de variables nominales podemos considerar el sexo de una persona, lugar de nacimiento etc. En este nivel de medida las categorías no pueden ser ordenadas en ningún sentido, y por supuesto no tiene sentido calcular medias, medianas... etc. Los estadísticos habituales serán frecuencias y porcentajes.

  • Ordinal: Cada valor representa la ordenación o el ranking, por ejemplo el lugar de llegada a meta de los corredores, 1 significaría el primero, 2 significaría el segundo... etc. Es muy común encontrarse este tipo de variables en la evaluación del gusto de los consumidores, se les suministra una serie de productos y ellos van indicando el más preferido... etc. Sabremos cual es el más preferido, el segundo más preferido... etc., pero no sabremos cuanto es de preferido, en el ejemplo de la carrera sabremos cual ha sido el primero, el segundo, pero no vamos a saber cual es la distancia entre el primero y el segundo. Los estadísticos a solicitar serán: frecuencias, porcentajes, moda y la mediana.

  • Intervalo: En variables de intervalo un incremento de una unidad en el valor numérico representa el mismo cambio en la magnitud medida, con independencia de donde ocurra en la escala. En este nivel de medida los estadísticos habituales son la media, la desviación típica y la mediana. La mayoría de los análisis asumen que las variables tienen por lo menos este nivel de medida. Un ejemplo de variable con nivel de intervalo podría ser el salario, la temperatura…etc. Los estadísticos a emplear serán: la media, media recortada y la mediana.
  • Razón: Las variables de Razón tienen las mismas propiedades que las de intervalo, pero además tienen un punto cero significativo, dicho punto representa una ausencia completa de la característica medida, por ejemplo la edad o las ganancias anuales de una persona. Por esta Razón las variables de Razón tienen propiedades más fuertes que las de intervalo.
Desde el punto de vista representación de datos en la aplicación SPSS, vamos a distinguir únicamente dos tipos de variables que son: 
  • Variables numéricas: se representan como números, independientemente de su nivel de medida.
  • Variables alfanuméricas: están compuestas por combinaciones de números y letras. No suelen ser usadas excepto para labores de identificación de casos, como por ejemplo el nombre del encuestado.
La opción más usual es definir todas las variables como numéricas y posteriormente desde la aplicación indicar cual es su nivel de medida. Es decir las introducimos como números y posteriormente indicamos cuales van a tener sentido no numérico.

El sistema SPSS permite definir una serie de características a las variables. Las más importantes son las siguientes:
- Etiquetas de las variables.
- Etiquetas a los valores de las variables.
- Valores missing.

  • Etiquetas de las variables: es una cadena de caracteres asociada al nombre de la variables, con el fin de generar resultados más comprensivos, por ejemplo la variable ingresos podría llevar asociada la etiqueta “Ingresos netos en euros €”.

  • Etiquetas de los valores de las variables: cuando estamos ante una variable categórica o nominal es usual el asignar una etiqueta a cada categoría, por ejemplo en la variable sexo, si el valor 1 representa a los hombres y el valor 2 representa a las mujeres, podemos hacer que el sistema muestre “Hombre” y “Mujer” en vez de los valores 1 y 2, con el fin de producir resultados más comprensivos.
 

No hay comentarios:

Publicar un comentario