Eigentlich hatte ich im vergangenen Beitrag für diese Woche etwas zum Thema Geburten und "Youth Bulg" angekündigt. Allerdings habe ich aktuell mal wieder sehr viel Arbeit, was natürlich einerseits gut ist, andererseits aber dazu führt, dass mein Beitrag noch nicht fertig ist. Deshalb gibt es diesmal etwas aus dem Stehsatz, nämlich einen Hintergrund-Beitrag über den Import von Exceldaten in SPSS:
Oft liegen erhobene Daten - beispielsweise bei einer Umfrage-Auswertung - nicht direkt im SPSS-Datenformat .sav vor, sondern als Exceldatei. Sie müssen also für eine SPSS Auswertung zunächst importiert werden. Der Import von Exceldateien in SPSS ist grundsätzlich intuitiv und einfach durchzuführen. Einige Aspekte sollten jedoch zu beachtet werden, damit die importierten Daten im richtigen Format in SPSS angezeigt werden. Grundsätzlich ist nämlich die Qualität der Daten ausschlaggebend für den Erfolg jeder Statistik-Auswertung.
Exceldateien müssen nicht über eine Rekodierungssoftware (z.B. Stattransfer) in SPSS-Dateien konvertiert werden, sondern lassen sich direkt über SPSS einlesen. Vorher sollte die Exceldatei so formatiert werden, dass der Import reibungslos klappt.
Es bietet sich an, die gewünschten Variablennamen in die erste Zeile des Tabellenblatts zu schreiben. Diese werden beim späteren Import auf Wunsch direkt von SPSS übernommen. Das spart spätere Arbeit und erhöht die Übersichtlichkeit sowie Lesbarkeit des neuen Datensets. Ab Zeile 2 folgen die Einträge pro Beobachtung (siehe Abb. 1). Da viele Prozeduren in SPSS besser mit numerischen Werten als mit Worten (sog. „String-Variablen") funktionieren, sollte im Excelsheet darauf geachtet werden, dass Variablen nach Möglichkeit als Zahl angegeben sind. So ist empfiehlt es sich z.B. für das Geschlecht eines Fragebogenteilnehmers bspw. die Zahlen ‚1' für ‚männlich' und ‚2' für ‚weiblich' einzutragen, anstatt das Geschlecht als Text einzufügen. Später können diesen Zahlen in SPSS dann Beschriftungen (sog. „Labels") zugewiesen werden.
Gleiches gilt für Angaben zu Datum oder Uhrzeit: Damit für die statistische Auswertung in SPSS das Format direkt übernommen wird, sollte hier sauber mit numerischen Werten gearbeitet werden (siehe Abb. 1). Manche Fragen können nicht numerisch beantwortet werden (sog. ‚offene Fragen'), z.B. Kommentare oder ‚sonstige' Antworten. Diese Felder werden auch von SPSS eingelesen, allerdings als String-Variable.
Weitere Anmerkungen oder erste Berechnungen in Excel unterhalb der Daten sollten gelöscht bzw. auf andere Reiter kopiert werden, damit diese nicht in SPSS eingelesen werden und der Datensatz korrekt abgebildet werden kann.
Nach Aufbereitung des Exceldatensatzes kann dieser nun in SPSS importiert werden. In SPSS geht man dazu über ‚Datei', ‚Öffnen', ‚Daten' auf das Verzeichnis, unter dem die zu importierende Exceldatei abgespeichert wurde. Der Dateityp muss nun auf ‚Excel' geändert werden (siehe Abb. 2). Es werden dann alle Exceldateien des Typ .xls, .xlsx und .xlsm im Verzeichnis angezeigt.
Im nächsten Schritt wird angegeben, aus welchem Datenblatt der Exceldatei die Daten eingelesen werden sollen. Ebenso ist hier die Option „Variablennamen aus erstenzeile lesen" per Standard markiert. Sollte man nicht wie oben beschrieben die Variablennamen in die erste Zeile geschrieben haben, darf diese Option nicht gewählt werden. Mit dem Klick auf „OK" bestätigt man den Import, und fertig ist der SPSS-Datensatz, der - sollten die Exceldaten korrekt aufbereitet sein - auch direkt die richtigen Variablenformate erkennt (siehe Abb. 3).