Daten (Statistik) übernehmen

Fragen und Probleme, die nicht den obigen Kategorien zugeordnet werden können


MoonKid
Forum-Meister
Forum-Meister
Beiträge: 690
Registriert: Sa 30. Jun 2012, 11:56

Daten (Statistik) übernehmen

Beitrag von MoonKid »

Mein Thema ist erstmal abstrakt, da ich auch nicht genau weiß, welche Möglichkeiten mir die Technik hier bietet. Daher auch kein Minibeispiel - bitte nicht steinigen.

Ich bin leider darauf festgelegt worden, für meine Statistik SPSS zu verwenden. Bekanntermassen bietet SPSS keinen direkten Export (wie R) in *TeX.

Also mache ich mir nun Gedanken, wie ich möglichst effizient und fehlerarm die SPSS-Auswertungen in mein LaTeX-Dokument übernehmen kann, ohne es händisch abzutippen.

Spontan Ideen?

Es werden diverse Export-Formate, wie "Text", "RTF" und andere mir unbekannte angeboten. Eine genaue Liste kann ich Mangels lauffähiger SPSS-Linux-Instanz grad nicht nachgucken.

Was ich mir so vorstelle...
Ich definieren eine Tabelle (vorzugsweise tabu) und lege Platzhalter für die Daten fest. In einem Prä-TeX-Lauf wird diese Tabelle mit einer Datendatei (irgendeines der Export-Formate von SPSS ggf. modifiziert) verknüpft und die Zahlen werden dann automatisch in die Platzhalter gezogen.
Ändert sich die Datenlage muss ich nur die SPSS-Ausgabe erneut in die gewissen Datendatei exportieren und einen neuen TeX-Lauf starten.

Ist das zuviel geträumt? ;)
XeLaTeX, TeX Live, vim-latexsuite

Beinschuss
Forum-Meister
Forum-Meister
Beiträge: 808
Registriert: Di 2. Okt 2012, 21:42
Wohnort: NRW

Beitrag von Beinschuss »

Keine spontanen Ideen oder Erfahrungen, aber einen Link als möglichen Startpunkt: http://stackoverflow.com/questions/2191 ... an-a4-page

Helmut

Noch so einer

Beitrag von Noch so einer »

AFAIK kann man mit SPSS Excel-Tabellen exportieren, die man wiederum mit excel2latex in LaTeX-Tabellen umwandeln kann. Man kann mit SPSS aber auch TAB-separierte Daten exportieren. Diese lassen sich mit etwas perl oder awk in LaTeX-Syntax umwandeln (TAB durch & ersetzen, am Zeilenende \tabularnewline einfügen und ggf. ein paar weitere Änderungen). Eventuell kann man auch datatool dafür einsetzen. Ich habe datatool bisher aber nur für CSV verwendet. Ob es auch mit TAB separated values umgehen kann, weiß ich nicht. Eine automatische Wandlung in CSV als Zwischenschritt sollte aber nicht allzu schwierig sein.

Notfalls kann man mit SPSS auch einfach Tabellengrafiken erstellen lassen und diese Tabellen direkt als Bild einbilden (auch in einer table-Umgebung statt einer figure-Umgebung).

Benutzeravatar
Johannes_B
Moderator
Moderator
Beiträge: 5079
Registriert: Do 1. Nov 2012, 14:55
Kontaktdaten:

Beitrag von Johannes_B »

Textexport und dann das darstellen der Werte (egal ob als Tabelle oder plot) mit pgfplots bzw pgfplotstable.


Um zu beurteilen, wie effizient du arbeitest, müsstest du allerdings ein paar Testläufe machen.
TeXwelt - Fragen und Antworten Schaut vorbei und stellt Fragen.
LaTeX-Vorlagen?

Der Weg zum Ziel: Ruhe bewahren und durchatmen, Beiträge und unterstützende Links aufmerksam lesen, Lösungsansätze verstehen und ggf. nachfragen.

MoonKid
Forum-Meister
Forum-Meister
Beiträge: 690
Registriert: Sa 30. Jun 2012, 11:56

Beitrag von MoonKid »

Also datatool und pgfplotstalbe sieht beides sehr genial aus.

Mit beiden sind scheinbar auch sehr komplexe/spezielle Formatierungen der Tabelle und das Verwenden einer "anderen" Tabellenumgebung (z.B. tabu) möglich.

datatools konzentriert sich auf die Daten selbst und überlässt mir das Handling der Tabelle - ist also von (meinem) Denken her einfacher.

pgfplots(table) visualisiert mir die Daten auch gleich noch. Nur ist hier die Syntax pgf-mäßig komplex und für mich daher sehr viel nervenaufreibender, weil ich da mehr Fehlermöglichkeiten habe. ;)

Aber mal abgesehen davon, würde mich noch eure Einschätzung interessieren, wo die Vor-/Nachteile beider Packete zueinander liegen?
XeLaTeX, TeX Live, vim-latexsuite

Noch so einer

Beitrag von Noch so einer »

Aus meiner Sicht hat pgfplotstable die Nase insofern vorn, als der Schritt zur grafischen Datenvisualisierung dann nicht mehr weit ist.

datatool kann dafür sehr leicht mit unterschiedlichen "Datenbank"-Formaten umgehen. Bis zur ersten Tabelle sind es mit dem Paket meist nur wenige Minuten. Bei pgfplots(table) braucht man eventuell etwas länger. Dafür wird man dann aber auch mit den reichen Möglichkeiten von pgf/Tikz belohnt.

Letztlich ist es wie so oft eine Frage dessen, was man investieren und was man erreichen will und welche Benutzerschnittstelle einem mehr liegt.

Bzgl. tabu sei übrigens darauf hingewiesen, dass es noch immer keine klare Aussage zur Zukunft gibt, bzw. die letzte klare Aussage dazu schon länger zurück liegt und vermuten lässt, dass man die jetzige Version des Pakets mit dem Dokument archivieren sollte.

Antworten