Datenbank und Design grammatischer Annotationen Thema ist als GELÖST markiert

Redefinition von Makros, Definition eigener Befehle sowie neuer Umgebungen


Gast

Datenbank und Design grammatischer Annotationen

Beitrag von Gast »

Hi,
ich habe vor einem guten Jahrzehnt mal mit Latex rumgespielt, bin da aber über Anfängerniveau kaum hinaus gekommen, zudem ist's ziemlich eingeschlafen. Durch ein paar Anwendungsbeispiele von dem mir zuvor unbekannten tikz-Paket inspiriert, überlege ich gerade, ob Latex vielleicht im Zusammenhang mit einer Datenbank-Software nicht der beste Weg wäre, das zu realisieren, was mir vorschwebt. Aber nach den ersten 50 Seiten Lektüre des tikz-manuals und in Anbetracht vieler anderer Dinge, die ich um die Ohren habe, bin ich gerade etwas abgeturnt: Ziel scheint noch viel zu fern. Daher frage ich mich, ob die Cracks hier oder Leute, die wirklich Muße haben, sich gerade in Latex einzuarbeiten, mir nicht einfach eine Patentlösung aus dem Ärmel schütteln können - oder mich wenigstens darauf hinweisen können, mit welchen Befehlsstrukturen ich mich am besten vertraut machen sollte. Wäre sehr nett und ich dankbar. :D

Ich habe mehrere Zielvorstellungen, eine kurzfristige, eine mittelfristige und eine langfristige.

Kurzfristig will ich für mehr oder weniger absolute AnfängerInnen in der deutschen Sprache Sätze mit grammatischen Informationen auf ansprechende und übersichtliche Weise verknüpfen. Um eine Idee zu geben, meine nicht sonderlich ausgereifte Basteldatei sieht gerade so aus:
\documentclass{minimal}
\usepackage{tikz}
\usepackage{verbatim}
\usetikzlibrary{arrows,positioning,shapes,snakes} 
\tikzset{
    %Define standard arrow tip
    >=stealth',
    %Define style for boxes
    verb/.style={
           rectangle,
           rounded corners,
           draw=black, very thick,
           text width=4.8em,
           minimum height=2em,
           text centered,
           fill=white!90!black},
     sglied/.style={
           rectangle,
           rounded corners,
           draw=black, very thick,
           text width=4.5em,
           minimum height=2em,
           text centered,
           fill=white!80!black},
    % Define arrow style
    pil/.style={
           ->,
           thick,
           shorten <=2pt,
           shorten >=2pt,}
}
\begin{document}
\begin{tikzpicture}[node distance=1cm, auto,]
\node (sein) {Sein};
\node [right=of sein](alter) {alter};
\node [right=of alter](freund) {Freund};
\node [right=of freund](hat) {hat};
\node [right=of hat](gestern) {gestern};
\node [right=of gestern](einen) {einen};
\node [right=of einen](arzt) {Arzt};
\node [right=of arzt](besucht) {besucht.};
\node [verb, above=of sein](pos) {Posssesiv- artikel 3. Person Singular m{\"a}nnlich}
	edge[pil] (sein.north);
\node [verb, above=of alter](adj) {Adjektiv attributiv m{\"a}nnlich Singular}
	edge[pil] (alter.north);
\node [verb, above=of freund](nom) {Nomen m{\"a}nnlich Singular}
	edge[pil] (freund.north);
\node [verb, above=of hat](ver) {Hilfsverb finit 3. Person Singular}
	edge[pil] (hat.north);
\node [verb, above=of gestern](adv) {Adverb}
	edge[pil] (gestern.north);
\node [verb, above=of einen](art) {Artikel m{\"a}nnlich indefinit}
	edge[pil] (einen.north);
\node [verb, above=of arzt](nom2) {Nomen m{\"a}nnlich Singular}
	edge[pil] (arzt.north);
\node [verb, above=of besucht](ver2) {Verb Partizip Perfekt}
	edge[pil] (besucht.north);
	
\node [sglied, below=of alter](nom3) {Subjekt / Nominativ- erg{\"a}nzung}
	edge[pil] (sein.south)
	edge[pil] (alter.south)
	edge[pil] (freund.south);
\node [sglied, below=of gestern](ang) {Angabe temporal}
	edge[pil] (gestern.south);
\node [sglied, below=of hat](prd) {Pr{\"a}dikat mehr- gliedrig}
	edge[pil] (hat.south)
	edge[pil, bend right=55] (besucht.south);
\node [sglied, below=of einen](nom4) {Akkusativ- objekt / -erg{\"a}nzung}
	edge[pil] (einen.south)
	edge[pil] (arzt.south);
\node [sglied, below=of prd](val) {Valenz 2 transitiv: jemand besucht jemanden}
	edge[pil] (nom3.south)
	edge[pil] (prd.south)
	edge[pil] (nom4.south);	
\end{tikzpicture}
\end{document}
Über dem relativ simplen Satz 'Sein alter Freund hat gestern einen Arzt besucht.' befinden sich Infos zur jeweiligen Wortart, unter dem Satz Infos zur Satzgrammatik, wobei's da einmal die Satzglied-Ebene und dann noch die Verbvalenz-Ebene gibt.

Ich habe kein gutes Gefühl für Design, klar ist mir aber, dass das eine sehr platzraubende Darstellung ist, die ich eigentlich gerne kompakter, aber nicht weniger ausführlich und übersichtlich hätte. Zudem stören mich ein paar Details, die Überkreuzung von zwei Pfeilen und die Positionierung des Akkusativobjekt-nodes unterhalb von 'einen' und nicht unterhalb von 'einen Arzt'. Zudem ließe sich der Prädikat-node und der Valenz-node auch als eine node unterhalb der Satzglied-Ebene darstellen, aber mir ist nicht klar, wie ich tkiz doppel-below sage Bevor ich auf die 'Ach-fragen-wir-doch-mal-in-einem-Forum-nach-Rat'-Idee kam, habe ich im tikz-manual nach Lösungsmöglichkeiten dafür gesucht, aber zumindest innerhalb von einer halben Stunde nichts außer absoluter Postionierungsmöglichkeiten gefunden, die ich im Coding jetzt erstmal ein bisschen mühsam fände. Ich müsste mich halt tiefer reinarbeiten.

Deutlich ist mir aber auch, dass ich das Ergebnis mit Latex schicker und grundsätzlich auch schneller und einfacher zu produzieren finde als z. B. in Libre Office.

Im Prinzip soll noch eine weitere Ebene hinzutreten, nämlich Informationen zur Positionerung im Satz, wobei ich erstmal an das Feldermodell (vgl. https://de.wikipedia.org/wiki/Feldermod ... hen_Satzes ) denke, das ich aber nicht optimal finde. Bedeutsam ist z. B. die Bewusstmachung, dass wir in einem einfachen Satz das Verb in der zweiten Satzgliedposition haben und die Nominativergänzung davor oder dahinter, was im Feldermodell jetzt nicht super prägnant dargestellt wird. Wir könnten z. B. auch sagen: 'Gestern hat sein alter Freund einen Arzt besucht.' oder mit dem Arzt anfangen, der alte Freund aber wandert grammatisch korrekt nie ans Ende des Satzes. Was für dieses mögliche Switching der Positionen von Satzgliedern eine gute Darstellungsform wäre, ist mir derzeit noch nicht klar.

Zudem will ich die grammatischen Infomationen zwar herausarbeiten, aber designtechnisch eigentlich auch nicht so übergewichtig machen. Sie stellen eigentlich eine Hilfsstruktur für den Erwerb der Sprache dar. Im Design allerdings tritt der Ursprungssatz jetzt erstmal sehr zurück gegenüber den überbordenden grammatischen Infos. Man könnte ihm eine größere Schriftart verpassen, aber damit würde nur noch mehr Platz draufgehen.
Nicht undenkbar finde ich, nach einer Weile im Unterricht zu deutlich platzsparenderen Kurzannotationen überzugehen, wenn ich diese grundlegenden Strukturen ausreichend vorgestellt habe. Aber die Idee gefällt mir nicht besonders, weil das hieße, dass ich den Erlernen der grammatischen Kategorien voraussetzen würde, was ich eigentlich nicht möchte. Sie sind Hilfsstrukturen, nicht eigentlicher Lerninhalt.

Meine erste Bitte um Hilfe betrifft also die angerissenen Design-Probleme. Habt ihr Ideen, Verbesserungsvorschläge, Tipps?

Klar ist, dass ich auch mehrere strukturgleiche Sätze zwischen den grammatischen Informationen stehen haben möchte (also z. B. zusätzlich 'Sein neuer Wagen hat vor drei Wochen einen Platten gehabt.'), was aber kaum ein Problem darstellen dürfte. Im Moment würde ich dann halt einfach in den Freund-node einen Zeilenumbruch einfügen und 'Wagen' zusätzlich reinschreiben - obwohl's da vermutlich auch elegantere Lösungen zu gibt.

Kurzfristig möchte ich in dieser Machart erstmal einfach nur ein paar Handouts mit jeweils einer Handvoll oder ein, zwei Dutzend Beispielsätzen machen, mehr brauche ich nicht.

Mittelfristig, also vielleicht bis Ende nächsten Jahres, möchte ich allerdings den Satzkorpus mindestens ein, vielleicht auch zwei mehrbändiger Lehrwerke für Deutsch-AnfängerInnen von je ca. tausend Seiten möglichst umfassend in eine solche strukturelle Darstellung bringen. Motivation dazu ist, dass meines Wissens kein Lehrwerk für AnfängerInnen ausreichend intensiv die Valenzstrukturen der Verben herausarbeitet. Z. B. benutzen wir 'sich erinnern' häufig mit einer Präpositionalergänzung mit der Präposition 'an', 'sich interessieren' aber häufig mit Präpositionalergänzung mit der Präposition 'für'. Dafür möchte ich a) sensibilisieren, b) Vokabletabellen erstellen, die Informationen zu solchen Ergänzungsmustern des jeweiligen Verbs beinhalten.

Da ich also recht groß denke, möchte ich das möglichst von vornherein automatisieren, also Sätze möglichst so einpflegen, dass ich jedem Wort eine Reihe von Infos zuordne, die ich dann in der Darstellung wieder aufrufen kann. Z. B. würde ich 'Freund' die Wortartinformation 'Nomen' mit den vertiefenden Zusatzinformationen 'männlich' und 'Singular' und die Satzgliedinformation 'Nominativergänzung', zudem den ganzen Satz, in dem das Wort auftaucht, zuordnen. tikz soll dann, je nachdem welche Sätze ich darstellen will, die Infos einfach abrufen. Sprich, ich will das mit Datenbank und Variablen konzipieren. Ich bin mir unterdessen sehr klar darüber, dass tikz das kann, habe aber null Ahnung wie. Von daher: Habt ihr Tipps, Musterlösungen, den Masterplan zur Umsetzung?

Zielvorstellung dabei ist, dass ich in einem von mir selbst grammatisch annotierten Korpus nach den Sätzen suchen kann, in denen bestimmte Wörter oder bestimmte grammatische Strukturen auftreten - damit meine Lerngruppe sich darauf jeweils konzentrieren kann.

Nur um's klar zu sagen: Ich will jetzt kein Programm, dass die Grammatik selbst erkennt, die Kategorisierung kann ich beim Einpflegen der Daten übernehmen. Ich will nur eine gut durchsuchbare Datenbank und einen Code, mit dem ich schnell mal fünf oder hundert Beispielsätze ausspucken kann.

Ich habe keinen Plan davon, wie Latex eigentlich mit Datenbanken umgeht. Klar ist mir, dass ich selber Variablen definieren kann, was ja im Prinzip eine Datenbank ist. Ob's dafür aber eigene interne Module gibt oder man bspw. auf eine MySQL-Datei mit Latex zugreifen kann - keine Ahnung. Ich kenne micha jetzt auch nicht wirklich mit MySQL aus, ähnlich laienhaft wie mit Latex. Aber wenn ich so ein ziemlich aufwändiges Projekt schon angehe, dann würde es mir ratsam erscheinen, die Datenbank von vornherein so zu gestalten, dass sie gut portierbar ist z. B. für eine App, die man später ja noch daraus basteln könnte, oder für eine Internetseite. Das wäre dann sozusagen die sehr langfristige Zielvorstellung.

Mögt und könnt ihr mir weiterhelfen? Wäre echt lieb.

Benutzeravatar
u_fischer
Forum-Meister
Forum-Meister
Beiträge: 4266
Registriert: Do 22. Nov 2012, 11:09
Kontaktdaten:

Beitrag von u_fischer »

und in Anbetracht vieler anderer Dinge, die ich um die Ohren habe,
Das gilt für andere auch, und m.E. ist deine Frage viel zu lang für ein Forum wie dieses.

Was die deutsche Satzstruktur angeht, zitiere ich mal David Carlisle
German is easy, just use English, but move the verb somewhere unexpected, uppercase the occasional first letter and miss out three quarters of the spaces.
http://chat.stackexchange.com/transcrip ... 0#32504510

Antworten