Zeichencodierung - PDFs ohne Umlaute

Goonah · Beitrag von **Goonah** » Fr 18. Jan 2013, 14:04

Hallo Leute,

ich versuche grade ein Latexscript zu bearbeiten und zu ergänzen, welches ich in der Originalform von einem Kollegen erhalten habe.
Nun habe ich glaube ich ein Problem mit der Zeichencodierung:

Ich habe von meinem Lehrstuhl eine Präambel und ein Bsp-Kapitel1 bekommen(glaube mit Texniccenter geschrieben). Ich habe ein weiteres Kapitel2 zu Hause geschrieben(Texmaker). Compilieren und betrachten will ich ebenfalls zu hause.

Was macht der Editor:

1) In der Präambel zeigt er statt umlaute komische Symbole.
2) Im Bsp-Kapitel1 zeigt der Editor alles normal an
3) Im eigenen Kapiel2 zeigt der Editor alles normal an

Wie sieht PDF nach kompilieren aus:

1) Titelseite aus Präambel (ist gut)
2) Bsp-Kapitel 1 wird richtig dargestellt
3) eigenes Kapitel2 zeigt komische Symbole wo Umlaute stehen sollten?!

Die Kapitel sind über den \include-Befehl eingefügt.
Ich nutze die Pakete:
\usepackage[T1]{fontenc}
\usepackage[latin1]{inputenc}

Es ist beim Compilieren und darstellen egal ob ich bei "Optionen"->"Texmaker konfigurieren"->"Editor" UTF-8 oder ISO-8859-1 auswähle. Prinzipiel funktionieren beide gleichgut oder bei den Umlauten gleichschlecht.

Problem nochmal kurz:

\begin{document}
\include{alte Kapitel} %(compiliert ist hier alles gut)
\include{neue Kapitel} %(compiliert fehlen hier Umlaute)
\end{document}

Im gleichen Dokument fangen auf einmal in meinen Kapitel diese Probleme an.

Kann mir da jemand helfen?

Grüße,
Goonah

Goonah · Beitrag von **Goonah** » Fr 18. Jan 2013, 14:10

Besserwisser hat geschrieben: …

Sorge dafür, dass alle Dateien dieselbe Codierung haben und stelle entweder per inputenc oder per selinput genau diese Codierung ein und die Umlaute werden im erzeugten Dokument korrekt enthalten sein. Konfiguriere außerdem den Editor auf genau diese Codierung und auch er wird die Umlaute korrekt anzeigen...

Zitat war die erste Antwort auf meine Frage und stammt aus meinem ersten Thema, wo ich dieses Problem zusätzlich fragte. Jetzt hats eine eigene Diskussion erhalten.

Goonah · Beitrag von **Goonah** » Fr 18. Jan 2013, 14:28

Stefan_K hat geschrieben:Use [latex]babel[/latex] with [latex]ngerman[/latex] option:
\usepackage[ngerman]{babel}
T1 font encoding is good, loading [latex]inputenc[/latex] as well. But ensure, that all input encoding match, i.e.
[latex]inputenc[/latex] option (such as [latex]utf8[/latex] or [latex]latin1[/latex])

editor encoding (Texmaker setting)

actual file encoding
must all be the same.

Differences can occur if you work on different operating systems (Linux uses usually utf8, Windows latin1, but modern editors also utf8) or with different editors. If you would already have a mix, such as a chapter from a colleague with different encoding, you have to fix it - there are tools (recode, iconv) but you could for example open as latin1 in the editor and save as utf8.

Stefan

Dieses Zitat stammt aus einem anderen Forum. Ich versuche grade mein selbsterzeugtes crosspost-Problem wieder zu reinigen.

Goonah · Beitrag von **Goonah** » Fr 18. Jan 2013, 14:30

Danke an Besserwisser un Stefan,

mal sehen was ich mit diesen Ideen so anfangen kann.
Das heißt wohl, zuächst untersuchen in welchem code die mir überlassenen Tex-Dateien gespeichert wurden.

Goonah

Goonah · Beitrag von **Goonah** » Fr 18. Jan 2013, 16:10

So,

habe in einem großen trial and error festgestellt, dass gar keine Editoreinstellung vom Texmaker den Latexcode richtig darstellt.
Eine vielzahl aber durchaus alles bis auf Umlaute gut wiedergeben.
Dazu gehören:
> ISO-8859-1, ISO-8859-2, (weiter die ISOs etwas abgekürzt), -4, -5, -9, -10, -13, -14, -16
> System
> Windows-1258, -1256,-1254, -1252, -1250
> IBM 866, IBM 850
> AppleRoman
> WINSAMI 2
> KOI8-U, KOI8-R
> UTF16LE, UTF16BE (hier kommt alle in chinesischen/japanischen Schriftzeichen)

Was aber geht - nur bei ISO-8859-1 probiert - ist in eines der Kauderwelchzeichen zu entfernen und an der Stelle ein Umlaut zu schreiben.
Das wird im Editor richtig angezeigt und somit dann auch in der PDF nach Compilierung.

Gibt es eine Möglichkeit die Falsch-Umlaute wieder herzustellen, oder kann ich diese nur noch einzeln umschreiben.

Schönen Gruß

Goonah

Beinschuss · Beitrag von **Beinschuss** » Fr 18. Jan 2013, 21:28

Also da sollte die Ersetzen-Funktion Deines Editors ausreichen, um die Datei(en) zu bereinigen.

Helmut

Ironoxid · Beitrag von **Ironoxid** » Fr 18. Jan 2013, 23:37

Hallo.

Ja die Zeichencodierung kann Probleme bereiten, wenn man nicht aufpasst.

Deinen Aussagen nach schließe ich darauf, dass deine Vorlage in ISO 8859-1 (latin1) gespeichert. Jetzt hast du mit mit deinem Editor aber ein neues Kapitel geschrieben, indem der Editor eine neue Datei anlegen sollte. Bestimmt war dein Editor auf UTF-8 voreingestellt, weswegen du dein neues Kapitel schließlich auch in UTF-8 abgespeichert wurde.

Über inputenc teilst du mit, deine Codierung währe Latin1. Da kann man zwei Fälle unterscheiden. Wird ein Texfile in UTF-8 gespeichert und inputenc liest Latin1, so erscheinen kömische Zeichen anstelle der Umlaute. Speichert man das Texfile in Latin1 und gibt inputenc UTF-8 mit, so fehlen die Umlaute einfach.

Deswegen schließe ich darauf, dass du dein geschriebenes Kapitel in UTF-8 gespeichert hast. Du könntest jetzt also versuchen die Datein in Latin1 umzuwandeln. Vielleicht funktioniert es aber besser, wenn du vorher deinem Editor sagst, er soll neue Dateien in iSO-8859-1 speichern. Dann erstellst du eine neue Datei - jetzt in Latin1 - und kopierst deinen Text hinein.

Das basiert auf der Erfahrung, dass die Umwandlung der Zeichenkodierung dann doch schon mal die Umlaute versaut.

Goonah · Beitrag von **Goonah** » Sa 19. Jan 2013, 12:05

HA! Danke Ironoxid,

diese Lösung war für mich zu simpel um selbst drauf zu kommen:
Code kopiert, vorher den Editor auf ISO-8859-1 gestellt, und abschließend gespeichert und compiliert...funzt.

Danke nochmal, jetzt kann ich endlich richtig loslegen.

Einzig bleibt das Problem, dass im Editor selbst, also im code, weiter komische Zeichen stehen. Dies betrifft nur die Texdateien, die ich für diese Arbeit bekommen habe, natürlich nicht die selbstgeschriebenen. Aber das ist nur ein Schönheitsfehler in den auskommentierten Bereichen. Befehle verzichten ja zum Glück auf Umlaute...

Aber man kann nicht alles haben,

Grüße und Danke an die Helfer

Goonah