Zeichencodierung - PDFs ohne Umlaute

Editoren wie TexWorks, TeXmaker, TeXstudio, TeXnicCenter, Kile, LyX, vi, Emacs und Co.


Goonah
Forum-Anfänger
Forum-Anfänger
Beiträge: 18
Registriert: Fr 24. Feb 2012, 15:15

Zeichencodierung - PDFs ohne Umlaute

Beitrag von Goonah »

Hallo Leute,

ich versuche grade ein Latexscript zu bearbeiten und zu ergänzen, welches ich in der Originalform von einem Kollegen erhalten habe.
Nun habe ich glaube ich ein Problem mit der Zeichencodierung:

Ich habe von meinem Lehrstuhl eine Präambel und ein Bsp-Kapitel1 bekommen(glaube mit Texniccenter geschrieben). Ich habe ein weiteres Kapitel2 zu Hause geschrieben(Texmaker). Compilieren und betrachten will ich ebenfalls zu hause.

Was macht der Editor:

1) In der Präambel zeigt er statt umlaute komische Symbole.
2) Im Bsp-Kapitel1 zeigt der Editor alles normal an
3) Im eigenen Kapiel2 zeigt der Editor alles normal an

Wie sieht PDF nach kompilieren aus:

1) Titelseite aus Präambel (ist gut)
2) Bsp-Kapitel 1 wird richtig dargestellt
3) eigenes Kapitel2 zeigt komische Symbole wo Umlaute stehen sollten?!

Die Kapitel sind über den \include-Befehl eingefügt.
Ich nutze die Pakete:
\usepackage[T1]{fontenc}
\usepackage[latin1]{inputenc}

Es ist beim Compilieren und darstellen egal ob ich bei "Optionen"->"Texmaker konfigurieren"->"Editor" UTF-8 oder ISO-8859-1 auswähle. Prinzipiel funktionieren beide gleichgut oder bei den Umlauten gleichschlecht.

Problem nochmal kurz:

\begin{document}
\include{alte Kapitel} %(compiliert ist hier alles gut)
\include{neue Kapitel} %(compiliert fehlen hier Umlaute)
\end{document}

Im gleichen Dokument fangen auf einmal in meinen Kapitel diese Probleme an.


Kann mir da jemand helfen?


Grüße,
Goonah
Zuletzt geändert von Goonah am Fr 18. Jan 2013, 14:10, insgesamt 1-mal geändert.

Goonah
Forum-Anfänger
Forum-Anfänger
Beiträge: 18
Registriert: Fr 24. Feb 2012, 15:15

Beitrag von Goonah »

Besserwisser hat geschrieben:

Sorge dafür, dass alle Dateien dieselbe Codierung haben und stelle entweder per inputenc oder per selinput genau diese Codierung ein und die Umlaute werden im erzeugten Dokument korrekt enthalten sein. Konfiguriere außerdem den Editor auf genau diese Codierung und auch er wird die Umlaute korrekt anzeigen...
Zitat war die erste Antwort auf meine Frage und stammt aus meinem ersten Thema, wo ich dieses Problem zusätzlich fragte. Jetzt hats eine eigene Diskussion erhalten.
Zuletzt geändert von Goonah am Fr 18. Jan 2013, 14:29, insgesamt 2-mal geändert.

Goonah
Forum-Anfänger
Forum-Anfänger
Beiträge: 18
Registriert: Fr 24. Feb 2012, 15:15

Beitrag von Goonah »

Stefan_K hat geschrieben:Use [latex]babel[/latex] with [latex]ngerman[/latex] option:
\usepackage[ngerman]{babel}
T1 font encoding is good, loading [latex]inputenc[/latex] as well. But ensure, that all input encoding match, i.e.
  • [latex]inputenc[/latex] option (such as [latex]utf8[/latex] or [latex]latin1[/latex])
  • editor encoding (Texmaker setting)
  • actual file encoding
must all be the same.

Differences can occur if you work on different operating systems (Linux uses usually utf8, Windows latin1, but modern editors also utf8) or with different editors. If you would already have a mix, such as a chapter from a colleague with different encoding, you have to fix it - there are tools (recode, iconv) but you could for example open as latin1 in the editor and save as utf8.

Stefan

Dieses Zitat stammt aus einem anderen Forum. Ich versuche grade mein selbsterzeugtes crosspost-Problem wieder zu reinigen.

Goonah
Forum-Anfänger
Forum-Anfänger
Beiträge: 18
Registriert: Fr 24. Feb 2012, 15:15

Beitrag von Goonah »

Danke an Besserwisser un Stefan,

mal sehen was ich mit diesen Ideen so anfangen kann.
Das heißt wohl, zuächst untersuchen in welchem code die mir überlassenen Tex-Dateien gespeichert wurden.

Goonah

Goonah
Forum-Anfänger
Forum-Anfänger
Beiträge: 18
Registriert: Fr 24. Feb 2012, 15:15

Beitrag von Goonah »

So,

habe in einem großen trial and error festgestellt, dass gar keine Editoreinstellung vom Texmaker den Latexcode richtig darstellt.
Eine vielzahl aber durchaus alles bis auf Umlaute gut wiedergeben.
Dazu gehören:
> ISO-8859-1, ISO-8859-2, (weiter die ISOs etwas abgekürzt), -4, -5, -9, -10, -13, -14, -16
> System
> Windows-1258, -1256,-1254, -1252, -1250
> IBM 866, IBM 850
> AppleRoman
> WINSAMI 2
> KOI8-U, KOI8-R
> UTF16LE, UTF16BE (hier kommt alle in chinesischen/japanischen Schriftzeichen)

Was aber geht - nur bei ISO-8859-1 probiert - ist in eines der Kauderwelchzeichen zu entfernen und an der Stelle ein Umlaut zu schreiben.
Das wird im Editor richtig angezeigt und somit dann auch in der PDF nach Compilierung.

Gibt es eine Möglichkeit die Falsch-Umlaute wieder herzustellen, oder kann ich diese nur noch einzeln umschreiben.

Schönen Gruß

Goonah

Beinschuss
Forum-Meister
Forum-Meister
Beiträge: 809
Registriert: Di 2. Okt 2012, 21:42
Wohnort: NRW

Beitrag von Beinschuss »

Also da sollte die Ersetzen-Funktion Deines Editors ausreichen, um die Datei(en) zu bereinigen.

Helmut

Ironoxid
Forum-Fortgeschrittener
Forum-Fortgeschrittener
Beiträge: 61
Registriert: So 7. Aug 2011, 05:04
Wohnort: Hohen Neuendorf

Beitrag von Ironoxid »

Hallo.

Ja die Zeichencodierung kann Probleme bereiten, wenn man nicht aufpasst. :D

Deinen Aussagen nach schließe ich darauf, dass deine Vorlage in ISO 8859-1 (latin1) gespeichert. Jetzt hast du mit mit deinem Editor aber ein neues Kapitel geschrieben, indem der Editor eine neue Datei anlegen sollte. Bestimmt war dein Editor auf UTF-8 voreingestellt, weswegen du dein neues Kapitel schließlich auch in UTF-8 abgespeichert wurde.

Über inputenc teilst du mit, deine Codierung währe Latin1. Da kann man zwei Fälle unterscheiden. Wird ein Texfile in UTF-8 gespeichert und inputenc liest Latin1, so erscheinen kömische Zeichen anstelle der Umlaute. Speichert man das Texfile in Latin1 und gibt inputenc UTF-8 mit, so fehlen die Umlaute einfach.

Deswegen schließe ich darauf, dass du dein geschriebenes Kapitel in UTF-8 gespeichert hast. Du könntest jetzt also versuchen die Datein in Latin1 umzuwandeln. Vielleicht funktioniert es aber besser, wenn du vorher deinem Editor sagst, er soll neue Dateien in iSO-8859-1 speichern. Dann erstellst du eine neue Datei - jetzt in Latin1 - und kopierst deinen Text hinein.

Das basiert auf der Erfahrung, dass die Umwandlung der Zeichenkodierung dann doch schon mal die Umlaute versaut.
Editor: TeXstudio, Kile

Goonah
Forum-Anfänger
Forum-Anfänger
Beiträge: 18
Registriert: Fr 24. Feb 2012, 15:15

Beitrag von Goonah »

HA! Danke Ironoxid,

diese Lösung war für mich zu simpel um selbst drauf zu kommen:
Code kopiert, vorher den Editor auf ISO-8859-1 gestellt, und abschließend gespeichert und compiliert...funzt.

Danke nochmal, jetzt kann ich endlich richtig loslegen.

Einzig bleibt das Problem, dass im Editor selbst, also im code, weiter komische Zeichen stehen. Dies betrifft nur die Texdateien, die ich für diese Arbeit bekommen habe, natürlich nicht die selbstgeschriebenen. Aber das ist nur ein Schönheitsfehler in den auskommentierten Bereichen. Befehle verzichten ja zum Glück auf Umlaute...

Aber man kann nicht alles haben,

Grüße und Danke an die Helfer

Goonah

Antworten