Seite 1 von 3
Umlaut-Problem
Verfasst: Do 11. Nov 2010, 17:14
von wiesengrund
Hallo!
Ich schreibe ein Dokument auf der Vorlage scrartcl (siehe minimal-Beispiel)
als Editor habe ich TexShop, für Mac. Ich kann die Umlaute im Editor-Fenster einfach eintippen, ich sehe die Umlaute im pdf-Viewer, ich sehe sie auch im PDF selbst (gleich ob mit "Vorschau" bei MacOS oder mit dem Acrobat Reader) und ich kann sie auch ausdrucken.
Wenn ich aber Text aus dem PDF rauskopieren will (mit Copy/Paste), in Word, in sonstwo verschwinden die Umlaute, und es kommt für "ä" ein "a " und soweiter. (Wie) lässt sich dies beheben? Hängt das von der Vorlage ab?
Hier ein Minimalbeispiel
\documentclass[bibtotoc]{scrartcl}
\usepackage[applemac]{inputenc}
\usepackage{times}
\usepackage{graphicx}
\usepackage{natbib}
\usepackage[ngerman]{babel}
\usepackage{url}
\usepackage{hyperref}
\title{Umlaute}
\begin{document}
\maketitle
äther öse übelkeit, dasselbe bei "ather "ose "ubelkeit.
\end{document}
Viele Grüße[/code]
Verfasst: Do 11. Nov 2010, 17:25
von Nerd 032F
Das Problem ist, dass bei Dir Umlaute aus zwei Zeichen zusammengesetzt werden, weil Du mit dem Standard-Font-Encoding OT1 arbeitest und das nur 7-Bit-Fonts unterstützt. Lade also zusätzlich \usepackage[T1]{fontenc}. Außerdem ist das Paket times obsolet. Siehe dazu die Anleitung zu psnfss, psnfss2e.pdf, oder l2tabu (gibt es über die wichtigen Netzdokumente im Wiki).
Wenn das alles noch immer nicht reicht, brauchst Du eventuell noch zusätzlich das Paket cmap.
Verfasst: Do 11. Nov 2010, 17:26
von Nerd 032F
Achja: Das Paket url musst Du nicht laden. Das lädt hyperref für Dich automatisch.
Verfasst: Do 11. Nov 2010, 17:32
von iTob
und für den Fall, dass du mal was mit Windowsern austauschen willst, würde ich von applemac auf latin1 (=ISO-8859-1) umstellen oder Unicode (utf8) aber das können nicht alle Editoren.
Wichtig ist, dass dein Editor und deine Dokumente auf das selbe encoding eingestellt sind.
(TexMakerX erkennt es beim öffnen zum Beispiel automatisch und verändert seine Standardeinstellungen nötigenfalls für dieses Dokument)
Grüße,
Tobi
PS: Wenn du Lust hast, schau dir mal den TexMakerX und als Viewer dazu Skim an, die Kombi hat sich bei mir – ebenfalls am Mac – sich bewährt. Vor allem Skim hat einige Vorzüge gegenüber der Vorschau.app …
Verfasst: Do 11. Nov 2010, 18:14
von wiesengrund
Hallo und danke für die vielen, schnellen Hinweise.
Ich habe leider ehrlich gesagt nicht so die Ahnung was Pakete, Dokumentationen usw. angeht und werde wohl eine Zeit brauchen bis ich das kapiere.
Ich nehme an es hat keiner ein Minimalbeispiel als Antwort gepostet, weil es mit bloßen Syntax-Befehlen nicht getan ist?
Einfach "\usepackage{times}" bzw. "\usepackage[T1]{fontenc}" hat auf jeden Fall noch nicht geholfen...
Falls jemand die Muse hat, die einzelnen Schritte genauer zu erklären, gerne!
Gruss
Verfasst: Do 11. Nov 2010, 18:32
von iTob
Ok ich versuch’s nochmal
Das Paket times ist obsolent, d.h. es sollte nicht mehr verwendet werden.
Stattdessen kannst du txfonts oder mathptmx.
Wenn du nicht so sehr an die Schrift gebunden bist, kannst du auch mal libertine versuchen.
Was du auf jeden Fall immer einbinden solltest ist das paket fontenc mit der Option T1. Das stellt die Kodierung der Schrift von OT1 (das nur wenige Zeichen beinhalten kann) auf eben T1 um. Dadurch können z.B. Umlaute direkt als einzelnes zeichen verwendet werden (copy+paste geht) und müssen nicht aus zwei Punkten und Buchstabe (copy+paste geht nicht wie gewünscht) zusammengesetzt werden.
Hier mal ein Beispiel, dass du testen kanns. Normalerweise ist es aber Aufgabe der Fragesteller, ein Minimalbeispiel, das das Problem zeigt zu erstellen
\documentclass[%
fontsize=10pt,
a4paper,
ngerman
]{scrartcl}
\usepackage[latin1]{inputenc}% hier verwende ich latin1, nicht applemac
% dazu hab ich ja weiter oben schon was geschrieben.
\usepackage[T1]{fontenc}% Fontkodierung auf das neuere T1 umschalten
\usepackage{babel}% Sprache besser als Klassenoption angeben, dann steht sie allen
% Paketen zur Verfügung ...
% Schriften
%\usepackage{mathptxm}
% oder
%\usepackage{txfonts}
% oder
\usepackage{libertine}
\begin{document}
äther öse übelkeit, dasselbe bei "ather "ose "ubelkeit.
\end{document}
Das läuft bei mir ohne Probleme und auch c+p geht – Suche im PDF geht mit OT1 und Umlauten übrigens auch nicht, weil ja ein ä nicht als Zeichen drin steht.
Ist dir das genau genug? Sonst musst du deine Fragen nochmal konkreter formulieren. Ist ein Bisschen schwierig, in einem Post einen allumfassenden LaTeX-Einstiegt abzuhandeln.
In diesem Sinne empfehle ich die den LaTeX-begleiter (Mittelbach et al.) und die Anleitung zu KOMA-Skript (scrguide.pdf <- Google, oder auch als Printversion) wenn du das alles gelesen hast, dann sollten so bald keine Fragen mehr auftauchen. Sind zusammen aber auch gut 1000–1200 Seiten schätze ich.
Liebe Grüße
Tobi
Achja, wieder als PS: Hast du dir den TexMakerX und Skim schon angesehen. Willst du links oder selber Googlen. Die Einstellungen zum verknüpfen kann ich dir schicken. Dann sag Bescheid

Verfasst: Do 11. Nov 2010, 20:09
von wiesengrund
Hallo Tobi,
danke vielmals für das Beispiel. Es geht jetzt! Ich schick im Anhang mal eine Seite aus dem PDF - ich verstehe es nicht, aber es ist so:
Kopiere ich ein einzelnes "ä" rüber in Word, funktioniert es nicht.
Kopiere ich, aus diesem Dokument, das Wort "vervielfältigt", geht es. Die Information, die aus dem "a" ein "ä" macht, hängt irgendwie am Buchstaben, den nach dem "ä" kommt.
[T1]{fontenc} hat aber auf jeden Fall den sehr guten Effekt, dass die Buchstaben auch einzeln gefunden werden im PDF. Und kopiere ich jetzt einen einzelnen Buchstaben "ä" heraus, erscheint kein "a " (a und Leerzeichen) mehr sondern nur noch ein "a".
Ich weiss, mir täte eine fundierte Einarbeitung in LateX sehr gut, und ich verspreche, sowie ich Zeit habe, werde ich das tun (sei's in Kursform oder tatsächlich über PDF-Lektüren). Deine Tips (Skim) google ich gern selbst!
Natürlich hör ich mir weiter gerne an, was du von meinem Umlaut-"Problem" hältst/dazu sagst. Aus der aktuellen Notlage bin ich aber definitiv heraus, man kann die Sachen komplett rüberziehen in Word, insofern: Danke nochmals!
Daniel
Verfasst: Do 11. Nov 2010, 20:53
von iTob
Komisch. Aber du hast recht. Einzelne Buchstaben kopieren geht nicht, Wörter kopieren schon; aber ich habe keine Ahnung, woran das liegt. Sorry … Aber es ist bei PDFs, die ich erstellt habe das selbe Phänomen, wie ich grade feststellen durfte.
Und weil das seltsam ist und ich das auch wissen will, lasse ich den Status vorerst auf „mit Vorschlag“.
Wenn du fragen zu Skim/tmx/LaTEX am Mac, dann kannst du auch ne PN schreiben.
Ich bin übrigens nicht sicher, ob ein Kurs wirklich was nutzt. bei uns anner Uni gab’s einen von Studenten gemachten. Der hat wenig gebracht und zum Teil wurden auch falsche/veraltete Sachen erzählt, wie ich inzwischen weiß. Und wenn du dir Syntax und das Grundprinzip von LaTeX verstanden hast, sollten es PDFs und Bücher auch tun denk ich
Gute Nacht!
Tobi
Verfasst: Fr 12. Nov 2010, 08:12
von KOMA
Ich habe eben mal das Beispiel von iTob unter Linux mit TeX Live 2010 durch pdflatex gejagt und dann per Copy&Paste aus xpdf sowohl ganze Wörter als auch einzelne Buchstaben erfolgreich in emacs eingefügt. Auch mit dem PDF aus
http://www.golatex.de/viewtopic,p,24346.html#24346 hatte ich keine Probleme. Ich habe zwar nur mit ü und ö getestet, weil mir beim ä nicht gelungen ist, es ohne das f zu kopieren (die stehen durch das Kerning einfach zu dicht). Aber das war mit okular problemlos möglich. Den Adobe Reader und Word meide ich wie die Pest.
Verfasst: Fr 12. Nov 2010, 10:49
von iTob
Guten Morgen,
mit Word und dem Reader habe ich es auch nicht versucht. Gestern hab ich aus Skim und Vorschau.app in die Safarie-Suchleite kopiert.
Grad habe ich es noch mal mit TextEdit versucht und festgestellt, dass die Buchstaben unterschiedlich groß sind... allerdings nicht in allen Fonts, weshalb ich da auf ein Font-Problem schleißen würde. Aber es scheint tatsächlich so zu sein, als sei auch das ö im PDF trotz T1 zusammengesetzt. Komisch find ich das.
Hab dazu nen Screenshot in den Anhang geladen. Äußerem die auf meinem System erstellt PDF. Könntest du, KOMA, mal versuchen, wie es da mit dem kopieren aussieht, bitte? Wäre ja interessant, zu wissen, ob es an der PDF, dem Kompiler oder dem Viewer bzw. dem Betriebsystem, auf dem angezeigt/kopiert wird liegt.
Wenn ich das kopierte Wort „öse“ in den texmakerx (der auf latin1 eingestellt ist) kopiere, kann ich durch drücken der Rückschritttaste hinter dem ö erst die Punkte und dann das verbleibende o löschen. In Textedit, wird beides gleichzeitig gelöscht.
Es spricht einiges dafür, dass das verwendete ö keine einzelne Glyphe ist.
(Ich arbeite übrigens mit Mac OSX 10.6.5 und habe mein MacTeX/TeX Live gestern aktualisiert. Die Schrift in tmx ist die Consolas, im Screenshot zu sehen ist Monaco, aber bei der Consolas zeigt es sich ebenfalls.)
Grüße
Tobi