Umlaut-Problem

Fragen und Probleme, die nicht den obigen Kategorien zugeordnet werden können


wiesengrund
Forum-Anfänger
Forum-Anfänger
Beiträge: 24
Registriert: Mi 14. Apr 2010, 13:58

Umlaut-Problem

Beitrag von wiesengrund »

Hallo!

Ich schreibe ein Dokument auf der Vorlage scrartcl (siehe minimal-Beispiel)
als Editor habe ich TexShop, für Mac. Ich kann die Umlaute im Editor-Fenster einfach eintippen, ich sehe die Umlaute im pdf-Viewer, ich sehe sie auch im PDF selbst (gleich ob mit "Vorschau" bei MacOS oder mit dem Acrobat Reader) und ich kann sie auch ausdrucken.
Wenn ich aber Text aus dem PDF rauskopieren will (mit Copy/Paste), in Word, in sonstwo verschwinden die Umlaute, und es kommt für "ä" ein "a " und soweiter. (Wie) lässt sich dies beheben? Hängt das von der Vorlage ab?


Hier ein Minimalbeispiel
\documentclass[bibtotoc]{scrartcl}
\usepackage[applemac]{inputenc}
\usepackage{times}
\usepackage{graphicx}
\usepackage{natbib}
\usepackage[ngerman]{babel}
\usepackage{url}
\usepackage{hyperref}
\title{Umlaute}


\begin{document}
\maketitle
äther öse übelkeit, dasselbe bei "ather "ose "ubelkeit.
\end{document}
Viele Grüße[/code]

Nerd 032F

Beitrag von Nerd 032F »

Das Problem ist, dass bei Dir Umlaute aus zwei Zeichen zusammengesetzt werden, weil Du mit dem Standard-Font-Encoding OT1 arbeitest und das nur 7-Bit-Fonts unterstützt. Lade also zusätzlich \usepackage[T1]{fontenc}. Außerdem ist das Paket times obsolet. Siehe dazu die Anleitung zu psnfss, psnfss2e.pdf, oder l2tabu (gibt es über die wichtigen Netzdokumente im Wiki).

Wenn das alles noch immer nicht reicht, brauchst Du eventuell noch zusätzlich das Paket cmap.

Nerd 032F

Beitrag von Nerd 032F »

Achja: Das Paket url musst Du nicht laden. Das lädt hyperref für Dich automatisch.

Benutzeravatar
iTob
Forum-Meister
Forum-Meister
Beiträge: 1221
Registriert: Mo 19. Apr 2010, 22:19
Kontaktdaten:

Beitrag von iTob »

und für den Fall, dass du mal was mit Windowsern austauschen willst, würde ich von applemac auf latin1 (=ISO-8859-1) umstellen oder Unicode (utf8) aber das können nicht alle Editoren.
Wichtig ist, dass dein Editor und deine Dokumente auf das selbe encoding eingestellt sind.
(TexMakerX erkennt es beim öffnen zum Beispiel automatisch und verändert seine Standardeinstellungen nötigenfalls für dieses Dokument)

Grüße,
Tobi

PS: Wenn du Lust hast, schau dir mal den TexMakerX und als Viewer dazu Skim an, die Kombi hat sich bei mir – ebenfalls am Mac – sich bewährt. Vor allem Skim hat einige Vorzüge gegenüber der Vorschau.app …

wiesengrund
Forum-Anfänger
Forum-Anfänger
Beiträge: 24
Registriert: Mi 14. Apr 2010, 13:58

Beitrag von wiesengrund »

Hallo und danke für die vielen, schnellen Hinweise.

Ich habe leider ehrlich gesagt nicht so die Ahnung was Pakete, Dokumentationen usw. angeht und werde wohl eine Zeit brauchen bis ich das kapiere.

Ich nehme an es hat keiner ein Minimalbeispiel als Antwort gepostet, weil es mit bloßen Syntax-Befehlen nicht getan ist?
Einfach "\usepackage{times}" bzw. "\usepackage[T1]{fontenc}" hat auf jeden Fall noch nicht geholfen...

Falls jemand die Muse hat, die einzelnen Schritte genauer zu erklären, gerne!

Gruss

Benutzeravatar
iTob
Forum-Meister
Forum-Meister
Beiträge: 1221
Registriert: Mo 19. Apr 2010, 22:19
Kontaktdaten:

Beitrag von iTob »

Ok ich versuch’s nochmal :)

Das Paket times ist obsolent, d.h. es sollte nicht mehr verwendet werden.
Stattdessen kannst du txfonts oder mathptmx.
Wenn du nicht so sehr an die Schrift gebunden bist, kannst du auch mal libertine versuchen.

Was du auf jeden Fall immer einbinden solltest ist das paket fontenc mit der Option T1. Das stellt die Kodierung der Schrift von OT1 (das nur wenige Zeichen beinhalten kann) auf eben T1 um. Dadurch können z.B. Umlaute direkt als einzelnes zeichen verwendet werden (copy+paste geht) und müssen nicht aus zwei Punkten und Buchstabe (copy+paste geht nicht wie gewünscht) zusammengesetzt werden.

Hier mal ein Beispiel, dass du testen kanns. Normalerweise ist es aber Aufgabe der Fragesteller, ein Minimalbeispiel, das das Problem zeigt zu erstellen ;)
\documentclass[%
     fontsize=10pt,
     a4paper,
     ngerman
]{scrartcl}
\usepackage[latin1]{inputenc}% hier verwende ich latin1, nicht applemac
     % dazu hab ich ja weiter oben schon was geschrieben.
\usepackage[T1]{fontenc}% Fontkodierung auf das neuere T1 umschalten

\usepackage{babel}% Sprache besser als Klassenoption angeben, dann steht sie allen
     % Paketen zur Verfügung ...

% Schriften
%\usepackage{mathptxm}
% oder
%\usepackage{txfonts}
% oder
\usepackage{libertine}


\begin{document}
äther öse übelkeit, dasselbe bei "ather "ose "ubelkeit. 
\end{document}
Das läuft bei mir ohne Probleme und auch c+p geht – Suche im PDF geht mit OT1 und Umlauten übrigens auch nicht, weil ja ein ä nicht als Zeichen drin steht.

Ist dir das genau genug? Sonst musst du deine Fragen nochmal konkreter formulieren. Ist ein Bisschen schwierig, in einem Post einen allumfassenden LaTeX-Einstiegt abzuhandeln.
In diesem Sinne empfehle ich die den LaTeX-begleiter (Mittelbach et al.) und die Anleitung zu KOMA-Skript (scrguide.pdf <- Google, oder auch als Printversion) wenn du das alles gelesen hast, dann sollten so bald keine Fragen mehr auftauchen. Sind zusammen aber auch gut 1000–1200 Seiten schätze ich.

Liebe Grüße
Tobi

Achja, wieder als PS: Hast du dir den TexMakerX und Skim schon angesehen. Willst du links oder selber Googlen. Die Einstellungen zum verknüpfen kann ich dir schicken. Dann sag Bescheid ;)

wiesengrund
Forum-Anfänger
Forum-Anfänger
Beiträge: 24
Registriert: Mi 14. Apr 2010, 13:58

Beitrag von wiesengrund »

Hallo Tobi,

danke vielmals für das Beispiel. Es geht jetzt! Ich schick im Anhang mal eine Seite aus dem PDF - ich verstehe es nicht, aber es ist so:

Kopiere ich ein einzelnes "ä" rüber in Word, funktioniert es nicht.
Kopiere ich, aus diesem Dokument, das Wort "vervielfältigt", geht es. Die Information, die aus dem "a" ein "ä" macht, hängt irgendwie am Buchstaben, den nach dem "ä" kommt.

[T1]{fontenc} hat aber auf jeden Fall den sehr guten Effekt, dass die Buchstaben auch einzeln gefunden werden im PDF. Und kopiere ich jetzt einen einzelnen Buchstaben "ä" heraus, erscheint kein "a " (a und Leerzeichen) mehr sondern nur noch ein "a".

Ich weiss, mir täte eine fundierte Einarbeitung in LateX sehr gut, und ich verspreche, sowie ich Zeit habe, werde ich das tun (sei's in Kursform oder tatsächlich über PDF-Lektüren). Deine Tips (Skim) google ich gern selbst!

Natürlich hör ich mir weiter gerne an, was du von meinem Umlaut-"Problem" hältst/dazu sagst. Aus der aktuellen Notlage bin ich aber definitiv heraus, man kann die Sachen komplett rüberziehen in Word, insofern: Danke nochmals!

Daniel
Dateianhänge
testseite.pdf
(19.12 KiB) 622-mal heruntergeladen

Benutzeravatar
iTob
Forum-Meister
Forum-Meister
Beiträge: 1221
Registriert: Mo 19. Apr 2010, 22:19
Kontaktdaten:

Beitrag von iTob »

Komisch. Aber du hast recht. Einzelne Buchstaben kopieren geht nicht, Wörter kopieren schon; aber ich habe keine Ahnung, woran das liegt. Sorry … Aber es ist bei PDFs, die ich erstellt habe das selbe Phänomen, wie ich grade feststellen durfte.

Und weil das seltsam ist und ich das auch wissen will, lasse ich den Status vorerst auf „mit Vorschlag“.


Wenn du fragen zu Skim/tmx/LaTEX am Mac, dann kannst du auch ne PN schreiben.

Ich bin übrigens nicht sicher, ob ein Kurs wirklich was nutzt. bei uns anner Uni gab’s einen von Studenten gemachten. Der hat wenig gebracht und zum Teil wurden auch falsche/veraltete Sachen erzählt, wie ich inzwischen weiß. Und wenn du dir Syntax und das Grundprinzip von LaTeX verstanden hast, sollten es PDFs und Bücher auch tun denk ich ;)

Gute Nacht!
Tobi

Benutzeravatar
KOMA
TeX-Entwickler
TeX-Entwickler
Beiträge: 2958
Registriert: Fr 4. Jul 2008, 17:28
Kontaktdaten:

Beitrag von KOMA »

Ich habe eben mal das Beispiel von iTob unter Linux mit TeX Live 2010 durch pdflatex gejagt und dann per Copy&Paste aus xpdf sowohl ganze Wörter als auch einzelne Buchstaben erfolgreich in emacs eingefügt. Auch mit dem PDF aus http://www.golatex.de/viewtopic,p,24346.html#24346 hatte ich keine Probleme. Ich habe zwar nur mit ü und ö getestet, weil mir beim ä nicht gelungen ist, es ohne das f zu kopieren (die stehen durch das Kerning einfach zu dicht). Aber das war mit okular problemlos möglich. Den Adobe Reader und Word meide ich wie die Pest.

Benutzeravatar
iTob
Forum-Meister
Forum-Meister
Beiträge: 1221
Registriert: Mo 19. Apr 2010, 22:19
Kontaktdaten:

Beitrag von iTob »

Guten Morgen,

mit Word und dem Reader habe ich es auch nicht versucht. Gestern hab ich aus Skim und Vorschau.app in die Safarie-Suchleite kopiert.

Grad habe ich es noch mal mit TextEdit versucht und festgestellt, dass die Buchstaben unterschiedlich groß sind... allerdings nicht in allen Fonts, weshalb ich da auf ein Font-Problem schleißen würde. Aber es scheint tatsächlich so zu sein, als sei auch das ö im PDF trotz T1 zusammengesetzt. Komisch find ich das.
Hab dazu nen Screenshot in den Anhang geladen. Äußerem die auf meinem System erstellt PDF. Könntest du, KOMA, mal versuchen, wie es da mit dem kopieren aussieht, bitte? Wäre ja interessant, zu wissen, ob es an der PDF, dem Kompiler oder dem Viewer bzw. dem Betriebsystem, auf dem angezeigt/kopiert wird liegt.
Wenn ich das kopierte Wort „öse“ in den texmakerx (der auf latin1 eingestellt ist) kopiere, kann ich durch drücken der Rückschritttaste hinter dem ö erst die Punkte und dann das verbleibende o löschen. In Textedit, wird beides gleichzeitig gelöscht.

Es spricht einiges dafür, dass das verwendete ö keine einzelne Glyphe ist.


(Ich arbeite übrigens mit Mac OSX 10.6.5 und habe mein MacTeX/TeX Live gestern aktualisiert. Die Schrift in tmx ist die Consolas, im Screenshot zu sehen ist Monaco, aber bei der Consolas zeigt es sich ebenfalls.)

Grüße
Tobi
Dateianhänge
Bildschirmfoto 2010-11-12 um 10.42.30.jpg
Bildschirmfoto 2010-11-12 um 10.42.30.jpg (60.7 KiB) 6370 mal betrachtet
uml2.pdf
(87.28 KiB) 560-mal heruntergeladen

Antworten