PDF Ligaturen herauskopieren (cmap)

Antwort erstellen


Diese Frage dient dazu, das automatisierte Versenden von Formularen durch Spam-Bots zu verhindern.
Smilies
:D :) :( :o :shock: :? 8) :lol: :-x :P :oops: :cry: :evil: :twisted: :roll: :wink: :!: :?: :idea: :arrow: :| :mrgreen:

BBCode ist eingeschaltet
[img] ist eingeschaltet
[flash] ist ausgeschaltet
[url] ist eingeschaltet
Smilies sind eingeschaltet

Die letzten Beiträge des Themas

Ich habe die Datenschutzerklärung gelesen und bin damit einverstanden.

   

Wenn du eine Datei oder mehrere Dateien anhängen möchtest, gib die Details unten ein.

Ansicht erweitern Die letzten Beiträge des Themas: PDF Ligaturen herauskopieren (cmap)

von yoyo_latex » Di 19. Jan 2010, 23:50

Hallo, ich habe nun folgendes bei mir im Header stehen, und kann auch Ligaturen aus der PDF suchen + kopieren im Adobe Reader 9.3 funktioniert wunderbar, sogar bei Worttrennung am Zeilenende.

aber zum Bsp. das Wort "oberfläche", da kommt der PDF XChange Viewer 2.0 einfach nicht hinter her.
%Ausgabe von ü,ä,ö,ß in der PDF
%sorgt dafür, dass T1 Fonts benutzt werden
\usepackage[T1]{fontenc}

%Deutsche Trennungen, Anführungsstriche und mehr:
\usepackage[ngerman]{babel}

%Eingabe von ü,ä,ö,ß erlauben
%sorgt dafür, dass man Umlaute direkt im Quellcode angeben kann
\usepackage[cp1252,ansinew]{inputenc} % Windows 3.1 ANSI encoding, extension of Latin-1 (synonym1 for cp1252).

% laden von "lmodern" Font + "textcomp" einige Sonderzeichen
% damit werden dann auch ß und Umlaute richtig in der PDF dargestellt.
\usepackage{lmodern}
\usepackage{textcomp} 

PDF Ligaturen herauskopieren (cmap)

von mako » So 25. Okt 2009, 16:35

Hi, ich würde gerne Texte aus meinem PDF herauskopieren bzw. fröhlich darin herumsuchen können.
Bei Wörtern mit Umlaute kein Problem. Aber bei Ligaturen geht es nicht.
\usepackage[utf8]{inputenc}
\usepackage{cmap}
\usepackage[T1]{fontenc}
\usepackage{lmodern}
Hab dazu mal ff, fl, fi, ffl, ffi ausprobiert.
Im PDF-XChange gehen davon: fl und fi
Im Foxit Reader keines davon.

Wenn ich als Schrift "libertine" benutze: U, W, V, Y, X im PDF-XChange und im Foxit Reader.
Bei "mathpazo" geht alles, liegt aber wohl daran, dass sich bei der Palatino sowieso keine Ligaturen bilden. ;)

Was kann man dagegen machen?

Nach oben