PDF Ligaturen herauskopieren (cmap) Thema ist als GELÖST markiert

Fragen und Probleme, die nicht den obigen Kategorien zugeordnet werden können


mako

PDF Ligaturen herauskopieren (cmap)

Beitrag von mako »

Hi, ich würde gerne Texte aus meinem PDF herauskopieren bzw. fröhlich darin herumsuchen können.
Bei Wörtern mit Umlaute kein Problem. Aber bei Ligaturen geht es nicht.
\usepackage[utf8]{inputenc}
\usepackage{cmap}
\usepackage[T1]{fontenc}
\usepackage{lmodern}
Hab dazu mal ff, fl, fi, ffl, ffi ausprobiert.
Im PDF-XChange gehen davon: fl und fi
Im Foxit Reader keines davon.

Wenn ich als Schrift "libertine" benutze: U, W, V, Y, X im PDF-XChange und im Foxit Reader.
Bei "mathpazo" geht alles, liegt aber wohl daran, dass sich bei der Palatino sowieso keine Ligaturen bilden. ;)

Was kann man dagegen machen?

yoyo_latex
Forum-Newbie
Forum-Newbie
Beiträge: 5
Registriert: Mi 2. Dez 2009, 11:56
Wohnort: Berlin

Beitrag von yoyo_latex »

Hallo, ich habe nun folgendes bei mir im Header stehen, und kann auch Ligaturen aus der PDF suchen + kopieren im Adobe Reader 9.3 funktioniert wunderbar, sogar bei Worttrennung am Zeilenende.

aber zum Bsp. das Wort "oberfläche", da kommt der PDF XChange Viewer 2.0 einfach nicht hinter her.
%Ausgabe von ü,ä,ö,ß in der PDF
%sorgt dafür, dass T1 Fonts benutzt werden
\usepackage[T1]{fontenc}

%Deutsche Trennungen, Anführungsstriche und mehr:
\usepackage[ngerman]{babel}

%Eingabe von ü,ä,ö,ß erlauben
%sorgt dafür, dass man Umlaute direkt im Quellcode angeben kann
\usepackage[cp1252,ansinew]{inputenc} % Windows 3.1 ANSI encoding, extension of Latin-1 (synonym1 for cp1252).

% laden von "lmodern" Font + "textcomp" einige Sonderzeichen
% damit werden dann auch ß und Umlaute richtig in der PDF dargestellt.
\usepackage{lmodern}
\usepackage{textcomp} 

Antworten