Uživatelská příručka
Adobe PDF
Soubory PDF jsou oblíbenou možností pro ukládání a tisk akordových schémat a textů písní. Možná jste používali soubory PDF již několik let na katalogizaci své digitální knihovny. Formát souboru Adobe PDF je skvělý pro přesné zastoupení tištěné stránky a je přenosný mezi různými počítačovými platformami. Podívejme se na některé výzvy s tímto formátem souboru a způsoby, jak můžeme extrahovat text pro dosažení nejlepších výsledků.
Soubory Adobe PDF se v OnSong zobrazují „tak jak jsou" a nemohou být upravovány, formátovány nebo se účastnit režimu nízké osvětlení. Ačkoli tyto soubory mohou obsahovat text, je umístěn na virtuální stránce způsobem, který umožňuje jeho tisk, a není snadno pochopitelný nebo upravitelný dalšími aplikacemi. Navíc soubory PDF mohou také obsahovat grafiku nebo naskenované obrázky, nebo jakoukoli kombinaci těchto prvků. Mohou být také šifrovány, což chrání jejich obsah před extrahováním. Z tohoto důvodu je každý soubor PDF jiný, takže neexistuje způsob, jak dosáhnout dokonalé konverze na textový dokument.
Můžete extrahovat text souboru PDF v OnSong pomocí Editoru písní a klepnutím na tlačítko Extrahovat text v Panelu nástrojů konverze, který se objeví před odhalením klávesnice na obrazovce. OnSong se pokusí nejdříve extrahovat text ze souboru PDF, a pokud není k dispozici žádný text, zpracuje soubor pomocí optického rozpoznávání znaků (OCR). Výsledek s největší pravděpodobností skončí textem, ale budete muset zkontrolovat a upravit text na formát souboru, kterému OnSong rozumí. Navíc, pokud byl soubor šifrován, výsledek extrakce může mít za následek zkomolené znaky. Tyto soubory nelze extrahovat z důvodu ochrany aplikované autorským softwarem.
Zde jsou některé problémy, které se mohou vyskytnout u extrahovaných souborů PDF:
Špatné rozestupy
Můžete zjistit, že některý text je umístěn mimo pořadí nebo se špatnými mezerami. Je to proto, že soubory PDF mohou používat textové zkratky k zarovnání textu pomocí více textových fragmentů. OnSong se snaží umístit tyto textové fragmenty blízko sebe pomocí výpočtů blízkosti rámce, ale stále mohou existovat problémy, které vyžadují ruční opravu.
Akordy s extra mezerami
Každé akordové schéma je vytvořeno jinak v závislosti na autorovi a používaném softwaru. Například původní soubor mohl mít více znaků mezer používaných k zarovnání akordů nad text. Pokud je použito písmo s variabilní šířkou, může to mít za následek použití mnohem více mezer než text níže. Použijte Opravit mezery zarovnání nalezené v Nabídce nástrojů textu nalezené v Nabídce Editoru písní, aby se ty akordy vrátily blíže k jejich pozici a poté ručně upravte podle potřeby.
Seslabené akordy
Dalším problémem mohou být akordy, které jsou příliš blízko sebe na řádku nad akordy. To se může stát, pokud byly akordy původně umístěny do textových polí a poté zarovnány nad akordy. Budete muset ručně zarovnat tyto akordy nad odpovídajícím textem v Editoru písní.
Zkomolené znaky
Pokud se pokusíte extrahovat text z šifrovaného dokumentu PDF, může se to projevit obrazovkou plnou znaků. Budete muset vrátit proces extrakce nebo zavřít Editor písní a najít jiný způsob, jak extrahovat text.
Nepoznané znaky
Pokud OnSong nemůže extrahovat text z dokumentu přímo, může být nutné odeslat dokument k optickému rozpoznávání znaků (OCR). To znamená, že počítač se pokusí dokument „přečíst" vizuálně. V závislosti na kvalitě PDF to může mít za následek použití nesprávného znaku. Například pokud váš dokument měl symbol plochý, může být interpretován jako malé písmeno „b", nebo pokud byl dokument naskenován, vybledlý text může mít za následek další znaky. Zkontrolujte dokument a proveďte tyto ruční změny podle potřeby v Editoru písní.