Användarmanual
Adobe PDF
PDF-filer är ett populärt alternativ för att lagra och skriva ut ackordsscheman och textark. Du kanske har använt PDF-filer i flera år för att katalogisera ditt digitala bibliotek. Adobe PDF-filformatet är utmärkt för att noggrant representera den tryckta sidan och är portabel mellan olika datorplattformar. Låt oss titta på några utmaningar med detta filformat och sätt vi kan extrahera text för bästa resultat.
Adobe PDF-filer visas "som de är" i OnSong och kan inte redigeras, formateras eller delta i lågt ljusläge. Även om dessa filer kan innehålla text, placeras den på den virtuella sidan på ett sätt som gör att den kan skrivas ut och inte lätt förstås eller ändras av andra appar. Dessutom kan PDF-filer också bestå av grafik eller skannade bilder, eller någon kombination av dessa. De kan också vara krypterade, vilket skyddar deras innehål från att extraheras. På grund av detta är varje PDF-fil olika, så det finns inget sätt att hantera perfekt konvertering till ett textbaserat dokument.
Du kan extrahera texten från en PDF-fil inom OnSong genom att använda Songredigeraren och trycka på knappen Extrahera text i Konverteringsverktygsfältet som visas innan skärmtangentbordet öppnas. OnSong kommer först att försöka extrahera texten från PDF-filen, och om ingen text är tillgänglig, kommer den att bearbeta filen med optisk teckenigenkänning (OCR). Resultatet kommer högst troligt att sluta med text, men du måste granska och justera texten till ett filformat som OnSong förstår. Dessutom, om filen var krypterad, kan resultatet av extraheringen resultera i förvrängda tecken. Dessa filer kan inte extraheras på grund av det skydd som tillämpas på dem av redigeringsprogramvaran.
Här är några problem du kan ha med extraherade PDF-filer:
Dåligt avstånd
Du kan upptäcka att viss text är placerad i fel ordning eller med dåligt avstånd. Detta beror på att PDF-filer kan använda genvägar för text för att justera text med flera textfragment. OnSong arbetar med att placera dessa textfragment i närheten av varandra genom att använda beräkningar av ramgräns, men det kan fortfarande finnas problem som kräver att du manuellt korrigerar detta.
Ackord med extra mellanslag
Varje ackordsschema skapas olika beroende på författaren och programvaran som används. Till exempel kan originalfilen ha haft flera teckenblanktecken för att justera ackord ovanför texter. Om ett teckensnitt med variabel bredd används, kan detta resultera i många fler mellanslag än texten nedan. Använd Åtgärda justeringsmellanslag som finns i Textverktygsmenyn som finns i Menyraden i Songredigeraren för att få dessa ackord närmare sin position och justera sedan manuellt efter behov.
Komprimerade ackord
Ett annat problem kan vara ackord som är för tätt tillsammans på en rad ovanför ackordens. Detta kan inträffa om ackord ursprungligen placerats i textrutor och sedan justerats ovanför ackord. Du måste manuellt justera dessa ackord över motsvarande texter i Songredigeraren.
Förvrängda tecken
Om du försöker extrahera text från ett krypterat PDF-dokument kan det resultera i en skärmfull av tecken. Du måste återgå till extraheringsprocessen eller avsluta Songredigeraren och hitta ett annat sätt att extrahera text.
Okända tecken
Om OnSong inte kan extrahera texten från dokumentet direkt, kan det behöva skicka dokumentet till optisk teckenigenkänning (OCR). Detta betyder att en dator kommer att försöka "läsa" dokumentet visuellt. Beroende på PDF-filens kvalitet kan detta resultera i att fel tecken används. Om ditt dokument till exempel hade en flatsymbol kan det tolkas som en gemener "b", eller om PDF-filen skannades kan blekt text resultera i andra tecken. Granska dokumentet och gör dessa manuella ändringar efter behov i Songredigeraren.