Brukerhåndbok

Adobe PDF

PDF-filer er et populært alternativ for lagring og utskrift av akkordskjemaer og lyrkarks. Du har kanskje brukt PDF-filer i årevis til å katalogisere ditt digitale bibliotek. Adobe PDF-filformatet er utmerket for nøyaktig å representere den trykte siden og er portabelt mellom forskjellige dataplatformer. La oss ta en titt på noen utfordringer med dette filformatet og måter vi kan trekke ut tekst for best mulige resultater.

Adobe PDF-filer vises «som de er» i OnSong og kan ikke redigeres, formateres eller delta i dimmemodus. Selv om disse filene kan inneholde tekst, er den plassert på den virtuelle siden på en måte som gjør det mulig å skrive den ut, og ikke lett forstått eller endret av andre apper. I tillegg kan PDF-filer også bestå av grafikk eller skannet bilder, eller en kombinasjon av disse. De kan også være kryptert, noe som beskytter innholdet deres fra å bli ekstrahert. På grunn av dette er hver PDF-fil annerledes, så det er ingen måte å håndtere perfekt konvertering til et tekstbasert dokument.

Du kan trekke ut teksten fra en PDF-fil innenfor OnSong ved hjelp av Sangredigering og tapping på Ekstraher tekst-knappen i Konverteringsverktøylinja som vises før på-skjerm-tastaturet blir avslørt. OnSong vil først forsøke å trekke ut teksten fra PDF-filen, og hvis ingen tekst er tilgjengelig, vil den behandle filen ved hjelp av optisk tegngjenkjenning (OCR). Resultatet vil mest sannsynlig ende opp med tekst, men du må gjennomgå og justere teksten til et filformat som OnSong forstår. I tillegg, hvis filen var kryptert, kan resultatet av ekstraksjonen resultere i uleselig tegn. Disse filene kan ikke ekstraheres på grunn av beskyttelsen som er brukt på dem av forfatteringsprogramvaren.

Her er noen problemer du kan ha med ekstraherte PDF-filer:

Dårlig mellomrom

Du kan finne at noe tekst er plassert utenfor rekkefølge, eller med dårlig mellomrom. Dette er fordi PDF-filer kan bruke tekstsnarveier til å justere tekst ved hjelp av flere tekstfragmenter. OnSong arbeider for å plassere disse tekstfragmentene i nærhet til hverandre ved hjelp av beregninger av rammenærhet, men det kan fortsatt være problemer som krever at du manuelt korrigerer dette.

Akkorder med ekstra mellomrom

Hvert akkordskjema er opprettet annerledes avhengig av forfatter og programvaren som brukes. For eksempel kan den opprinnelige filen ha hatt flere mellomromstegn som ble brukt til å justere akkorder over tekst. Hvis en variabel bredde-font brukes, kan dette resultere i at mange flere mellomrom brukes enn teksten nedenfor. Bruk Fiks justeringsmellomrom funnet i Tekst-verktøymeny funnet i Menylinja av Sangredigering for å bringe disse akkordene nærmere deres posisjon og deretter justere manuelt etter behov.

Komprimerte akkorder

Et annet problem kan være akkorder som er for tett sammen på en linje over akkordene. Dette kan skje hvis akkorder opprinnelig var plassert i tekstbokser og deretter justert over akkorder. Du må manuelt justere disse akkordene over den tilsvarende teksten i Sangredigering.

Uleselig tegn

Hvis du forsøker å trekke ut tekst fra et kryptert PDF-dokument, kan det resultere i en fullskjerm av tegn. Du må tilbakestille ekstraksjonsprosessen eller avbryte Sangredigering og finne en annen måte å trekke ut tekst.

Ukjente tegn

Hvis OnSong ikke kan trekke ut teksten fra dokumentet direkte, kan det være nødvendig å sende dokumentet til optisk tegngjenkjenning (OCR). Dette betyr at en datamaskin vil forsøke å «lese» dokumentet visuelt. Avhengig av kvaliteten på PDF-en, kan dette resultere i at feil tegn blir brukt. For eksempel, hvis dokumentet ditt hadde et molltegn, kan det bli tolket som en liten bokstav «b», eller hvis PDF-en var skannet, kan falmet tekst resultere i andre tegn. Gjennomgå dokumentet og gjør disse manuelle endringene etter behov i Sangredigering.

OnSong 2023 — Sist oppdatert January 13, 2020