Podręcznik użytkownika

Adobe PDF

Pliki PDF to popularna opcja do przechowywania i drukowania diagramów akordów i arkuszy tekstów piosenek. Być może używałeś plików PDF przez wiele lat do katalogowania swojej cyfrowej biblioteki. Format pliku Adobe PDF doskonale nadaje się do dokładnego reprezentowania wydrukowanej strony i jest przenośny między różnymi platformami komputerowymi. Przyjrzyjmy się niektórym wyzwaniom związanym z tym formatem pliku i sposobom ekstrakcji tekstu, aby uzyskać najlepsze wyniki.

Pliki Adobe PDF są wyświetlane „w stanie niezmiennym" w aplikacji OnSong i nie można ich edytować, formatować ani używać w trybie słabego oświetlenia. Chociaż pliki te mogą zawierać tekst, jest on umieszczony na wirtualnej stronie w taki sposób, aby umożliwić jego drukowanie, a nie aby był łatwo zrozumiały lub modyfikowalny przez inne aplikacje. Dodatkowo pliki PDF mogą również składać się z grafiki, zeskanowanych obrazów lub dowolnej kombinacji tych elementów. Mogą być również zaszyfrowane, co chroni ich zawartość przed ekstrahowaniem. Z tego powodu każdy plik PDF jest inny, więc nie ma sposobu na idealną konwersję do dokumentu tekstowego.

Możesz wyodrębnić tekst z pliku PDF w aplikacji OnSong za pomocą Edytora Piosenek i dotknąć przycisku Wyodrębnij Tekst na Pasku Narzędzi Konwersji, który pojawia się przed ujawnieniem klawiatury ekranowej. OnSong spróbuje najpierw wyodrębnić tekst z pliku PDF, a jeśli tekst nie będzie dostępny, przetworzy plik za pomocą optycznego rozpoznawania znaków (OCR). Wynik najprawdopodobniej zakończy się tekstem, ale będziesz musiał przejrzeć i dostosować tekst do formatu pliku, który OnSong rozumie. Ponadto jeśli plik był zaszyfrowany, wynik ekstrakcji może spowodować pojawienie się zniekształconych znaków. Te pliki nie mogą być ekstrahowane ze względu na ochronę stosowaną przez oprogramowanie autorskie.

Oto niektóre problemy, które możesz mieć w ekstrahowanych plikach PDF:

Złe Odstępy

Możesz stwierdzić, że niektóre teksty są ułożone w złej kolejności lub ze słabymi odstępami. Dzieje się tak, ponieważ pliki PDF mogą używać skrótów tekstowych do wyrównywania tekstu przy użyciu wielu fragmentów tekstu. OnSong pracuje nad umieszczaniem tych fragmentów tekstu w pobliżu siebie przy użyciu obliczeń bliskości ramki, ale mogą nadal występować problemy wymagające ręcznej korekty.

Akordy z Dodatkowymi Spacjami

Każdy diagram akordu jest tworzony inaczej w zależności od autora i używanego oprogramowania. Na przykład oryginalny plik mógł mieć wiele znaków spacji użytych do wyrównania akordów nad tekstem. Jeśli zostanie użyta czcionka o zmiennej szerokości, może to spowodować użycie znacznie więcej spacji niż tekst poniżej. Użyj Napraw Odstępy Wyrównania znalezionego w Menu Narzędzi Tekstu znalezionym na Pasku Menu Edytora Piosenek, aby przybliżyć te akordy do ich pozycji, a następnie ręcznie dostosuj je w razie potrzeby.

Skompresowane Akordy

Innym problemem mogą być akordy zbyt blisko siebie w linii nad akordami. Może się to zdarzyć, jeśli akordy zostały pierwotnie umieszczone w polach tekstowych, a następnie wyrównane nad akordami. Będziesz musiał ręcznie wyrównać te akordy nad odpowiadającym im tekstem w Edytorze Piosenek.

Zniekształcone Znaki

Jeśli spróbujesz wyodrębnić tekst z zaszyfrowanego dokumentu PDF, może to spowodować ekran pełny znaków. Będziesz musiał cofnąć proces ekstrakcji lub zamknąć Edytor Piosenek i znaleźć inny sposób na ekstrakcję tekstu.

Nierozpoznane Znaki

Jeśli OnSong nie może wyodrębnić tekstu z dokumentu bezpośrednio, może być konieczne przesłanie dokumentu do optycznego rozpoznawania znaków (OCR). Oznacza to, że komputer będzie próbować „czytać" dokument wizualnie. W zależności od jakości pliku PDF, może to spowodować użycie niewłaściwego znaku. Na przykład, jeśli dokument zawierał symbol bemola, może być interpretowany jako mała litera „b", lub jeśli plik PDF został zeskanowany, zanikające tekst może spowodować pojawienie się innych znaków. Przejrzyj dokument i dokonaj tych ręcznych zmian w razie potrzeby w Edytorze Piosenek.

OnSong 2026 — Ostatnia aktualizacja January 13, 2020