ユーザーマニュアル
Adobe PDF
PDFファイルは、コードチャートと歌詞シートを保存および印刷するための一般的なオプションです。長年にわたってPDFファイルを使用してデジタルライブラリをカタログ化してきた可能性があります。Adobe PDFファイル形式は、印刷されたページを正確に表現するのに優れており、異なるコンピュータプラットフォーム間で移植可能です。このファイル形式の課題と、最良の結果を得るためにテキストを抽出する方法を見てみましょう。
Adobe PDFファイルはOnSongで「そのまま」表示され、編集、フォーマット、または低光モードに参加することができません。これらのファイルにはテキストが含まれている場合がありますが、印刷できるように仮想ページに配置されており、他のアプリによって簡単に理解または変更できません。さらに、PDFファイルはグラフィックスまたはスキャンされた画像、またはこれらの組み合わせで構成されることもあります。また、暗号化される場合もあり、その内容の抽出から保護されます。このため、すべてのPDFファイルは異なるため、テキストベースのドキュメントへの完全な変換を処理する方法はありません。
Song Editor内でOnSongを使用してPDFファイルのテキストを抽出し、オンスクリーンキーボードが表示される前に表示されるConversion ToolbarのExtract Textボタンをタップできます。OnSongはまずPDFファイルからテキストを抽出しようとします。テキストが利用できない場合は、光学文字認識(OCR)を使用してファイルを処理します。結果はほとんどの場合テキストで終わりますが、OnSongが理解できるファイル形式にテキストをレビューして調整する必要があります。さらに、ファイルが暗号化されていた場合、抽出の結果は文字化けになる可能性があります。これらのファイルは、編集ソフトウェアによって適用された保護により、抽出できません。
抽出したPDFファイルで発生する可能性のある問題を次に示します。
不適切な間隔
テキストが順不同で配置されているか、間隔が不適切な場合があります。これは、PDFファイルがテキストショートカットを使用してテキストを複数のテキストフラグメントを使用して配置する場合があるためです。OnSongはフレーム近接計算を使用して、これらのテキストフラグメントを相互に近接させるために機能しますが、手動で修正する必要がある問題が発生する場合があります。
余分なスペース付きのコード
すべてのコードチャートは、作成者とソフトウェアによって異なる方法で作成されます。たとえば、元のファイルに複数のスペース文字があり、歌詞の上にコードを配置するために使用されていた場合があります。可変幅フォントを使用する場合、これにより、以下の歌詞よりも多くのスペースが使用される場合があります。Song EditorのMenubarにあるText Tools Menuで見つかったFix Alignment Spacesを使用して、これらのコードを位置に近づけ、必要に応じて手動で調整します。
圧縮されたコード
別の問題は、コード上のラインで互いに近すぎるコードである可能性があります。これは、コードが元々テキストボックスに配置され、コード上に配置された場合に発生する可能性があります。Song Editorで、対応する歌詞の上にそれらのコードを手動で配置する必要があります。
文字化け
暗号化されたPDFドキュメントからテキストを抽出しようとすると、文字で満たされた画面が表示される場合があります。抽出プロセスを戻すか、Song Editorから取り消して、テキストを抽出する別の方法を見つける必要があります。
認識されない文字
OnSongがドキュメントからテキストを直接抽出できない場合、ドキュメントを光学文字認識(OCR)に送信する必要があります。これは、コンピュータがドキュメントを視覚的に「読む」ことを試みることを意味します。PDFの品質に応じて、これは不適切な文字が使用されることになる場合があります。たとえば、ドキュメントにフラットシンボルがあった場合、小文字の「b」として解釈される場合があります。または、PDFがスキャンされた場合、フェードされたテキストが他の文字を引き起こす可能性があります。ドキュメントをレビューし、Song Editorで必要に応じてこれらの手動変更を行います。