دليل المستخدم
Adobe PDF
ملفات PDF خيار شهير لتخزين وطباعة مخططات الأوتار وأوراق الكلمات. قد تكون قد استخدمت ملفات PDF لسنوات لفهرسة مكتبتك الرقمية. تنسيق Adobe PDF رائع لتمثيل الصفحة المطبوعة بدقة وهو محمول بين منصات الكمبيوتر المختلفة. دعنا نلقي نظرة على بعض التحديات مع هذا التنسيق وطرق استخراج النص للحصول على أفضل النتائج.
يتم عرض ملفات Adobe PDF "كما هي" في OnSong ولا يمكن تعديلها أو تنسيقها أو المشاركة في وضع الإضاءة المنخفضة. بينما قد تحتوي هذه الملفات على نص، فإنه يتم وضعه على الصفحة الافتراضية بطريقة تمكنه من الطباعة، وليس بسهولة يمكن فهمه أو تعديله بواسطة تطبيقات أخرى. بالإضافة إلى ذلك، قد تتكون ملفات PDF أيضًا من رسومات أو صور ممسوحة ضوئيًا، أو أي مزيج من هذه. يمكن أيضًا تشفيرها، مما يحمي محتوياتها من الاستخراج. لذلك، كل ملف PDF مختلف لذلك لا توجد طريقة للتعامل مع تحويل مثالي إلى مستند نصي.
يمكنك استخراج نص ملف PDF داخل OnSong باستخدام محرر الأغنية والنقر على زر استخراج النص في شريط أدوات التحويل الذي يظهر قبل الكشف عن لوحة المفاتيح على الشاشة. سيحاول OnSong استخراج النص من ملف PDF أولاً، وإذا لم يكن هناك نص متاح، فسيعالج الملف باستخدام التعرف البصري على الأحرف (OCR). ستنتهي النتيجة على الأرجح بنص، لكنك ستحتاج إلى مراجعة وتعديل النص إلى تنسيق ملف يفهمه OnSong. بالإضافة إلى ذلك، إذا كان الملف مشفرًا، فقد تؤدي نتيجة الاستخراج إلى أحرف مشوشة. لا يمكن استخراج هذه الملفات بسبب الحماية المطبقة عليها بواسطة برنامج التأليف.
فيما يلي بعض المشاكل التي قد تواجهها مع ملفات PDF المستخرجة:
المسافات السيئة
قد تجد أن بعض النصوص موضوعة بشكل غير صحيح أو بمسافات سيئة. هذا لأن ملفات PDF قد تستخدم اختصارات نصية لمحاذاة النص باستخدام أجزاء نصية متعددة. يعمل OnSong على وضع هذه الأجزاء النصية بالقرب من بعضها البعض باستخدام حسابات قرب الإطار، لكن قد تكون هناك مشاكل تتطلب تصحيحًا يدويًا منك.
الأوتار التي تحتوي على مسافات إضافية
يتم إنشاء كل مخطط وتر بشكل مختلف اعتمادًا على المؤلف والبرنامج المستخدم. على سبيل المثال، قد يكون الملف الأصلي قد استخدم عدة أحرف مسافة لمحاذاة الأوتار فوق الكلمات. إذا تم استخدام خط بعرض متغير، فقد ينتج عن ذلك استخدام مسافات أكثر بكثير من الكلمات أدناه. استخدم إصلاح مسافات المحاذاة الموجود في قائمة أدوات النص الموجودة في شريط القائمة لـ محرر الأغنية لإعادة تلك الأوتار أقرب إلى موضعها ثم أجري التعديلات يدويًا حسب الحاجة.
الأوتار المضغوطة
قد تكون مشكلة أخرى هي الأوتار التي تكون قريبة جدًا من بعضها على السطر فوق الأوتار. يمكن أن يحدث هذا إذا تم وضع الأوتار في الأصل في صناديق نصية ثم محاذاتها فوق الأوتار. ستحتاج إلى محاذاة تلك الأوتار يدويًا فوق الكلمات المقابلة في محرر الأغنية.
أحرف مشوشة
إذا حاولت استخراج نص من مستند PDF مشفر، فقد ينتج عن ذلك شاشة مليئة بالأحرف. ستحتاج إلى التراجع عن عملية الاستخراج أو الإغلاق من محرر الأغنية والبحث عن طريقة مختلفة لاستخراج النص.
أحرف غير معروفة
إذا لم يتمكن OnSong من استخراج النص من المستند مباشرة، فقد يحتاج إلى تقديم المستند للتعرف البصري على الأحرف (OCR). هذا يعني أن الكمبيوتر سيحاول "قراءة" المستند بصريًا. اعتمادًا على جودة PDF، قد ينتج عن ذلك استخدام حرف غير صحيح. على سبيل المثال، إذا كان لديك رمز شقة في مستندك، فقد يتم تفسيره كحرف صغير "b"، أو إذا تم مسح PDF ضوئيًا، فقد تؤدي النصوص الباهتة إلى أحرف أخرى. راجع المستند واجعل هذه التغييرات يدويًا حسب الحاجة في محرر الأغنية.