מדריך המשתמש
Adobe PDF
קובצי PDF הם אפשרות פופולרית לאחסון והדפסה של דפי אקורדים וגיליונות מילים. ייתכן שהשתמשת בקובצי PDF במשך שנים כדי לקטלוג את הספרייה הדיגיטלית שלך. פורמט הקובץ Adobe PDF מעולה לייצוג מדויק של הדף המודפס וניתן להעברה בין פלטפורמות מחשב שונות. בואו נסתכל על כמה אתגרים עם פורמט קובץ זה והדרכים שבהן נוכל לחלץ טקסט לתוצאות הטובות ביותר.
קובצי Adobe PDF מוצגים "כפי שהם" ב-OnSong ולא ניתן לערוך, לעצב או להשתתף ב-מצב אור נמוך. למרות שקובצים אלה עשויים להכיל טקסט, הוא ממוקם בדף הווירטואלי בצורה המאפשרת הדפסה, ולא בקלות מובנת או שניתן לשנות אותה על ידי אפליקציות אחרות. בנוסף, קובצי PDF יכולים להיות מורכבים מגרפיקה או תמונות סרוקות, או כל שילוב של אלה. הם יכולים גם להיות מוצפנים, מה שמגן על תוכנם מחילוץ. בגלל זה, כל קובץ PDF שונה, כך שאין דרך להתמודד עם המרה מושלמת למסמך מבוסס טקסט.
אתה יכול לחלץ את הטקסט של קובץ PDF ב-OnSong באמצעות עורך השירים והקשה על כפתור חילוץ טקסט ב-סרגל כלים המרה שמופיע לפני שלוח המקשים על המסך מתגלה. OnSong ינסה לחלץ את הטקסט מקובץ ה-PDF תחילה, ואם אין טקסט זמין, הוא יעבד את הקובץ באמצעות הכרה אופטית בתווים (OCR). התוצאה כמעט בודאות תסתיים בטקסט, אך תצטרך לבדוק ולהתאים את הטקסט ל-פורמט קובץ שה-OnSong מבין. בנוסף, אם הקובץ היה מוצפן, תוצאת החילוץ עשויה להסתיים בתווים מבולבלים. קובצים אלה אינם יכולים להיות מחולצים בגלל ההגנה המוחלת עליהם על ידי תוכנת יצירה.
הנה כמה בעיות שייתכן שיש לך עם קובצי PDF מחולצים:
ריווח גרוע
ייתכן שתגיד שחלק מהטקסט ממוקם בסדר שגוי, או עם ריווח גרוע. זה בגלל שקובצי PDF עשויים להשתמש בקיצורי דרך בטקסט כדי ליישר טקסט באמצעות מספר שברי טקסט. OnSong עובד כדי למקם את שברי הטקסט הללו בקרבת זה לזה תוך שימוש בחישובי קרבת מסגרת, אך עדיין עשויות להיות בעיות שדורשות ממך לתקן זאת ידנית.
אקורדים עם מרווחים נוספים
כל דף אקורדים נוצר בצורה שונה בהתאם למחבר ולתוכנה בה נעשה שימוש. לדוגמה, הקובץ המקורי עשוי היה מכיל תווים רווח מרובים שימשו ליישור אקורדים מעל מילים. אם משתמשים בגופן בעל רוחב משתנה, זה עשוי לגרום להשימוש בהרבה יותר רווחים מאשר המילים למטה. השתמש ב-תקן מרווחי יישור שנמצא ב-תפריט כלים טקסט שנמצא ב-סרגל התפריטים של עורך השירים כדי להחזיר את האקורדים הללו למקום קרוב יותר לעמדתם ואז התאם ידנית לפי הצורך.
אקורדים דחוסים
בעיה נוספת עשויה להיות אקורדים קרובים מדי זה לזה בשורה מעל האקורדים. זה יכול להתרחש אם אקורדים הוצבו במקור בתיבות טקסט ואז יושרו מעל אקורדים. תצטרך ליישר ידנית את האקורדים הללו מעל המילים התואמות ב-עורך השירים.
תווים מבולבלים
אם תנסה לחלץ טקסט ממסמך PDF מוצפן, זה עשוי לגרום למסך מלא בתווים. תצטרך לשחזר את תהליך החילוץ או לצאת מ-עורך השירים ולמצוא דרך שונה לחילוץ טקסט.
תווים לא מוכרים
אם ה-OnSong לא יכול לחלץ את הטקסט מהמסמך ישירות, ייתכן שיהיה עליו להגיש את המסמך לזיהוי תווים אופטיים (OCR). זה אומר שמחשב ינסה "לקרוא" את המסמך בחזותי. בהתאם לאיכות ה-PDF, זה עשוי להסתיים בשימוש בתו שגוי. לדוגמה, אם המסמך שלך היה סימן דירה, ייתכן שהוא יופרש כאות קטנה "b", או אם ה-PDF היה סרוק, טקסט דהוי עשוי להסתיים בתווים אחרים. בדוק את המסמך ובצע את השינויים הידניים הללו לפי הצורך ב-עורך השירים.