ස්කෑන් සහ OCR

සුබ දවසක්

ඔබ කඩදාසි ලේඛනයක් ඉලෙක්ට්රොනික ආකාරයකට පරිවර්ථනය කිරීමට අවශ්ය වූ විට අප සෑම කෙනෙකුම කාර්යයට මුහුණ දුන්නා. මෙය අධ්යයනය කිරීම, ලේඛනගත කිරීම සමග වැඩ කිරීම, විද්යුත් ශබ්ද කෝෂ භාවිතා කරමින් පෙළපොත් පරිවර්තනය කිරීම විශේෂයෙන්ම මෙය අවශ්ය වේ.

මෙම ලිපියෙන් මම මෙම ක්රියාවලියේ මූලික කරුණු කිහිපයක් බෙදා ගැනීමට කැමතියි. සාමාන්යයෙන් ස්කෑන් කිරීම සහ පෙළ හඳුනා ගැනීම බොහෝ විට පරිභෝජනය කරයි, බොහෝ මෙහෙයුම් අතින් සිදු කිරීමට සිදු වේ. අප කුමක්, කෙසේද සහ ඇයි දැයි සොයා ගැනීමට අපි උත්සාහ කරමු.

හැමෝම වහාම එක දෙයක් තේරුම් ගන්න එපා. ස්කෑන් කිරීම (ස්කෑනර් මත සියලු තහඩු සවිකිරීමෙන්) ඔබට ආකෘතිය BMP, JPG, PNG, GIF (මෙහි වෙනත් ආකෘති තිබිය හැක) ඔබට පින්තූර ඇත. එබැවින් මෙම පින්තූරයේ සිට ඔබට පෙළ ලබා ගත යුතුය - මෙම ක්රියා පටිපාටිය පිළිගැනීමක් ලෙස හැඳින්වේ. මෙම ඇණවුමෙන් පහත දැක්වෙන පරිදි ඉදිරිපත් කරනු ලැබේ.

අන්තර්ගතය

  • 1. ස්කෑන් කිරීම සහ හඳුනා ගැනීම සඳහා අවශ්ය වන්නේ කුමක්ද?
  • 2. පෙළ ස්කෑනිං විකල්පයන්
  • 3. ලේඛනයේ පිටපත හඳුනා ගැනීම
    • 3.1 පෙළ
    • 3.2 පිංතූර
    • 3.3 වගු
    • 3.4 අනවශ්ය භාණ්ඩ
  • 4. PDF / DJVU ගොනු හඳුනා ගැනීම
  • 5. රැකියා ප්රතිඵල පරීක්ෂා කිරීම සහ සුරැකීමේ දෝෂය

1. ස්කෑන් කිරීම සහ හඳුනා ගැනීම සඳහා අවශ්ය වන්නේ කුමක්ද?

1) ස්කෑනර්

මුද්රිත ලිපි ලේඛන පෙළ ආකෘති පත්රයට පරිවර්ථනය කිරීම සඳහා, ඔබට මුලින්ම ස්කෑනරය අවශ්ය වන අතර, ඒ අනුව "දේශීය" වැඩසටහන් සහ ධාවකයන් සමඟ ගමන් කළ යුතුය. ඒවා සමඟ ලේඛනය පරිලෝකනය කර වැඩිදුර සකස් කිරීම සඳහා එය සුරැකිය හැකිය.

ඔබට වෙනත් ඇනෙලොග් භාවිතා කළ හැකිය. නමුත් කට්ටලයේ ස්කෑනරය සමඟ පැමිණි මෘදුකාංගය සාමාන්යයෙන් වේගවත් අතර අමතර විකල්ප ඇත.

ඔබ විසින් කුමන වර්ගයේ ස්කෑනර් මත යැපෙන විට - කාර්යයේ වේගය සැලකිය යුතු ලෙස වෙනස් විය හැක. තත්පර 10 ක් තුළ පින්තූරයක් ලබා ගත හැකි ස්කැනර පවතී, තත්පර 30 කින් එය ලබාගත හැකිය. ඔබ 200-300 තහඩු මත පොතක් ස්කෑන් කර ඇත්නම් - මම කාලය ගණනය කරන්නේ කොපමණ වාර ගණනක් ගණනය කිරීම දුෂ්කර නොවේ ද?

2) පිළිගැනීමේ වැඩසටහන

අපගේ ලිපියෙන්, ස්කෑන් කිරීම සඳහා හොදම ක්රමලේඛයක කාර්යය ඔබ විසින් පෙන්වනු ඇති අතර, ඕනෑම ලේඛනයක් සම්පූර්ණයෙන් හඳුනා ගැනීම - ABBYY FineReader. එතැන් සිට මෙම වැඩසටහන ගෙවනු ලබන අතර, වහාම මම තවත් කෙනෙකුට සබැඳියක් දෙන්නෙමි. FineReader සෑම ආකාරයකින්ම ජයග්රහණය කර ඇති නිසා, මම ඒ සියල්ලම උත්සාහ කිරීමට නිර්දේශ කරමි.

ABBYY FineReader 11

නිල වෙබ් අඩවිය: //www.abbyy.ru/

මෙවැනි වර්ගයේ හොඳම වැඩසටහන් වලින් එකකි. පින්තූරයේ ඇති අකුරු හඳුනා ගැනීමට එය නිර්මාණය කර ඇත. බොහෝ විකල්පයන් සහ විශේෂාංග ගොඩනගා ඇත. එය ෆොන්ටේ පොකුරක් විස්තාරනය කළ හැකි වුවද, අතින් ලියන ලද අනුවාද සඳහා සහය දැක්වුවද (මා පෞද්ගලිකව එය අත්හදා බැලූවත්, පරිණාමීය අත් අකුරු නොමැති නම් එය අතින් ලියන ලද අනුවාදය හඳුනා ගැනීමට අපහසුයැයි මම සිතනවා.) ඇය සමඟ වැඩ කිරීම පිළිබඳ වැඩි විස්තර පහත දැක්වේ. 11 වන අනුවාදයේ වැඩසටහන් වල වැඩ කටයුතු ආවරණය කරනු ඇත.

රීතියක් ලෙස, ABBYY FineReader හි විවිධ අනුවාදයන් එකිනෙකට වඩා වෙනස් නොවේ. ඔබට පහසුවෙන්ම අනික් පැත්තෙන් කළ හැකිය. ප්රධාන වෙනස්කම් විය හැක්කේ, පහසුව සඳහා, වැඩසටහනේ වේගය සහ එහි හැකියාවන්ය. උදාහරණයක් ලෙස, පැරණි අනුවාදයන් PDF ලේඛනයක් සහ DJVU එකක් විවෘත කිරීම ප්රතික්ෂේප කරයි ...

3) ස්කෑන් කිරීමට ලියවිලි

ඔව්, එහෙනම් මෙතන, මම වෙනම තීරුවක ලියවිලි ඉවත් කරන්න තීරණය කළා. බොහෝ අවස්ථාවලදී ඕනෑම පෙළපොත්, පුවත්පත්, ලිපි, සඟරා ආදිය බලන්න එම පොත් සහ සාහිත්යය සඳහා ඉල්ලුමේ. මම මොනවද කරන්නේ? පෞද්ගලික අත්දැකීම් වලින්, ඔබට ස්කෑන් කිරීමට ඔබට අවශ්ය බව බොහෝ දෙනා පවසන්න පුළුවන් - දැනටමත් ජාලය මත විය හැකිය! ජාලයකදී දැනටමත් ස්කෑන් කරන ලද එක් ග්රන්ථයක් හෝ වෙනත් කෙනෙකු සොයාගත් විට, මම පෞද්ගලිකව කාලය කොපමණ වරක් ඉතිරි කර ගත්තේද? මම ලියවිල්ල තුලට පිටපත් කර එය ඉදිරියට ගෙන යාමට මට සිදු විය.

මෙම සරල උපදෙසෙන් - යමක් ස්කෑන් කිරීමට පෙර, එය දැනටමත් එය ස්කෑන් කර ඇත්දැයි පරීක්ෂා කර බලන්න. ඔබේ කාලය නාස්ති කිරීමට අවශ්ය නොවේ.

2. පෙළ ස්කෑනිං විකල්පයන්

මෙහි දී, මම ස්කෑනර් සඳහා ඔබගේ ධාවක පිළිබඳව කතා නොකරමි, සියලු ස්කෑනර් ආකෘති එකිනෙකට වෙනස් වන නිසා, මෘදුකාංගය සෑම තැනකම එකිනෙකට වෙනස් වන අතර අනුමාන කිරීම සහ වඩාත් කාර්යක්ෂමව සිදුකිරීමේ ක්රියාවලිය ඉටු කිරීම අත්යාවශ්ය වේ.

නමුත් ඔබේ ස්කෑන් යන්ත්රයේ වේගයේ හා ගුණාත්මකභාවය කෙරෙහි බලපාන එකම සැකසුම් සියල්ලම ඇත. මෙන්න ඒවා ගැන මම මෙතන කතා කරන්නම්. මම නියෝගයෙන් ලැයිස්තුගත කරමි.

1) ස්කෑන් ගුණාත්මය - DPI

පළමුව, 300 DPI ට වඩා අඩු නොවන විකල්පයන් තුළ ස්කෑන් ගුණාත්මකභාවය සකසන්න. හැකි නම්, තව ටිකක් වැඩිපුර තැබිය යුතුය. DPI දර්ශකය ඉහළ අගයක් වනු ඇත, ඔබගේ පින්තුරය පැහැදිලි වන අතර, ඒ අනුව තවදුරටත් සැකසුම් වේගවත් වනු ඇත. ඊට අමතරව, ස්කෑන්වල ගුණාත්මක භාවය ඉහළයි - පසුව ඔබට අඩුපාඩු සිදුකිරීමට ඇති අඩුපාඩු.

හොඳම විකල්පය සාමාන්යයෙන් 300-400 DPI වේ.

2) වර්ණභේදය

මෙම පරාමිතිය ස්කෑන් කාලය බොහෝ සෙයින් බලපායි. (කෙසේ වෙතත්, DPI ද බලපායි, නමුත් ඒවා ඉතා ප්රබලයි, සහ පරිශීලකයා ඉහළ අගයයන් නියම කරන විට පමණි).

සාමාන්යයෙන් ක්රම තුනක් තිබේ:

- කළු සහ සුදු (සාමාන්ය පාඨ සඳහා පරිපූර්ණ);

- අළු (වගු සහ පින්තූර සමග පෙළ සඳහා සුදුසු);

- වර්ණය (පාට සඟරා, පොත්, පොදුවේ, ලේඛන, වර්ණය වැදගත් වේ).

සාමාන්යයෙන් ස්කෑන් කාලය තීරණය වන්නේ වර්ණ තෝරා ගැනීම මතය. සියල්ලට පසු, විශාල ලේඛනයක් තිබේ නම්, සමස්තයක් ලෙස පිටුවක අතිරේක 5-10 තත්පර පවා යහපත් කාලයක් ලබා දෙනු ඇත ...

3) ඡායාරූප

ඔබට ස්කෑනිං මගින් පමණක් ලේඛනය ලබාගත හැකිය, නමුත් එය පින්තූරයක් ගැනීමෙන්. රීතියක් ලෙස, මෙම නඩුවේදී ඔබට වෙනත් ගැටළු ඇති වනු ඇත: ප්රතිරූපණ විකෘති, පරාවර්තනය. මේ නිසා, ලැබුණු පාඨයේ තවදුරටත් සංස්කරණය සහ සැකසීම අවශ්ය විය හැකිය. පුද්ගලිකව, මම මෙම ව්යාපාරය සඳහා කැමරාවන් නිර්දේශ නොකරමි.

එබඳු සෑම ලේඛනයක්ම පිළිගත නොහැකි බව සැලකිල්ලට ගැනීම වැදගත් වේ ගුණාත්මකභාවය පිරික්සීම ඉතාම පහත් මට්ටමක පවතී ...

3. ලේඛනයේ පිටපත හඳුනා ගැනීම

අපි ඔබට පිළිගත් ලැදියා පිටු ඔබට ලබා දුන් බව අපි විශ්වාස කරමු. බොහෝ විට ඒවා ආකෘති: tif, bmb, jpg, png. සාමාන්යයෙන්, ABBYY FineReader සඳහා - මෙය ඉතා වැදගත් නොවේ ...

ABBYY FineReader හි පින්තූරය විවෘත කිරීමෙන් පසුව, වැඩසටහනක් ලෙස, යන්ත්රය මත, යන්ත්රය මත ප්රදේශ තෝරා ගැනීමට සහ ඒවා හඳුනා ගැනීමට පටන් ගනී. නමුත් සමහර විට ඇය එය වැරදියි. මේ සඳහා අපි අපේක්ෂිත ප්රදේශ තෝරා ගැනීම අතින් සලකා බලමු.

එය වැදගත් වේ! වැඩසටහනේ ලියවිල්ලක් විවෘත කිරීමෙන් පසු සෑම කෙනෙකුම වහාම අවබෝධ කරගෙන නොසිටින අතර, ඔබ විවිධ ප්රදේශ ඉස්මතු කර ඇති කවුළුවෙහි වම් පසෙහි වම් කෙළවරේ ප්රදර්ශනය කරනු ලැබේ. "පිළිගැනීමේ" බොත්තම මත ක්ලික් කිරීමෙන් පසුව, දකුණුපස කවුළුවෙහි වැඩසටහන ඔබට අවසන් පාඨය ගෙන එයි. හඳුනා ගැනීමෙන් පසු, එම FineReader තුළ දෝෂ සඳහා පෙළ පරික්ෂා කිරීම යෝග්යය.

3.1 පෙළ

පාඨය ඉස්මතු කිරීමට මෙම ප්රදේශය යොදා ගනී. පින්තූර සහ මේස වලින් එය ඉවත් කළ යුතුය. ඉතා කලාතුරකින් හා අද්විතීය අකුරු කල යුතු වේ ...

පෙළ පෙදෙසක් තෝරා ගැනීමට, FineReader මුදුනේ ඇති පැනලය වෙත අවධානය යොමු කරන්න. "ටී" බොත්තමක් තිබේ (බලන්න පහත රූප සටහනේ පහළින්, මූසික දර්ශකය මේ බොත්තමේ). එය මත ක්ලික් කරන්න, ඉන්පසු පහත පින්තූරයෙහි පාඨය පිහිටා ඇති සෘජුකෝණාස්රාකාර ප්රදේශය තෝරා ගන්න. මාර්ගය වන විට, සමහර අවස්ථාවලදී ඔබ විසින් පෙළ කොටු 2-3, සහ ඇතැම්විට පිටුවකට 10-12 පමණ සෑදිය යුතු වේ පෙළ හැඩතලගැන්වීම වෙනස් විය හැකි අතර එක් සෘජුකෝණාස්රයකින් මුළු ප්රදේශයම තෝරා නොගනිමු.

රූප පෙළට පෙළ පෙදෙසට වැටිය නොහැකි බව සැලකිල්ලට ගැනීම වැදගත් වේ! අනාගතයේ දී, එය ඔබට ගොඩක් ඉතිරි වනු ඇත ...

3.2 පිංතූර

දුර්වල ගුණාත්මක හෝ අද්විතීය අකුරු නිසා හඳුනා ගැනීමට අපහසු වූ රූප සහ ප්රදේශ හඳුනා ගැනීමට භාවිතා කරයි.

පහත රූප සටහනෙහි දැක්වෙන්නේ, "පින්තූර" ක්ෂේත්රය තෝරා ගැනීමට භාවිතා කරන බොත්තම මත මූසික දර්ශකය පිහිටා ඇත. මාර්ගය වන විට, මෙම කලාපයේ ඕනෑම කොටසක් කොටසක් තෝරා ගත හැකි අතර FineReader එය සාමාන්යයෙන් රූපයක් ලෙස එය ලේඛනයට ඇතුල් කරනු ඇත. ඒ "මෝඩ" යනුවෙන් පිටපත් කරනු ඇත ...

සාමාන්යයෙන්, මෙම ප්රදේශය දුර්වලව පරීක්ෂා කර ඇති වගු අවධාරණය කිරීමට, සම්මත නොවන අකුරු සහ ෆොන්ට්, පින්තූර තමන්ම අවධාරණය කිරීමට භාවිතා කරයි.

3.3 වගු

පහත රූපයේ දැක්වෙන්නේ මේසය උද්දීපනය කිරීමට බොත්තමයි. සාමාන්යයෙන් මම පෞද්ගලිකව ඉතා කලාතුරකින් එය භාවිතා කරනවා. කාරණය වන්නේ, ඔබ නිතරම මේසය මත සෑම විටම රේඛීයව ඇද ගන්නා අතර, වැඩසටහන සහ දේ සහ ආකාරය පෙන්වන්න. වගුව කුඩා වන අතර ඉතා හොඳ තත්ත්වයේ නොමැති නම්, මෙම අරමුණු සඳහා "පින්තූර" ප්රදේශය භාවිතා කිරීම නිර්දේශ කරමි. එමගින් බොහෝ කාලයක් ඉතිරි කර ගත හැකි අතර එවිට ඔබට ඉක්මනින් පින්තූරයක් මත Word තුල වගුවක් සෑදිය හැක.

3.4 අනවශ්ය භාණ්ඩ

සැලකිල්ලට ගැනීම වැදගත් වේ. සමහර අවස්ථාවලදී පාඨය හඳුනා ගැනීමට අපහසු වන පිටුවක අනවශ්ය අංගයක් හෝ, ඔබ කැමති ප්රදේශය තෝරා ගැනීමට ඉඩ නොදෙන්න. ඒවා "මකන" භාවිතා කරමින් ඒවා ඉවත් කළ හැකිය.

මෙය සිදු කිරීම සඳහා, රූප සංස්කරණ ප්රකාරයට යන්න.

අකුරු මෙවලම් තෝරන්න සහ අනවශ්ය ප්රදේශය තෝරන්න. එය මැකී යන අතර එහි ස්ථානය සුදු කඩදාසි පත්රයක් වනු ඇත.

මාර්ගය වන විට, මා හැකි පරිදි හැකි පරිදි මෙම විකල්පය භාවිතා කිරීමට මම නිර්දේශ කරමි. ඔබ විසින් තෝරාගෙන ඇති සියලු පෙළ පෙදෙස උත්සාහ කරන්න, ඔබට අකුරු කෑල්ලක් අවශ්ය නැත, නැතහොත් අනවශ්ය ලක්ෂ්ය, හුදකලාබව, විකෘති කිරීම් - මකනනක් මකා දමන්න. මෙම පිළිගැනීම ස්තුතියි!

4. PDF / DJVU ගොනු හඳුනා ගැනීම

සාමාන්යයෙන් මෙම හඳුනාගැනීමේ ආකෘතිය අන් අයගෙන් වෙනස් නොවේ - i.e. පින්තූර සමඟ මෙන් ඔබට එය සමඟ වැඩ කළ හැකිය. PDF / DJVU ගොනු විවෘත නොකරන්නේ නම් පැරණි අනුවාදය නොවිය යුතුය.

පොඩි උපදේශයක්. FineReader හි ලේඛනය විවෘත කිරීමෙන් පසුව එය ලේඛනය හඳුනාගනී. බොහෝ විට PDF / DJVU ගොනුවේ, සම්පූර්ණ ලේඛනයක් පුරා පිටුවක විශේෂිත ප්රදේශයක් අවශ්ය නොවේ! සෑම පිටුවකම එවැනි ප්රදේශයක් ඉවත් කිරීම සඳහා පහත සඳහන් දේ කරන්න:

1. පින්තූර සංස්කරණ කොටස වෙත යන්න.

2. "Trimming" විකල්පය සක්රිය කරන්න.

3. සියලු පිටු මත ඔබට අවශ්ය ප්රදේශය තෝරන්න.

4. සියලු පිටු හා තීරු අයදුම් කරන්න.

5. රැකියා ප්රතිඵල පරීක්ෂා කිරීම සහ සුරැකීමේ දෝෂය

සෑම ප්රදේශයක්ම තෝරා ගත් විට, ගැටලු ඇති විය හැකි බවක් පෙනෙන්නට තිබේ. ඉන්පසු එය පිළිගෙන එය රැගෙන එය සුරකින්න ... එය එතැන තිබුණේ නැත!

පළමුව, අපි ලේඛනය පරික්ෂා කළ යුතුය!

එය හඳුනා ගැනීමෙන් පසු, දකුණුපස කවුළුව තුල එය සක්රිය කිරීමට, "චෙක්" බොත්තමක් වනු ඇත, පහත රූප සටහන බලන්න. එය ක්ලික් කිරීමෙන් පසු, FineReader වැඩසටහන ස්වයංක්රීයව ඔබට වැඩසටහනක් දෝෂ සහිතව එම ප්රදේශ ඔබට පෙන්වනු ඇත, එය එක් හෝ වෙනත් සංකේතයක් විශ්වාස කල නොහැකි වනු ඇත. ඔබට තෝරා ගැනීමට සිදු වනු ඇත, නැතහොත් වැඩසටහනේ අදහස සමඟ ඔබ එකඟ වන හෝ ඔබේ චරිතය ඇතුළත් කරන්න.

මාර්ගය වන විට, ආසන්න වශයෙන් අඩක්, වැඩසටහන මඟින් ඔබ සූදානම් කළ නිවැරදි වචනය ලබා දෙනු ඇත - ඔබ ඔබට අවශ්ය විකල්පය තෝරා ගැනීමට මූසිකය භාවිතා කළ යුතුව ඇත.

දෙවනුව, පරික්ෂා කිරීමෙන් පසු ඔබ ඔබේ කාර්යයයේ ප්රතිඵල සුරැකිය යුතු ආකෘතිය තෝරාගත යුතුය.

මෙන්න FineReader පූර්ණ ලෙස හැරීමක් ලබා දෙයි: ඔබට සරලව Word එකේ තොරතුරු එකට මාරු කළ හැකි අතර, එය ඔබට ආකෘතියේ දුසිම් ගනනකින් එය සුරැකිය හැකිය. එහෙත් මම තවත් වැදගත් අංගයක් අවධාරණය කිරීමට කැමතියි. ඔබ තෝරාගන්නා කුමන ආකෘතිය, පිටපත් වර්ගය තෝරන්න වඩා වැදගත් වේ! වඩාත් ආකර්ශනීය විකල්ප ගැන සලකා බලන්න ...

නිශ්චිත පිටපතක්

ඔබ පිළිගත් ලියවිල්ලක පිටුවක තෝරාගත් සෑම ප්රදේශයක් ම මූලාශ්ර ලේඛනයේ හරියටම ගැලපෙනු ඇත. පාඨමය ආකෘතිය අහිමි නොවී සිටීම වැදගත් වන විට ඉතා පහසු විකල්පය වේ. කෙසේ වෙතත්, අකුරු වර්ග මුල් පිටපතට සමාන වේ. ලේඛනයේ Word වෙත මාරු කිරීම සඳහා මෙම විකල්පය නිර්දේශ කරමි. එය තවදුරටත් වැඩ කිරීම තවදුරටත් සිදු කිරීම.

සංස්කරණ පිටපත

ඔබට දැනටමත් ආකෘතිගත කළ අනුවාදය ලබා ගත හැකි බැවින් මෙම විකල්පය හොඳයි. ඒ මුල් පිටපතෙහි ඇති විය හැකි "කිලෝමීටර" කපා හැරීම - ඔබට හමුවිය නොහැක. තොරතුරු සැලකිය යුතු ලෙස සංස්කරණය කරන විට ප්රයෝජනවත් විකල්පය.

මෝස්තරය, අකුරු, අකුරු ආදිය සංරක්ෂණය කිරීමට ඔබට වැදගත් වන්නේ නම්, ඔබ තෝරා නොගත යුතුය. සමහර විට පිළිගැනීමක් ඉතා සාර්ථක නොවේ නම් - වෙනස් කළ හැඩතල ගැන්වීම නිසා ඔබේ ලේඛනය "ඇඹරීමට" හැක. මෙම අවස්ථාවේදී, නිවැරදි පිටපතක් තෝරා ගැනීමට යෝග්ය වේ.

සාමාන්ය පාඨය

අනෙක් සියල්ලම තොරව පිටුවෙන් පමණක් පෙළට අවශ්ය අයට විකල්පයක්. පින්තූර සහ වගු නොමැති ලේඛන සඳහා සුදුසු වේ.

මෙය ලේඛන ස්කෑන් කිරීම සහ පිළිගැනීමේ ලිපිය අවසන් කරයි. මම මෙම සරල ඉඟි උපකාරයෙන් ඔබේ ගැටලු විසඳිය හැකි බව මම බලාපොරොත්තු වෙමි ...

සුභ පැතුම්!

විඩියෝව බලන්න: Differential Equations: Solutions Level 2 of 4. Verifying Solutions I (අප්රේල් 2024).