Hvis du vil konvertere enhver trykt tekst til digital tekst, som du kan kopiere, indsætte, redigere og søge, skal du bruge optiske tegn genkendelse (OCR) scannere.
Når du vælger at scanne eller tage et billede af et dokument, gemmes dette i et format som f.eks. JPEG eller PDF. OCR-software kan derefter genkende bogstaverne og numrene i disse dokumenter og konvertere dem til et søgbart PDF 4 Metoder til at oprette og redigere PDF-filer gratis 4 Metoder til at oprette og redigere PDF-filer gratis Ud af alle de almindelige filtyper, der findes i vores computing verden er PDF sandsynligvis en af de mest restriktive, mens den samtidig er tilgængelig for alle at bruge (primært at læse) .... Læs mere, eller til en fil, som du kan redigere i programmer som Microsoft Word.
Problemet er, at nogle OCR-scannere virker meget bedre end andre, hvor det allerbedste er ret tungt på tegnebogen.
Omnipage18 for eksempel koster $ 150, men er især god til at genkende forskellige sprog. Adobe Acrobat Pro DC koster en vanding $ 400, men har utrolig nøjagtighed. ABBYY FineReader koster $ 150, men det er fantastisk at konvertere dokumenter som magasiner og brochurer til søgbar tekst. Vi vil teste ABBYYs online tilbud senere i denne artikel.
Men hvis du leder efter gratis alternativer, som du kan downloade og bruge på Windows eller OS X, bør du prøve disse OCR-værktøjer De 5 bedste OCR-værktøjer til ekstraktion af tekst fra billeder De 5 bedste OCR-værktøjer til udtrækning af tekst fra billeder, når du har reams af papir, hvordan får du alt, hvad trykt tekst konverteres til noget, som et digitalt program vil kunne genkende og indeksere? Hold en god OCR-software tæt ved. Læs mere . Men hvis du hellere vil bruge et gratis, online OCR-værktøj, skal du fortsætte med at læse, som vi har prøvet de øverste få, med nedenstående resultater.
Testen
Synes at de fleste mennesker nu bruger deres smartphones til at gøre deres scanning for dem. Scan og administrer dine kvitteringer, spare plads, papir og tid. Scan og administrer dine kvitteringer, spare plads, papir og tid. Papirindtægter er nemt tabt og svært at finde, når du har brug for dem mest. Heldigvis går digital løsning på begge disse problemer. Læs mere, jeg besluttede at bruge Evernote's Scannable app (gratis på iOS og Android). Jeg scannede den første side af Richard Dawkins Climbing Mount Improbable for at se, hvilke resultater vi kunne få med meget grundlæggende formatering. Jeg scannede også en side af Tim Ferriss ' The 4-Hour Chef for at prøve scannerne med lidt mere kompliceret formatering. Jeg har gemt hver af disse filer som PDF.
Disse dokumenter blev derefter kørt gennem nogle af de angiveligt bedste online OCR værktøjer til at se, hvor godt de gik.
Gratis online OCR
Heldigvis er der ingen registrering, der kræves for at bruge Free Online OCR. Og jeg blev dobbelt imponeret, da jeg så deres krav om at holde formateringen og layoutet af mit dokument.
Webstedet hævder at kunne understøtte PDF, GIF, BMP, JPEG, TIFF og PNG som input. Udgange kan enten være DOC, et PDF-tekstdokument, RTF og TXT. Desværre kunne jeg ikke finde ud af, om de havde en filstørrelsesgrænse.
Grundlæggende dokument til PDF
Konverteret helt perfekt. Der er ikke meget mere at sige! Vi har en rigtig god start.
Grundlæggende dokument til DOC
De egentlige ord synes at have konverteret fejlfrit, bortset fra "ount" fra "Mount Rushmore" på en eller anden måde går AWOL. Formateringen er dog en anden historie. Mange kommaer blev erstattet med understregninger, og tilfældige mellemrum blev indsat på punkter i hele dokumentet. Når du senere ser hvordan premium-software gik i denne test, er det dog ikke en dårlig indsats overhovedet .
Kompleks dokument til PDF
Konvertering af dokumentet tog et kæmpe 120 sekunder! Når teksten er færdig, er hele teksten blevet konverteret med ca. 95% nøjagtighed, selvom teksten i den separate boks øverst til højre på siden ikke var forskellig. Et par andre tegn i hele PDF-filen var også forkerte.
Kompleks dokument til DOC
Denne gang tog konverteringen kun 10 sekunder, med teksten konverteret igen med omkring 95% nøjagtighed. Der var nogle mærkelige afstandsproblemer, og softwaren havde problemer med at konvertere skrifttypen øverst til højre i dokumentet og savnede nogle få tegn her og der.
Dom
Hvis du vil konvertere enkeltformaterede dokumenter til PDF, er dette et fantastisk værktøj. Med hensyn til konvertering til DOC var resultaterne ikke noget at skrive hjem om.
i2OCR
i2OCR gør nogle imponerende krav. Værktøjet genkender over 60 sprog, kan håndtere layouter med flere søjler (ved at fjerne formateringen), har ingen filstørrelsesgrænser, kan konvertere uploadede filer og fra webadresser. Og du behøver heller ikke at registrere dig for at bruge dette værktøj.
Tjenesten fungerer ved blot at udtrække teksten fra dit billede og derefter udføre uformateret tekst. Du kan hurtigt rette eventuelle fejl i siden til side, før du kopierer teksten til andre programmer eller downloader som DOC, PDF eller HTML.
Bemærk: Da jeg forsøgte at uploade mine PDF-dokumenter, blev disse afvist af i2OCR, så jeg havde brug for at konvertere disse til JPEG (ved at tage et screenshot af dem og derefter uploade filerne).
Grundlæggende dokument til almindelig tekst
På grund af den måde, dette værktøj fungerer på, går al formatering tabt, men konverteringen fra billede til tekst var næsten perfekt. Der var nogle små fejl som afsnitafstand, og nogle kommaer blev erstattet med perioder, men disse er små niggles.
Kompleks dokument til almindelig tekst
Størstedelen af teksten blev konverteret uden for mange fejl, bortset fra titlen og opskriften øverst til højre, som var ulæselig for dette værktøj. Den måde, kolonnerne blev konverteret til ren tekst var langt fra ideel. Hvis du vil gøre denne konvertering mulig, vil det være nødvendigt at have meget tid til at omdanne linjerne til sammenhængende sætninger.
Dom
For grundlæggende dokumenter fungerer i2OCR godt. Evnen til at redigere teksten før download er også en meget god touch. For mere komplekse dokumenter er konverteringen dog stadig ret præcis, men den måde, hvorpå teksten udleveres, vil ikke gøre dit liv meget lettere.
Online OCR
Online OCR understøtter for øjeblikket 46 forskellige sprog, og kan konvertere PDF, JPG, BMP, TIFF og GIF til Word, Excel eller Plain Text format. Webstedet hævder, at "konverterede dokumenter ser nøjagtigt ud som de originale - tabeller, kolonner og grafik".
Den version, du kan bruge uden at registrere, giver dig mulighed for at konvertere op til 15 billeder i timen (5mb grænse). Hvis du tilmelder dig en konto, kan du købe flere sider oven på denne grænse, samtidig med at du også kan konvertere flersidede dokumenter og ZIP-arkiver.
Grundlæggende dokument til DOC
Grunddokumentet konverteres fejlfrit bortset fra det romerske tal, jeg bliver ikke hentet. Som webstedet lovede, var formateringen nøjagtigt som i bogen. Kudos til dette værktøj.
Kompleks dokument til DOC
Efter at være skuffet over de tidligere OCR-værktøjer ved konvertering af det komplekse dokument blev jeg massivt imponeret af Online OCR. Layoutet var næsten perfekt, som du kan se ovenfor. Endnu engang blev opskriften ikke optaget for godt, men alle andre mindre fejl var ubetydelige.
Dom
Absolut fantastiske resultater fra Online OCR. Den eneste ulempe jeg ser er, at der ikke er nogen måde at downloade de konverterede dokumenter som PDF-filer, da de angivne outputformater kun omfatter DOCX, XLSX og TXT.
ABBYY FineReader Online (10-siders prøve)
Som tidligere nævnt er ABBYY en af markedsledere i OCR-software og koster omkring $ 150 for deres fulde downloadbare program. De tilbyder en 10-siders gratis prøveversion for deres online-værktøj, dog (registrering påkrævet). For et $ 5 abonnement vil deres online værktøj tillade dig at konvertere 200 sider hver måned.
Filer accepteret kan være op til 100 MB, i et hvilket som helst af disse formater: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP og PNG. ABBYY anerkender også næsten 200 sprog. Udgange er specielt imponerende, med et valg mellem DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 og EPUB.
Du kan endda prøve et par BETA-funktioner under dit forsøg. Den første er muligheden for at oversætte dit dokument til et andet sprog. Den anden er at eksportere dit konverterede dokument til din cloud storage-konto, uanset om det er Dropbox, Google Drive, Evernote, Microsoft OneDrive eller Box.
Grundlæggende dokument til DOCX
De samlede resultater var gode, men ikke fantastiske i betragtning af dette er et premiumprodukt. Flere kommaer og perioder blev byttet om, flere omvendte kommaer blev erstattet med en asterix, et par store bogstaver manglede, og et ord (bogstavet) blev stavet forkert.
Kompleks dokument til DOCX
Når der er konverteret, var der meget få fejl i teksten i dokumentet (bortset fra at OCR kæmper med denne opskriftens skrifttype igen!), Men formateringen efterlod meget at ønske.
De tre kolonner tog på en eller anden måde op to sider, med den centrale kolonne kun på anden side. Hvis du virkelig ville gøre noget med dette konverterede dokument, ville du ende med at trække dit hår ud.
Grundlæggende dokument til PDF
Under gennemgangen af den konverterede PDF kunne jeg slet ikke finde nogen fejl. Måske har vi fundet, hvor ABBYY udmærker sig. Fantastiske resultater.
Kompleks dokument til PDF
Igen kunne jeg ikke finde nogen fejl i denne konverterede fil. ABBYY ved selvfølgelig, hvordan man konverterer til PDF usædvanligt godt.
Dom
Hvis du er glad for at betale et par dollars, ser det ud til, at konvertering til PDF virker fænomenalt godt med denne tjeneste, og det er særligt nyttigt at synkronisere konverterede filer til din cloud-opbevaring, hvis du scanner et stort antal dokumenter. Som med de andre muligheder, har ABBYY stadig ikke fundet ud af, hvordan man fejlfrit kan konvertere dokumenter til DOC for nem redigering.
Det endelige resultat
Hvis du som de fleste mennesker bare søger at scanne et par magasinartikler og nogle husholdningsregninger, behøver du ikke at redigere disse dokumenter. Derfor vil konverteringen direkte til en PDF være egnet til dig, fordi du stadig kan søge i disse dokumenter. For dette var Free Online OCR absolut det bedste gratis værktøj, vi testede. Når det er sagt, hvis du er villig til at betale $ 5 pr. Måned for næsten perfektion, var ABBYY FineReader Online en smule mere præcis.
Når det kommer til at konvertere dokumenter til DOC, lykkedes det os ikke at finde nogen løsning, der var perfekt, men langt de bedste resultater kom fra Online OCR. Konverteringen var ikke perfekt, men formateringsintegriteten blev stort set holdt intakt, og fejlene var ubetydelige. Når vi sammenligner disse resultater med "premium" -tilbudet fra ABBYY, kan du ikke undgå at være massivt imponeret.
Vi har ikke inkluderet Google Drevs OCR-muligheder i dette indlæg; lidt for Googles almindelige, men mere for det faktum, at vi ønskede at teste et par andre gratis online OCR-tjenester derude.
Over til dig: Hvilke andre online OCR-værktøjer vil du anbefale til vores læsere? Og hvilke har du forsøgt at du aldrig ville bruge igen?