Kim Andersen

Webudvikling, Umbraco, Google, SEO, sociale medier mm.
  • Hold dig opdateret med mit RSS-Feed
  • Hjem
  • Modtag nye indlæg på mail

Google bliver stadig bedre: Indekserer nu scannede dokumenter!

Kim Andersen | 31. oktober 2008 | 11:41

GoogleFor bare lidt over en måned siden annoncerede Google af de kunne indeksere lyd med GAudi (Google Audio Indexing).

Nu har Google så annonceret at de har udvidet deres søgemuligheder endnu engang. Denne gang handler det om scannede dokumenter i PDF-format.

Man har i noget tid kunnet finde resultater i Google som bestod af PDF-filer, og det kan man stadigvæk. Men før i tiden var det kun PDF-filer som var skrevet på en computer der kunne læses, da det jo var ”rigtig” digital tekst som stod i dem.

Med en ny metode kaldet Optical character recognition (OCR), kan Google ny tyde de tegn som er skrevet ind via et scannet dokument. Når man scanner et dokument ind, bliver den skrevne tekst jo ikke gemt som digital tekst, men derimod som et billede. Derfor har Googles robotter stort besvær med at tyde disse billeder, og fiske noget brugbart tekst ud af dem.
Men det er lykkedes nu vha. OCR, og det må siges, endnu engang, at give nye muligheder. For folk har i lang tid scannet dokumenter ind og lagt på nettet, men først nu kan de altså blive fundet i søgeresultaterne.

Se et par eksempler på at det rent faktisk virker herunder:
repairing aluminum wiring
spin lock performance

Jeg har lånt eksemplerne fra Google blog, men prøv at se de resultater som kommer op I søgeresultaterne. Hvis du klikker på de PDF-resultater som kommer frem, kan du nemt se at det er et scannet dokument og ikke et som er skrevet direkte i Acrobat eller Word. Du kan også vælge at se dokumentet som HTML, og her kan vi virkelig se at Google får fisket de rigtige ord ud, da de er markeret med forskellige farver.

Det er sku da imponerende er det ik? 😀

Ingen relaterede indlæg.

Kunne du lide indlæget?

Så tilmeld dig mit RSS-Feed eller følg mig på Twitter.

Du kan også få en gratis e-mail når jeg skriver et nyt indlæg.

Indtast din e-mailadresse:

Kategorier
Google
RSS Kommentarer
RSS Kommentarer

« Lav gratis dit eget sociale site som eks. YouTube, Wikipedia etc. CNN lavede hologram i direkte TV……næsten »

2 Svar

Må indrømme at de imponerer sgu mig hver gang, men

Johnny Krogsgård | 31. oktober 2008 | 12:42

Må indrømme at de imponerer sgu mig hver gang, men samtidigt er det første jeg tænker “BIGBROTHER”. Jeg kan ikke gennemskue om jeg har nogen grund til at tænke det, men det er altså hvad jeg tænker 🙂

Hehe, ja BigBrother kan man godt få sine tanker hen

Kim Andersen | 31. oktober 2008 | 21:29

Hehe, ja BigBrother kan man godt få sine tanker hen på når vi snakker om Google. Men samtidig kan vi jo ikke leve uden 😀

Efterlad en kommentar

Du kan bruge disse tags : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

CoolShop.dk
Bodylab
MuscleHouse
Bodyman
Bodystore

Seneste Kommentarer

  • Simon fra Besvaret.dk:
  • Jeg kan stadig huske da jeg spillede dette spil på Google. Er der nogen...
  • - - - - - - - - - -
  • Joakim:
  • Jeg arbejder selv med SEO, og måske dette forum kunne få øjnene op for min hjemmeside,...
  • - - - - - - - - - -
  • Bengt:
  • Tackar för tipsen!
  • - - - - - - - - - -
  • Rene:
  • Tak for din venlighed og tak for link. Rigtig dejlig dag
  • - - - - - - - - - -
  • Jakob Kvorning:
  • Super ide som jeg håber flere vil benytte. I kunne også tilmelde jer på...
  • - - - - - - - - - -

Kategorier

  • Affiliate Marketing (1)
  • Alt andet (16)
  • Database og Normalisering (3)
  • Digital Markedsføring (2)
  • E-handel (2)
  • Firefox (1)
  • Flash (1)
  • Gadgets (4)
  • Google (22)
  • Internet (9)
  • Multimediedesigner (2)
  • NFL (2)
  • Problemer ved programmering (1)
  • SEO (12)
  • Sitecore (1)
  • Tegnsæt (2)
  • Twitter (4)
  • umbraco (8)
  • Web 2.0 (9)
  • Webdesign tips og tricks (7)
  • Webudvikling (12)
  • Windows (3)
  • WordPress (12)

Meta

  • Log ind
  • Indlæg-RSS
  • Kommentar-RSS
  • WordPress.org