Hvordan fungerer søgemaskiner?

For mange mennesker er Google internettet. Det er uden tvivl den vigtigste opfindelse siden internettet. Og mens søgemaskinerne har ændret sig meget siden, er de underliggende principper stadig de samme.

For mange mennesker er Google internettet.  Det er uden tvivl den vigtigste opfindelse siden internettet.  Og mens søgemaskinerne har ændret sig meget siden, er de underliggende principper stadig de samme.
Reklame

Artikel opdateret af Joel Lee den 10/10/2017

Lås op på cheatarket "Top Google Search Keyboard Shortcuts" nu!

Dette vil tilmelde dig til vores nyhedsbrev

Indtast din e-mail-oplåsning Læs vores privatlivspolitik

For mange er Google internettet. Det er udgangspunktet for at finde nye websteder, og er uden tvivl den vigtigste opfindelse siden internettet. Uden søgemaskiner ville nyt webindhold være utilgængeligt for masserne.

Men ved du, hvordan søgemaskiner virker? Hver søgemaskine har tre hovedfunktioner: gennemsøgning (for at opdage indhold), indeksering (for at spore og gemme indhold) og hentning (for at hente relevant indhold, når brugere forespørger søgemaskinen).

Gennemgang

Crawling er hvor det hele begynder: erhvervelse af data om en hjemmeside.

Dette involverer scanningssider og indsamler detaljer om hver side: titler, billeder, søgeord, andre linkede sider mv. Forskellige crawlere kan også søge efter forskellige detaljer, f.eks. Sidelayouter, hvor annoncer placeres, om linkene er indbygget osv.

Men hvordan bliver et websted gennemsøgt? En automatiseret bot (kaldet en "edderkopper") besøger side efter side så hurtigt som muligt ved at bruge sidelinks for at finde, hvor de skal gå næste. Selv i de tidligste dage kunne Googles edderkopper læse flere hundrede sider pr. Sekund. I dag er det i tusindvis.

Hvordan fungerer søgemaskiner? web crawler diagram

Når en webcrawler besøger en side, samler den hvert link på siden og tilføjer dem til sin liste over de næste sider, der skal besøges. Det går til næste side i sin liste, samler linksne på den pågældende side og gentages. Webcrawlere besøger også tidligere sider en gang imellem for at se, om der er sket ændringer.

Dette betyder, at ethvert websted, der er linket fra et indekseret websted, efterhånden vil blive gennemsøgt. Nogle websteder gennemsøges hyppigere, og nogle krypteres til større dybder, men nogle gange kan en crawler opgive, hvis et websteds sidehierarki er for komplekst.

En måde at forstå, hvordan en webcrawler virker, er at opbygge en selv. Vi har skrevet en vejledning om oprettelse af en grundlæggende webcrawler i PHP, så tjek det hvis du har nogen programmeringsoplevelse.

Hvordan fungerer søgemaskiner? google søgning på tablet

Bemærk, at siderne kan markeres som "noindex", hvilket er som at spørge søgemaskiner til at springe over indekseringen. Ikke-indekserede dele af internettet er kendt som den "dybe web" Hvad er den dybe web? Det er vigtigere end du tror Hvad er den dybe web? Det er vigtigere end du tror Den dybe web og den mørke web er både skræmmende og skændige, men farerne er blevet overblown. Her er hvad de faktisk og hvordan du selv kan få adgang til dem selv! Læs mere, og nogle websteder, som de, der er vært på TOR-netværket, kan ikke indekseres af søgemaskiner. (Hvad er TOR- og løgdirigering? Hvad er løg-routing, præcis? [MakeUseOf Forklarer] Hvad er Onion Routing, Præcis? [MakeUseOf Explains] Internet privacy. Anonymitet var en af ​​de største træk ved internettet i sin ungdom (eller en af dets værste funktioner afhængigt af hvem du spørger). Forladelse af de slags problemer, der kommer frem ... Læs mere)

Indeksering

Indeksering er, når dataene fra en gennemgang behandles og placeres i en database.

Forestil dig at lave en liste over alle dine bøger, deres forlag, deres forfattere, deres genrer, deres sideantal osv. Crawling er, når du kæmper gennem hver bog, mens indeksering er, når du logger dem på din liste.

Forestil dig nu, at det ikke kun er et værelse fyldt med bøger, men hvert bibliotek i verden. Det er en lille version af, hvad Google gør, som gemmer alle disse data i store datacentre med tusindvis af petabytes værdige drev. Hukommelsesstørrelser forklaret - Gigabyte, Terabytes og Petabytes i Laymans Vilkår Hukommelsesstørrelser forklaret - Gigabyte, Terabytter og Petabytter i Laymans vilkår Det er nemt at se, at 500GB er mere end 100 GB. Men hvordan sammenligner forskellige størrelser? Hvad er en gigabyte til en terabyte? Hvor passer en petabyte ind? Lad os rydde det op! Læs mere .

Her er et kig indeni et af Googles søgedatacentre:

Hvordan fungerer søgemaskiner? google søg datacentre
Billedkredit: Google

Hentning og rangering

Hentning er, når søgemaskinen behandler dit søgeforespørgsel og returnerer de mest relevante sider, der matcher din forespørgsel.

De fleste søgemaskiner adskiller sig gennem deres hentningsmetoder: De bruger forskellige kriterier for at vælge og vælge hvilke sider der passer bedst til det, du vil finde. Derfor varierer søgeresultaterne mellem Google og Bing, og hvorfor Wolfram Alpha er så entydigt nyttig. 10 Cool anvendelser af Wolfram Alpha, hvis du læser og skriver i det engelske sprog 10 Cool anvendelser af Wolfram Alpha Hvis du læser og skriver i det engelske sprog Det tog Jeg har tid til at pakke mit hoved omkring Wolfram Alpha og de forespørgsler, det bruger til at udspille disse resultater. Du skal dykke dybt ind i Wolfram Alpha for virkelig at udnytte det til ... Læs mere.

Rankingalgoritmer tjekke din søgeforespørgsel mod milliarder sider for at bestemme hver enkeltes relevans. Virksomheder bevogter deres rankingalgoritmer som patenterede industris hemmeligheder på grund af deres kompleksitet. En bedre algoritme oversætter til en bedre søgeoplevelse.

De vil heller ikke have webdesignere til at spille systemet og uretfærdigt klatre til toppen af ​​søgeresultaterne. Hvis den interne metode til en søgemaskine nogensinde kom ud, ville alle slags mennesker sikkert udnytte den viden til skade for søgere som dig og mig.

Hvordan fungerer søgemaskiner? pen html søgemaskine meta
Billedkredit: Fotovibes via Shutterstock

Udnyttelse af søgemaskiner er selvfølgelig mulig, men det er ikke så nemt længere.

Oprindeligt placerede søgemaskinerne steder efter, hvor ofte søgeord blev vist på en side, hvilket førte til "keyword stuffing" - udfyldning af sider med nøgleordstank.

Så kom begrebet link betydning: søgemaskiner værdsatte websteder med masser af indgående links, fordi de fortolker stedet popularitet som relevans. Men dette førte til link spamming over hele internettet. I dag er søgemaskinerne vægtforbindelser afhængigt af "autoriteten" af linkingsstedet. Søgemaskiner lægger større vægt på links fra et statsligt organ end links fra et link bibliotek.

I dag er rankingalgoritmer indhyllet i mere mystik end nogensinde før, og "søgemaskineoptimering" Demystify SEO: 5 Search Engine Optimization Guides, der hjælper dig med at starte Demystify SEO: 5 Search Engine Optimization Guides, der hjælper dig med at starte Search Engine Mastery tager viden, erfaring, og masser af forsøg og fejl. Du kan begynde at lære grundlæggende og undgå fælles SEO fejl nemt ved hjælp af mange SEO guider tilgængelige på internettet. Læs mere er ikke så vigtigt. Gode ​​søgemaskine placeringer kommer nu fra højkvalitets indhold og gode brugeroplevelser.

Hvad er næste for søgemaskiner?

Åh, nu er der et interessant spørgsmål. Svaret er "semantik": betydningen af sidens indhold. Du kan læse mere om i vores oversigt over semantisk markering og dens fremtidige indvirkning Hvad Semantisk Markup er og hvordan det vil ændre internettet for evigt [Teknologi forklaret] Hvad Semantisk Markup er og hvordan det vil ændre internettet for evigt [Teknologi forklaret] Læs mere.

Men her er det kerne af det.

Lige nu kan du søge efter "glutenfri cookies", men resultaterne kan returnere opskrifter til glutenfrie cookies. I stedet kan du finde almindelige cookieopskrifter, der siger "Denne opskrift er ikke glutenfri." Den har de rigtige søgeord, men den forkerte betydning.

Med semantik kan du søge efter cookieopskrifter og derefter fjerne visse ingredienser: mel, nødder osv. Du kan også indsnævre resultaterne kun i opskrifter med forberedelsestider mindre end 30 minutter og gennemgå score på 4/5 eller derover. Det ville være cool, ikke? Det er her, vi er på vej!

Stadig forvirret om, hvordan søgemaskiner virker? Se, hvordan Google forklarer processen:

Hvis du fandt det interessant, kan du også lide at lære om, hvordan billedsøgemaskiner virker.

Billedkredit: prykhodov / Depositobilleder

In this article