Sådan søger du Amazon for millioner af offentlige dokumenter, billeder og mere

Ligesom enhver anden massiv skyplatform er AWS vært for en række offentligt tilgængelige data - forskellen er, at du kan søge gennem det hele og finde filer, der er relevante for dig.

Ligesom enhver anden massiv skyplatform er AWS vært for en række offentligt tilgængelige data - forskellen er, at du kan søge gennem det hele og finde filer, der er relevante for dig.
Reklame

Amazon Web Services (AWS) er den blå hval af cloud computing. Du kan muligvis ikke indse det, men de fleste websteder og webtjenester kører på denne platform. Og faktisk er AWS offentlig sky større end Microsoft, Google og IBM kombineret.

Ligesom enhver anden massiv skydeplatform er AWS vært for en række offentligt tilgængelige data. For eksempel kan du finde enorme 100 millioner stærke datasæt af Creative Commons-billeder og videoer fra Flickr. Få adgang til det ved hjælp af YFCC100m Browser.

Prøv en søgning med Google. Du vil blive overrasket over den massive mængde offentlige dokumenter, du kan finde på AWS. En af de hurtigste måder at søge AWS for PDF-filer på, er at bruge god gammel Google og en af ​​sine avancerede søgeoperatører.

[Keyword] filetype:PDF site:amazonaws.com 

Selvfølgelig er filerne åbne for offentligheden og kan være tilgængelige fra søgeportalerne på de websteder, der er vært for dem på AWS. Men denne nøgleordstilstand er en "eksperimentel søgning", der hjælper dig med at grave ind i den enorme høstak på en gang i stedet for at gå til hvert websted.

Du kan også bruge Googles avancerede søgning til at opbygge din forespørgsel mere præcist og derefter udføre den for at søge i Amazons sky. Jeg foretrækker et lille søgeværktøj, der hedder Advangle Sådan øger du nøjagtigheden af ​​søgeresultater på Google og Bing Sådan øger du øjeblikkeligt nøjagtigheden af ​​søgeresultater på Google og Bing Derfor er den bedste måde at søge på, stadig brug for booleanske søgemaskiner. Men hvem vil huske alle de forskellige søgoperatører? Heldigvis er der en løsning! Læs mere, som hjælper dig med at opbygge søgninger på en visuel måde.

Et "usynligt" sted til webforskning

En søgemaskine er en hoveddør til nettet. Men der er mange måder at søge efter dybe data på. Rejsen til det skjulte web: En vejledning til nye forskere. Rejsen til det skjulte web: En vejledning til nye forskere. Denne vejledning tager dig på en tur gennem de mange niveauer af dybden: databaser og information tilgængelig i akademiske tidsskrifter. Endelig kommer vi til Tors porte. Læs mere og tilføj til dine forskningsfærdigheder. Selvfølgelig må du ikke bruge oplysningerne (især billeder) blindt. Find det websted, der ejer oplysningerne, og kontroller deres ophavsretlige begrænsninger.

Jeg tror, ​​at Googles avancerede søgeoperatører bør indgå i vores forskningsvaner. Hvad synes du? Angiv et par åbne mapper, hvor du kan lide at lave din online forskning.

In this article