Hvordan robotter lærer at læse og tænke

Hvad betyder det for en robot at kunne læse og forstå tekst? Og vigtigere, hvordan er det muligt for en robot at gøre det?

Reklame

Vi taler hele tiden om computere, der forstår os. Vi siger, at Google "vidste", hvad vi søgte efter, eller at Cortana "fik" det, vi sagde, men "forståelse" er et meget vanskeligt begreb. Især når det kommer til computere.

Et felt af computational lingvistik, kaldet natural language processing (NLP), arbejder på dette særligt hårde problem. Det er et fascinerende felt lige nu, og når du har en ide om, hvordan det virker, vil du begynde at se dens effekter overalt.

En hurtig note: Denne artikel indeholder nogle få eksempler på en computer, der svarer til tale, som når du spørger Siri om noget. Omdannelsen af hørbar tale til et computerforståeligt format kaldes talegenkendelse. NLP er ikke bekymret for det (i hvert fald i den kapacitet, vi diskuterer her). NLP kommer kun i spil, når teksten er klar. Begge processer er nødvendige for mange applikationer, men de er to meget forskellige problemer.

Definition af forståelse

Før vi går ind i, hvordan computere håndterer naturligt sprog, skal vi definere et par ting.

Først og fremmest skal vi definere naturligt sprog. Dette er en nem en: hvert sprog, der anvendes jævnligt af mennesker, falder ind under denne kategori. Det omfatter ikke ting som konstruerede sprog (Klingon, Esperanto) eller programmeringssprog. Du bruger naturligt sprog, når du snakker med dine venner. Du bruger også det nok til at tale med din digitale personlige assistent.

Så hvad mener vi når vi siger forståelse? Nå, det er komplekst. Hvad betyder det at forstå en sætning? Måske vil du sige, at det betyder, at du nu har det tilsigtede indhold af meddelelsen i din hjerne. Forståelse af et koncept kan betyde, at du kan anvende dette koncept til andre tanker.

Ordbog definitioner er nebulous. Der er intuitivt svar. Filosoffer har argumenteret over sådanne ting i århundreder.

forstå definition ordbog

For vores formål vil vi sige, at forståelse er evnen til præcist at udtrække betydning fra naturligt sprog . For at en computer skal forstå, skal den nøjagtigt behandle en indkommende talestrøm, konvertere den pågældende strøm til meningsenheder og være i stand til at reagere på input med noget, der er nyttigt.

Det er klart det hele meget vagt. Men det er det bedste, vi kan gøre med begrænset plads (og uden en neurofilosofi grad). Hvis en computer kan tilbyde en menneskelig eller i det mindste nyttig svar på en strøm af naturlig sprogindgang, kan vi sige det forstår. Dette er den definition, vi vil bruge fremad.

Et komplekst problem

Naturligt sprog er meget vanskeligt for en computer at håndtere. Du kan måske sige, "Siri, giv mig anvisninger til Punch Pizza", mens jeg måske siger, "Siri, Punch Pizza rute, tak."

I din udtalelse kan Siri vælge keyphrase "give mig retninger", og kør derefter en kommando relateret til søgeordet "Punch Pizza". I min skal Siri imidlertid vælge "rute" som nøgleordet og ved, at " Punch Pizza "er hvor jeg vil gå, ikke" tak. "Og det er bare et forenklet eksempel.

siri pizza kommando

Tænk på en kunstig intelligens, der læser e-mails og beslutter, om de kan være svindel eller ej. Eller en, der overvåger sociale medier indlæg for at måle interessen i et bestemt selskab. Jeg har engang arbejdet på et projekt, hvor vi skulle lære en computer at læse medicinske noter (som har alle mulige mærkelige konventioner) og hente oplysninger fra dem.

Dette betyder, at systemet skulle være i stand til at håndtere forkortelser, mærkelig syntaks, lejlighedsvise fejlstavelser og en lang række andre forskelle i noterne. Det er en meget kompleks opgave, der kan være svært selv for erfarne mennesker, meget mindre maskiner.

Indstilling af et eksempel

I dette særlige projekt var jeg en del af teamet, der lærte computeren at genkende bestemte ord og forholdet mellem ord. Det første skridt i processen var at vise computeren de oplysninger, som hver note indeholdt, så vi annoterede noterne.

Der var et stort antal forskellige kategorier af enheder og relationer. Tag sætningen "Fru. Grønnes hovedpine blev behandlet med ibuprofen, "for eksempel. Fru Green var mærket som en PERSON, hovedpine blev mærket som SIGN OR SYMPTOM, ibuprofen blev mærket som MEDICATION. Så var fru Green forbundet med hovedpine med et PRÆSENTER-forhold. Endelig var ibuprofen forbundet med hovedpine med et behandlingsforhold.

medicinsk note annotation

Vi markerede tusindvis af noter på denne måde. Vi kodede diagnoser, behandlinger, symptomer, bagvedliggende årsager, morbiditeter, doseringer og alt andet, du måske kunne tænke på i forbindelse med medicin. Andre annotationshold kodede for andre oplysninger, som syntax. Til sidst havde vi et corpus fyldt med medicinske noter, som AI kunne "læse".

Læsning er lige så svært at definere som forståelse. Computeren kan nemt se, at ibuprofen behandler en hovedpine, men når den lærer den information, omdannes den til meningsløse (til os) dem og nuller. Det kan helt sikkert give tilbage information, der synes at være menneskelig og er nyttig, men det betyder forståelse. Hvilken kunstig intelligens er ikke. Hvilken kunstig intelligens er ikke intelligent, menende robotter vil overtage verden? Ikke i dag - og måske aldrig. Læs mere ? Igen er det stort set et filosofisk spørgsmål.

Den rigtige Læring

På dette tidspunkt gik computeren gennem noterne og anvendte en række alarmer til maskinindlæring 4 Maskinindlæringsalgoritmer, der formede dit liv 4 Maskinindlæringsalgoritmer, der skaber dit liv Du kan måske ikke indse det, men maskinindlæring er allerede omkring dig, og det kan udøve en overraskende grad af indflydelse i dit liv. Tro mig ikke? Du kan blive overrasket. Læs mere . Programmører udviklede forskellige rutiner til tagging af tal, analyse af afhængigheder og valgkredse og mærkning af semantiske roller. I det væsentlige lærte AI at "læse" noterne.

Forskere kunne til sidst teste det ved at give det en lægeerklæring og bede om at mærke hver enhed og relation. Når computeren nøjagtigt gengivet menneskelige kommentarer, kunne man sige, at den lærte at læse de medicinske noter.

Derefter var det kun et spørgsmål om at indsamle en stor mængde statistikker om hvad den havde læst: hvilke stoffer bruges til at behandle hvilke lidelser, hvilke behandlinger der er mest effektive, de bagvedliggende årsager til specifikke symptomer osv. Ved afslutningen af processen vil AI kunne besvare lægeundersøgelser baseret på bevis fra faktiske medicinske noter. Det behøver ikke at stole på lærebøger, farmaceutiske virksomheder eller intuition.

Deep Learning

Lad os se på et andet eksempel. Googles DeepMind neurale netværk lærer at læse nyhedsartikler. Ligesom den biomedicinske AI ovenfor ønskede forskere, at det skulle trække relevant og nyttig information ud af større stykker tekst.

Træning af en AI om medicinsk information var hård nok, så du kan forestille dig, hvor meget annoterede data du vil have til at gøre en AI i stand til at læse generelle nyhedsartikler. Ansætte nok annotatorer og gennemgå tilstrækkelig information ville være forbudt dyrt og tidskrævende.

Så blev DeepMind-holdet til en anden kilde: nyhedswebsteder. Specielt CNN og Daily Mail.

Hvorfor disse websteder? Fordi de giver kuglepenne resumeer af deres artikler, der ikke blot trækker sætninger fra artiklen selv. Det betyder, at AI har noget at lære af. Forskere fortalte dybest set AI: "Her er en artikel, og her er de vigtigste oplysninger i den." Så bad de om at trække den samme type information fra en artikel uden punkterede højdepunkter.

Dette niveau af kompleksitet kan håndteres af et dybt neuralt netværk, hvilket er en særlig kompliceret type maskinindlæringssystem. (DeepMind-teamet laver nogle fantastiske ting på dette projekt. For at få detaljerne, se dette fantastiske overblik fra MIT Technology Review.)

Hvad kan en læsning gøre?

Vi har nu en generel forståelse for, hvordan computere lærer at læse. Du tager en stor mængde tekst, fortæller computeren, hvad der er vigtigt, og anvend nogle algoritmer til maskinlæring. Men hvad kan vi gøre med et AI, der trækker information fra tekst?

Vi ved allerede, at du kan trække specifikke handlinger fra medicinske noter og opsummere generelle nyhedsartikler. Der er et open source-program kaldet PAN, der analyserer poesi ved at trække ud temaer og billeder. Forskere bruger ofte maskine læring til at analysere store organer af sociale medier data, som bruges af virksomheder til at forstå brugerens følelser, se, hvad folk taler om, og find nyttige mønstre for markedsføring.

Forskere har brugt maskinindlæring til at få indsigt i e-mail-adfærd og effekterne af e-mail overbelastning. E-mail-udbydere kan bruge det til at filtrere spam fra din indbakke og klassificere nogle meddelelser som høj prioritet. Læsning af AI'er er afgørende for at gøre effektive kundeservice chatbots 8 Bots du bør føje til din Facebook Messenger App 8 Bots du skal føje til din Facebook Messenger App Facebook Messenger har åbnet for at chatte bots, hvilket giver virksomhederne mulighed for at levere kundeservice, nyheder og mere direkte til dig via appen. Her er nogle af de bedste tilgængelige. Læs mere . Overalt er der tekst, der er en forsker, der arbejder med naturlig sprogbehandling.

Og da denne type maskinindlæring forbedres, øges mulighederne kun. Computere er bedre end mennesker på skak, Go og videospil nu. Snart kan de være bedre til at læse og lære. Er dette det første skridt i retning af stærk AI Her er hvorfor forskere tror, at du bør være bekymret over kunstig intelligens. Her er hvorfor forskere tror, at du bør være bekymret for kunstig intelligens. Tror du, at kunstig intelligens er farlig? Kan AI udgøre en alvorlig risiko for menneskeheden. Det er nogle grunde til, at du måske vil være bekymret. Læs mere ? Vi bliver nødt til at vente og se, men det kan være.

Hvilke former for brug ser du til en tekstlæsning og læring AI? Hvilken slags maskinindlæring tror du, vi ses i den nærmeste fremtid? Del dine tanker i kommentarerne nedenfor!

Billedkreditter: Vasilyev Alexandr / Shutterstock