Mit forskning: fordeligheden af ​​tvetydighed i sprog


Mit forskning: fordeligheden af ​​tvetydighed i sprog

De fleste tror at sprog udviklet som en måde for folk at udveksle information, men sprogkundskaber og andre kommunikationsstuderende har længe begrundet over, hvorfor sprog udviklede sig. Berømte sprogkundskaber, blandt dem MITs Noam Chomsky, har diskuteret, at sproget faktisk er dårligt designet til kommunikation og at det kun er et biprodukt af et system, der måske har udviklet sig af andre grunde, måske for at strukturere vores egne private tanker.

Som bevis for deres teori fremhæver disse sprogkundskaber det faktum, at sproget er tvetydigt. De hævder, at i et system, der er optimeret til at formidle information mellem en højttaler og en lytter, ville hvert ord kun have en mening for at undgå enhver risiko for forvirring eller misforståelse. I en undersøgelse offentliggjort i tidsskriftet Kognition Et hold af MIT kognitive forskere har nu opretholdt lingvistiske hypoteser med en ny teori, der hævder, at tvetydighed faktisk gør sprog mere Effektiv, da det tillader genbrug af korte, effektive lyde, som lytterne nemt kan skelne afhængigt af sammenhængen.

Seniorforfatter af undersøgelsen Ted Gibson, en MIT professor i kognitiv videnskab siger:

"Forskellige mennesker har sagt, at tvetydighed er et kommunikationsproblem. Men når vi forstår den sammenhæng, er tvetydighed, så er tvetydighed ikke et problem. Det er noget, du kan drage fordel af, fordi du kan genbruge lette ord i forskellige sammenhænge igen og igen en gang til."

Ordet "Mean" er f.eks. Et ret ironisk eksempel på tvetydighed, da det selvfølgelig kan stå for at indikere og betegne noget, men det kan også henvise til en hensigt eller et formål, f.eks. Som i "Jeg mente at gå til butikken". Det kunne være et andet ord for noget eller nogen stødende eller ubehageligt, samt at henvise til det 'matematiske gennemsnit', og blot ved at tilføje et 's' i slutningen af ​​ordet gør definitionen endnu mere alsidig, for eksempel "a Betyder til en ende "refererer til et instrument eller en metode eller økonomisk forvaltning som i" at leve inden for ens midler ".

I betragtning af alle disse forskellige definitioner bliver bogstaveligt talt ingen, som mestrer det engelske sprog, forvirret, når man hører ordet "middel". Årsagen er, at de forskellige sanser af ordet forekommer i meget forskellige sammenhænge, ​​som gør det muligt for lytterne at fortolke sin betydning næsten automatisk.

Forskerne mener, at de enkleste ord for sprogbehandlingssystemer sandsynligvis eksisterer på grund af denne uklarhederende kontekst, som kan begrænse tvetydigheden af ​​sprog til genbrug af ord.

På baggrund af tidligere undersøgelser og observationer foreslår de, at ord med færre stavelser, højfrekvens og de enkleste udtalelser burde have de fleste betydninger.

For at undersøge deres teori gennemførte forskerne corpus-studier på hollandsk, engelsk og tysk. Et korpusstudium er studiet af sprog baseret på "real life" sprogeksempler, der er lagret i korpora (eller corpuses ), Dvs. computerbaserede databaser oprettet til sproglig forskning.

Deres teori om, at kortere ord, der forekom oftere og i overensstemmelse med sprogets typiske lydmønstre, plejer at være tvetydige, blev bekræftet, da de sammenlignede visse egenskaber af ord til deres antal betydninger. De observerede, at tendenserne var statistisk vigtige på alle tre sprog.

For at forstå, hvorfor tvetydighed gør et sprog mere i stedet for mindre effektivt, skal man undersøge en højttaler og lytterens konkurrerende ønsker. Mens en taler ønsker at sætte en lytter så meget som muligt med så få ord som muligt, søger lytteren at få en fuldstændig og specifik forståelse af, hvad højttalerne forsøger at formidle. Men som forskerne allerede har påpeget, er det "kognitivt billigere", hvis lytteren konkluderer visse ting fra kontekstens kontekst, snarere end at taleren skal bruge mere tid på længere og mere udførlige beskrivelser.

Resultatet er et system, der læner mod tvetydighed ved at genbruge de "letteste" ord. Piantadosi siger, at når sammenhængen er taget i betragtning, bliver det klart, at "tvetydighed er faktisk noget, du vil have i kommunikationssystemet."

Implikationer for datalogi

Ifølge forskerne viser den statistiske karakter af deres papir en udvikling inden for lingvistik, der begynder at afhænge mere af informationsteori og kvantitative metoder.

Gibson siger, at "Datavidenskabens indflydelse i lingvistikken lige nu er meget høj", og tilføjer, at naturligt sprogbehandling (NLP) er et vigtigt mål for dem, der opererer i krydset mellem de to felter.

Piantadosi fremhæver, at tvetydighed i det naturlige sprog præsenterer enorme udfordringer for NLP-udviklere og siger:

"Tvetydighed er kun godt for os [som mennesker], fordi vi har disse meget sofistikerede kognitive mekanismer til disambiguering. Det er virkelig svært at udarbejde detaljerne om, hvad de er, eller endda en form for tilnærmelse, som du kunne få en computer til at bruge."

Men som Gibson påpegede, har dette problem længe været kendt af computerforskere, og selv om den nye undersøgelse giver en bedre teoretisk og evolutionær forklaring på hvorfor der eksisterer tvetydighed, er det faktum, at "I grund og grund, hvis du har noget menneskeligt sprog i din Input eller output, du sidder fast med den nødvendige kontekst for at disambiguere, "eksisterer der stadig, siger han.

SCP-914 The Clockworks and Experiment Log 914 | Object Class Safe (Video Medicinsk Og Professionel 2019).

Afsnit Spørgsmål På Medicin: Psykiatri