Turingov test: Inteligenco spoznamo po komunikaciji. Ameriški robot prestal Turingov test

domov / Ustvarjanje

Ali lahko roboti razmišljajo? Kakšno umetno inteligenco bi morali šteti za inteligentno? Morda se zdi, da so ta vprašanja postala aktualna šele v našem stoletju, ko jih v resnici znanstvena skupnost rešuje že zelo dolgo. Osupljiv primer je slavni Turingov test, razvit leta 1950.

Alan Mathison Turing (1912–1954) je slavni angleški matematik, specialist za področja matematične logike, računalništva in kriptografije. Med njegovimi številnimi dosežki omenimo, da je leta 1936 predstavil zasnovo računalniškega stroja, ki je kasneje postal prototip računalnikov (Turingov stroj). Poleg tega je izdelal algoritem, ki je dešifriral sporočila iz »nezlomljivega« kriptografskega stroja Enigma, ki so ga nacisti uporabljali za prenos sporočil.

Turingov test: splošni opis

V skoraj 70 letih od prve objave se je postopek uspešnosti spreminjal, a bistvo Turingovega testa ostaja enako. Na kratko se lahko izrazi takole: če pri komunikaciji z osebo in strojem eksperimentator ne more ugotoviti, kateri od njiju je kateri, potem je stroj opravil test. Z drugimi besedami, ideja testa je, da mora računalnik s svojimi odgovori prepričati sogovornika (ki je tudi sodnik) o svoji človečnosti. To po Turingovih besedah ​​kaže na sposobnost razmišljanja umetne inteligence in naj bi postalo osnova za prepoznavanje njene inteligence.

Test Alana Turinga je empiričen. To pomeni, da temelji na izkušnjah, opazovanjih, empirično pridobljenih podatkih. Ideja za ta test je prišla iz salonske igre (takratne družabne igre) - Imitation Game. Pri tem so sodelovale vsaj tri osebe: ženska, moški in »sodnik« (obeh spolov). Moški in ženska sta šla k različne sobe in od tam so posredovali note tretjemu igralcu. Z njihovo pomočjo je bilo treba ugotoviti, v kateri sobi se nahaja predstavnik katerega spola. Hkrati so poskušali zmesti "sodnika": ženska se je lahko pretvarjala, da je moški, in obratno.

Seveda za izvedbo preizkusa sodnik ne sme videti sogovornika, slišati njegovega glasu itd. V nasprotnem primeru bo poskus očitno neuspešen, vendar to ne bo povezano z intelektualnimi zmožnostmi stroja. Praviloma je izbrana oblika komunikacije e-poštna korespondenca. V prvotni različici testa je oseba komunicirala z dvema subjektoma - drugo osebo in strojem. Malo kasneje je Turing spremenil odlomek - AI je imel nalogo prepričati številne sodnike o svoji inteligenci, ti pa so komunicirali z več ljudmi in več stroji. S tem se tudi izognemo subjektivnosti pri ocenjevanju in zmanjšamo tveganje preprostega ugibanja. Število eksperimentalnih strojev in ljudi v sodobnih različicah testa je različno, prav tako čas njihove komunikacije.

Sodnik se lahko s svojimi virtualnimi sogovorniki pogovarja, kar hoče: vprašanja Turingovega testa nimajo omejitev. To predstavlja dodaten izziv za stroj. Da bi dokončal takšno nalogo, mora računalniški program razumeti ne le človeški jezik, ampak tudi zagotoviti naravne odgovore na različne teme, ki ločujejo pomembna informacija iz nečesa nepomembnega za eno ali drugo smer pogovora.

Test je prvi opisal Turing v članku Computing Machinery and Intelligence, objavljenem v filozofski reviji Mind.

Odzivi sogovornika do sodnika prihajajo v točno določenih intervalih, tako da na podlagi njihove hitrosti ni mogoče sklepati. Zanimivo je, da so bile včasih slabosti programsko opremo je privedla do dejstva, da so se stroji odzvali počasneje kot ljudje, zato je bil računalnik tisti, ki je dobil prednost. Zdaj pa umetna inteligenca, nasprotno, deluje hitreje in ljudje potrebujejo čas za razmislek.

Film Ex Machina (2014) temelji na interpretaciji Turingovega testa. Glavna osebaže ve, da je pred njim robot, vendar mora ta robot s komunikacijo prepričati sogovornika o svoji človečnosti.

Slabosti Turingovega testa

Zdi se, da je ena glavnih pomanjkljivosti testa ta, da je naloga stroja dejansko zmedeti in zavajati osebo. Ali to pomeni, da lahko za razmišljujoče in inteligentne prepoznamo samo tiste, ki znajo zavajati in manipulirati? To vprašanje je bolj na področju filozofije. Še več, v teoriji opravil test Po Turingu mora robot dobro posnemati, ponavljati človeška dejanja in ne sme zmedeti sodnika. V praksi so se »manipulatorji« na testu odrezali bolje kot drugi – na primer tisti, ki so se pri odgovorih zatipkali. Stroji so bili za to celo posebej usposobljeni, da bi bila njihova korespondenca videti »bolj naravna«. Drug pogost računalniški trik je zamolčanje nečesa, nepopoln odgovor na vprašanje ali celo sklicevanje na nevednost. Sicer pa lahko umetno inteligenco ugotovimo po tem, da je »prepametna«.

Poleg tega kljub navedenemu namenu določanja inteligence in sposobnosti sklepanja test dejansko ocenjuje podobnost govorno vedenje računalnik in človek. To ne more biti objektivna ocena umetne inteligence kot celote, zlasti danes, ko so računalniki in roboti bistveno hitrejši od ljudi in lahko dosegajo impresivne rezultate na najrazličnejših področjih. To pomeni, da se sama sposobnost "dopisovanja kot oseba" ne more šteti za pomemben dosežek. Pravzaprav osredotočanje na Turingov test, ugotavljajo njegovi kritiki, prej upočasnjuje razvoj napredka kot ga spodbuja. Namesto da bi ustvarili nekaj še bolj popolnega in boljšega od nas, robotu vcepljamo svoje manj kot najboljše lastnosti in mu ne dovolimo, da bi šel naprej. Vendar pa moramo pri tem upoštevati dejstvo, da so bile ob nastanku testa zmogljivosti računalnikov bistveno nižje.

Eden od kritikov Turingovega testa in teze, da lahko roboti razmišljajo, je že skoraj 40 let John Searle, ki je kot dokaz predstavil miselni eksperiment.

Je kdo opravil Turingov test?

Vklopljeno ta trenutek Verjame se, da v vsej skoraj 70-letni zgodovini testa v svoji strogi različici še niso opravili. Včasih stroji uspejo prepričati sogovornika, da se pogovarja z osebo, vendar pogosto v takih primerih ni mogoče govoriti o opravljenem Turingovem testu. To na primer velja za situacije, ko "sodnik" ne ve, da komunicira s strojem in da celo sodeluje v nekem eksperimentu. Izkazalo se je, da namesto da bi opazoval sogovornika in delal sklepe, prisiljeni "eksperimentator" preprosto verjame, da komunicira z osebo, ker je sprva želel ravno tak pogovor. Zdelo se je tudi, da je Turingov test uspel, ko je bil nabor tem omejen in/ali malo časa za komunikacijo. Toda tudi tukaj ni bilo upoštevano pomembno načelo prvotnega testa - največja naravnost pogovora. Zato sledilci testa na splošno ugotavljajo, da se z njim še nihče ni spopadel.

Sam Turing je zapisal, da verjame, da bodo računalniki prestali ta preizkus do leta 2000.

Leta 2014 se je po medijih razširila novica, da naj bi bil test opravljen. To je naredil Eugene Goostman, "13-letni deček iz Odese." Takšni legendi je verjelo vsaj 10 od 30 sodnikov v sklopu tekmovanja, ki sta ga organizirala Britanska univerza Branje v počastitev 60. obletnice Turingove smrti. Leta 2012 je na podobnem tekmovanju v čast 100. obletnice njegovega rojstva Evgeniy uspel prepričati le 29% sodnikov. Vendar se njegovi rezultati ne štejejo za popoln test. Prvič, ker je to fant, ne odrasel, in drugič, ker angleški jezik njemu ni domače. Tako bi lahko sodniki logične napake in vrzeli v pripombah ter izogibanje odgovarjanju na za stroj neprimerne teme pojasnili z dejstvom, da »je še otrok« in »še vedno ne zna dobro jezika«.

Leta 2015 je Turingov test za klepetalne robote v ruščini uspešno prestal. Eksperiment sta organizirala podjetje Nanosemantics in fundacija Skolkovo v okviru razstave Startup Village. Nato je tekmovanje zmagala "14-letna Sonya Guseva iz Sankt Peterburga", ki jo je 47% od 15 sodnikov prepoznalo kot človeško.

Loebnerjevo nagrado za opravljen Turingov test

Povedati je treba, da si večina razvijalcev pri ustvarjanju robotov ne zastavi nepogrešljivega cilja, da opravi Turingov test. S praktičnega vidika se ta naloga težko šteje za najpomembnejšo. Hkrati je bila leta 1991 ustanovljena letna nagrada AI Loebner ali Loebner Prize. V njegovem okviru se umetne inteligence potegujejo za uspešnost tega preizkusa. Zagotavlja tri medalje - zlato (komunikacija z elementi videa in zvoka), srebrno (za besedilno korespondenco) in bronasto (podeljeno stroju, ki dano leto dosegli boljše rezultate). V skladu s pravili bo tekmovanje zaključeno, ko bo kdo od udeležencev prejel zlata medalja. Doslej še niso podelili ne zlata ne srebra.

Hkrati so nekateri avtomobili večkrat prejeli bronaste medalje, na primer A.L.I.C.E. (Artificial Linguistic Internet Computer Entity, dobesedno – Umetna lingvistična internetna računalniška entiteta). Običajno tekmovanje predstavlja projekte, ki so na začetku osredotočeni posebej na komunikacijo z osebo, v zadnjem času pa je še posebej veliko chatbotov. Glede na razvoj instant messengerjev in temu primerno chatbotov lahko pričakujemo, da bo za nagrado prispelo še več zanimivih aplikacij.

Standardna interpretacija Turingovega testa

Turingov test- empirični test, katerega idejo je predlagal Alan Turing v članku "Računalniški stroji in um", objavljenem leta 1950 v filozofski reviji Mind. Turing se je odločil ugotoviti, ali lahko stroj razmišlja.

Standardna razlaga tega testa je naslednja: " Oseba komunicira z enim računalnikom in eno osebo. Na podlagi odgovorov na vprašanja mora ugotoviti, s kom govori: z osebo ali računalniškim programom. Naloga računalniški program- zavesti osebo v napačno izbiro».

Vsi udeleženci testa se ne morejo videti. Če sodnik ne more z gotovostjo reči, kateri od sogovornikov je človek, se šteje, da je stroj opravil test. Preizkusiti inteligenco stroja in ne njegove sposobnosti prepoznavanja ustni govor, pogovor poteka v načinu »samo besedilo«, na primer z uporabo tipkovnice in zaslona (vmesni računalnik). Dopisovanje naj poteka v nadzorovanih intervalih, tako da sodnik ne more sklepati na podlagi hitrosti odgovorov. V Turingovem času so bili računalniki počasnejši od ljudi. Zdaj je to pravilo tudi nujno, saj reagirajo veliko hitreje kot ljudje.

Zgodba

Filozofsko ozadje

Čeprav so se raziskave umetne inteligence začele leta 1956, segajo njene filozofske korenine globoko v preteklost. Vprašanje, ali lahko stroj misli, ima dolgo zgodovino. Tesno je povezano z razlikami med dualističnimi in materialističnimi pogledi. Z vidika dualizma misel ni materialna (ali vsaj nima materialnih lastnosti), zato uma ni mogoče razložiti zgolj s fizikalnimi koncepti. Po drugi strani pa materializem trdi, da je um mogoče razložiti fizično, s čimer pušča odprto možnost umetno ustvarjenega uma.

Alan Turing

Do leta 1956 so britanski znanstveniki 10 let raziskovali »strojno inteligenco«. Vprašanje je bilo pogost predmet razprav med člani kluba Ratio, neformalne skupine britanskih kibernetikov in raziskovalcev elektronike, ki je vključevala Alana Turinga, po katerem je bil test poimenovan.

Turing se je posebej ukvarjal s problemom strojne inteligence vsaj od leta 1941. Ena njegovih prvih omemb o "računalniški inteligenci" je bila podana leta 1947. V svojem govoru "Inteligentni stroji" je Turing raziskal vprašanje, ali lahko stroj izkazuje inteligentno vedenje, in v tej študiji je predlagal, kaj bi lahko veljalo za predhodnika njegovih nadaljnjih raziskav: "Ni težko oblikovati stroja, ki lahko igra šah dobro. Zdaj pa vzemimo tri osebe- predmeti poskusa. A, B in C. Naj A in C slabo igrata šah, B pa naj bo upravljalec stroja. […] Uporabljata se dve sobi in nekaj mehanizmov za sporočanje gibov. Udeleženec C igra z A ali s strojem. Udeleženec C bo morda težko odgovoril, s kom igra.”

Tako je Turing do takrat, ko je leta 1950 objavil svoj članek »Računalniški stroji in inteligenca«, že vrsto let razmišljal o možnosti umetne inteligence. Vendar pa je bil ta članek Turingov prvi članek, ki se ukvarja izključno s tem konceptom.

Turing začne svoj članek z izjavo: "Predlagam, da razmislimo o vprašanju 'Ali lahko stroji razmišljajo?'." Poudarja, da je tradicionalni pristop k temu vprašanju najprej opredeliti pojma »stroj« in »inteligenca«. Turing pa je izbral drugačno pot; namesto tega je prvotno vprašanje nadomestil z drugim, "ki je tesno povezano z izvirnikom in je navedeno relativno nedvoumno." V bistvu predlaga zamenjavo vprašanja "Ali stroji razmišljajo?" vprašanje "Ali lahko stroji naredijo to, kar zmoremo mi (kot misleča bitja)?" Turing trdi, da je prednost novega vprašanja v tem, da potegne »jasno mejo med človeškimi fizičnimi in intelektualnimi sposobnostmi«.

Za prikaz tega pristopa Turing predlaga test, ki ga je navdihnila družabna igra "Imitation game." V tej igri sta moški in ženska poslana v ločeni sobi, gostje pa ju poskušajo ločiti tako, da jima postavijo vrsto pisnih vprašanj in preberejo natipkane odgovore nanje. Po pravilih igre tako moški kot ženska poskušata goste prepričati, da je vse ravno obratno. Turing predlaga predelavo igre na naslednji način: »Sedaj pa se vprašajmo, kaj bi se zgodilo, če bi v tej igri vlogo A igral stroj? Ali bi se spraševalec tako pogosto zmotil, kot če bi igral s človekom? ženska Ta vprašanja nadomeščajo prvotno » Ali lahko stroj misli?

V istem poročilu Turing kasneje predlaga "enakovredno" alternativno formulacijo, ki vključuje sodnika, ki se pogovarja samo z računalnikom in človekom. Čeprav nobena od teh formulacij ne ustreza natančno različici Turingovega testa, ki je danes najbolj znana, je znanstvenik leta 1952 predlagal tretjo. V tej različici testa, o kateri je Turing razpravljal na radiu BBC, žirija postavlja vprašanja računalniku, vloga računalnika pa je, da velik del žirije prepriča, da je v resnici človek.

Turingov dokument obravnava 9 predlaganih vprašanj, ki vključujejo vse glavne ugovore zoper umetno inteligenco, izražene od prve objave dokumenta.

Eliza in PARRY

Blay Whitby opozarja na štiri glavne prelomnice v zgodovini Turingovega testa - objavo članka "Computing Machines and Intelligence" leta 1950, napoved, da je Joseph Weizenbaum ustvaril program Eliza (ELIZA) leta 1966, in ustanovitev Kennetha Colbyja. programa PARRY, ki je bil prvič opisan leta 1972. , in Turingovega kolokvija leta 1990.

Načelo Elizinega dela je preučiti komentarje, ki jih vnesejo uporabniki, glede prisotnosti ključnih besed. Če je ključna beseda najdena, se uporabi pravilo, po katerem se uporabnikov komentar pretvori in vrne rezultatni stavek. Če ključne besede ni mogoče najti, Eliza vrne uporabniku splošen odgovor ali pa ponovi enega od prejšnjih komentarjev. Poleg tega je Weizenbaum programiral Elizo, da posnema vedenje terapevta, osredotočenega na stranko. To omogoča Elizi, da se "pretvarja, da ne ve skoraj nič o resničnem svetu." Z uporabo teh metod je Weisenbaumov program uspel zavesti nekatere ljudi, da so mislili, da se pogovarjajo z resnično osebo, nekatere pa je bilo "zelo težko prepričati, da Eliza […] ni človek." Na podlagi tega nekateri trdijo, da je Eliza eden od programov (morda prvi), ki je lahko opravil Turingov test. Vendar pa je ta izjava zelo sporna, saj so ljudje, ki so "spraševali", dobili navodila, da mislijo, da se bodo pogovarjali s pravim terapevtom, in se niso zavedali, da se lahko pogovarjajo z računalnikom.

Kolokvij o pogovornih sistemih, 2005

Novembra 2005 je Univerza v Surreyu gostila enodnevno srečanje razvijalcev ACE, ki so se ga udeležili zmagovalci praktičnih Turingovih testov v okviru tekmovanja za Loebnerjevo nagrado: Robby Garner, Richard Wallace, Rollo Carpenter. Gostujoči govorniki so bili David Hamill, Hugh Loebner in Huma Shah.

Simpozij društva AISB o Turingovem testu, 2008

Leta 2008 je skupaj z rednim natečajem za Loebnerjevo nagrado, ki je potekalo na Univerzi v Readingu, Društvo za preučevanje umetne inteligence in simulacije vedenja (AISB) pripravilo enodnevni simpozij, na katerem so razpravljali o Turingovem testu. Simpozij so organizirali John Barnden, Mark Bishop, Huma Shah in Kevin Warwick. Med govorniki so bili direktorica Kraljevega inštituta, baronica Susan Greenfield, Selmer Bringsjord, Turingov biograf Andrew Hodges in znanstvenik Owen Holland. Dogovora o kanoničnem Turingovem testu ni bilo, vendar je Bringsord predlagal, da bi večja premija spodbudila hitrejše opravljanje Turingovega testa.

Leto Alana Turinga in Turing-100 2012

Leta 2012 so praznovali rojstni dan Alana Turinga. Skozi leto je bilo veliko velikih dogodkov. Mnogi od njih so potekali v krajih, ki so imeli velik pomen v Turingovem življenju: Cambridge, Manchester in Bletchy Park. Leto Alana Turinga poteka pod nadzorom organizacije TCAC (Turing Centenary Advisory Committee), ki skrbi za strokovno in organizacijsko podporo prireditev v letu 2012. Podporni dogodki so tudi: ACM, ASL, SSAISB, BCS, BCTCS, Bletchy Park, BMC, BLC, CCS, Association CiE, EACSL, EATCS, FoLLI, IACAP, IACR, KGS in LICS.

Ustanovljen je bil poseben odbor za organizacijo dogodkov ob stoletnici Turingovega rojstva junija 2012, katerega naloga je posredovati Turingovo idejo o inteligentnem stroju, ki se odraža v hollywoodskih filmih, kot je Blade Runner, širši javnosti, vključno z otroki. Člani odbora so: Kevin Warwick, predsednik, Huma Sha, koordinator, Ian Bland, Chris Chapman, Marc Allen, Rory Dunlop, dobitnika nagrade Loebner Robbie Garne in Fred Roberts. Odbor podpirata Women in Technology in Daden Ltd.

Na tem tekmovanju so Rusi, katerih imena niso bila razkrita, predstavili program "Eugene". V 150 izvedenih testih (in pravzaprav petminutnih pogovorih) je sodelovalo pet udeležencev: najnovejši programi ki so se »izgubili« med 25 navadnimi ljudmi. Oddaja "Eugene", ki prikazuje 13-letnega dečka, ki živi v Odesi, je postala zmagovalka, saj je izpraševalce zavedla v 29,2% svojih odgovorov. Tako je program zgrešil le 0,8 % za popoln prehod test.

Turingov test v ruščini, 2015

Leta 2015 sta podjetje Nanosemantics in fundacija Skolkovo izvedla tekmovanje »Turingov test v ruščini«. Neodvisni sodniki izmed obiskovalcev konference Startup Village v Moskvi so komunicirali z 8 roboti, ki jih je izbral strokovni svet, in 8 prostovoljci jezikoslovci. Po 3 minutah pogovora v ruščini so sodniki ugotavljali, kateri od njihovih sogovornikov je robot in kateri ne. Vsak robot je opravil 15 pogovorov. Na tekmovanju je zmagal robot, ki ga je ustvaril Ivan Golubev iz Sankt Peterburga - "Sonya Guseva". Za osebo ga je zamenjalo 47 % sogovornikov.

Različice Turingovega testa

Omeniti velja, da sta v sovjetski psihologiji Vigotski L.S. in Lurija A.R.

Slabosti testa

Kljub vsem svojim prednostim in priljubljenosti je test kritiziran iz več razlogov.

Človeški um in um nasploh

Usmerjenost Turingovega testa je jasno izražena k človeku (antropomorfizem). Preizkuša se samo sposobnost stroja, da je podoben osebi, in ne inteligenca stroja na splošno. Test ne more oceniti splošne inteligence stroja iz dveh razlogov:

  • Včasih človeško vedenje kljubuje razumni razlagi. Turingov test hkrati zahteva, da je stroj sposoben posnemati vse vrste človeškega vedenja, ne glede na to, kako inteligenten je. Preizkuša tudi sposobnost posnemanja vedenja, ki se človeku ne bi zdelo razumno, kot je odziv na žalitve, skušnjava laganja ali preprosto veliko število tipkarske napake. Če stroj ne more natančno posnemati človeškega vedenja, tipkarskih napak in podobnega, potem pade na testu, kljub vsej inteligenci, ki jo morda ima.
  • Nekatera inteligentna vedenja niso lastna ljudem. Turingov test ne preizkuša visoko inteligentnega vedenja, kot je sposobnost reševanja kompleksnih problemov ali ustvarjanja izvirne ideje. V bistvu test zahteva, da stroj goljufa: ne glede na to, kako pameten je stroj, se mora pretvarjati, da ni preveč pameten, da lahko opravi test. Če je stroj sposoben hitro rešiti določen računalniški problem, ki presega zmožnosti človeka, bo po definiciji padel na preizkusu.

Nepraktičnost

Na podlagi eksponentne rasti tehnologije v več desetletjih je futurist Raymond Kurzweil predlagal, da bodo stroji, ki bodo sposobni prestati Turingov test, na voljo približno okoli leta 2020. To odmeva Moorov zakon.

Projekt Long Bet vključuje stavo v vrednosti 20.000 $ med Mitchom Kaporjem (pesimistom) in Raymondom Kurzweilom (optimistom). Pomen stave: bo računalnik do leta 2029 opravil Turingov test? Določeni so tudi nekateri stavni pogoji.

Različice Turingovega testa

O številnih različicah Turingovega testa, vključno s prej opisanimi, se razpravlja že kar nekaj časa.

Obratni Turingov test in CAPTCHA

Sprememba Turingovega testa, pri kateri se zamenja cilj ali ena ali več vlog stroja in človeka, se imenuje obratni Turingov test. Primer tega testa je podan v delu psihoanalitika Wilfreda Biona, ki je bil še posebej fasciniran nad načinom, kako se miselna aktivnost aktivira ob srečanju z drugim umom.

R. D. Hinshelwood, ki je razširil to idejo, je um opisal kot »aparat za prepoznavanje uma«, pri čemer je opozoril, da bi se to lahko štelo za »dodatek« k Turingovemu testu. Zdaj bo naloga računalnika ugotoviti, s kom se pogovarja: z osebo ali drugim računalnikom. To je dodatek k vprašanju, na katerega je Turing poskušal odgovoriti, vendar morda dovolj uvaja visok standard ugotoviti, ali lahko stroj »razmišlja« na način, ki ga običajno imenujemo oseba.

CAPTCHA je vrsta obratnega Turingovega testa. Preden dovoli izvedbo nekega dejanja na spletnem mestu, uporabnik dobi popačeno sliko z nizom številk in črk in mora ta niz vnesti v posebno polje. Namen te operacije je preprečiti, da bi avtomatizirani sistemi napadli spletno mesto. Razlog za takšno operacijo je, da adijo ni dovolj zmogljivih programov, da bi prepoznali in natančno reproducirali besedilo iz popačene slike (ali pa navadnim uporabnikom niso na voljo), zato se domneva, da je sistem, ki bi to lahko naredil z velika verjetnost se lahko šteje za osebo. Zaključek bo (čeprav ne nujno), da umetna inteligenca še ni ustvarjena.

Turingov test s strokovnjakom

Ta različica testa je opisana na naslednji način: odgovor stroja se ne sme razlikovati od odgovora strokovnjaka - specialista na določenem področju znanja.

Test nesmrtnosti

Test nesmrtnosti je različica Turingovega testa, ki ugotavlja, ali je bil lik osebe ustrezno posredovan, in sicer ali je kopirani lik mogoče razlikovati od lika osebe, ki je služila kot njegov izvor.

Minimalni test inteligentnega signala (MIST)

MIST je predlagal Chris McKinstry. V tej različici Turingovega testa sta dovoljeni samo dve vrsti odgovorov - "da" in "ne". Običajno se MIST uporablja za zbiranje statističnih informacij, ki se lahko uporabijo za merjenje učinkovitosti programov, ki izvajajo umetno inteligenco.

Meta Turingov test

V tej različici testa se subjekt (recimo računalnik) šteje za inteligentnega, če je ustvaril nekaj, kar sam želi preizkusiti glede inteligence.

Hutterjeva nagrada

Organizatorji Hutterjeve nagrade menijo, da je stiskanje besedila v naravnem jeziku težka naloga za umetno inteligenco, enakovredna prestajanju Turingovega testa.

Test stiskanja informacij ima določene prednosti pred večino variant in različic Turingovega testa:

  • Njegov rezultat je ednina, po katerem je mogoče presoditi, kateri od obeh avtomobilov je »bolj inteligenten«.
  • Računalnik ni dolžan lagati sodniku - naučiti računalnike lagati velja za slabo idejo.

Glavne slabosti tega testa so:

  • Nemogoče je preizkusiti osebo z njeno pomočjo.
  • Ni znano, kakšen rezultat (če sploh) je enakovreden uspešnosti Turingovega testa (na človeški ravni).

Drugi inteligenčni testi

Obstaja veliko testov inteligence, ki se uporabljajo za testiranje ljudi. Možno je, da jih je mogoče uporabiti za testiranje umetne inteligence. Nekateri testi (kot je test C), ki izhajajo iz Kolmogorove kompleksnosti, se uporabljajo za testiranje ljudi in računalnikov.

BotPrize test

Dvema ekipama programerjev je uspelo zmagati na tekmovanju BotPrize, ki se imenuje "različica igre" Turingovega testa. Rezultati testa so objavljeni na spletnem mestu BotPrize; NewScientist jih na kratko analizira. BotPrize test je potekal v večuporabniški obliki Računalniška igra(Unreal Tournament 2004), katerega like so nadzorovali resnični ljudje ali računalniški algoritmi.

Standardna interpretacija Turingovega testa

Turingov test- empirični test, katerega idejo je predlagal Alan Turing v članku "Računalniški stroji in inteligenca" (angl. Računalniški stroji in inteligenca ), objavljeno leta 1950 v filozofski reviji "Misl". Turing se je odločil ugotoviti, ali lahko stroj razmišlja.

Standardna razlaga tega testa je naslednja: " Oseba komunicira z enim računalnikom in eno osebo. Na podlagi odgovorov na vprašanja mora ugotoviti, s kom govori: z osebo ali računalniškim programom. Namen računalniškega programa je zavesti osebo, da naredi napačno izbiro.».

Vsi udeleženci testa se ne morejo videti. Če sodnik ne more z gotovostjo reči, kateri od sogovornikov je človek, se šteje, da je stroj opravil test. Da bi preizkusili inteligenco stroja in ne njegove sposobnosti prepoznavanja govorjenega jezika, se pogovor izvaja v načinu »samo besedilo«, na primer z uporabo tipkovnice in zaslona (vmesni računalnik). Dopisovanje naj poteka v nadzorovanih intervalih, tako da sodnik ne more sklepati na podlagi hitrosti odgovorov. V Turingovem času so bili računalniki počasnejši od ljudi. Zdaj je to pravilo nujno, ker reagirajo veliko hitreje kot ljudje.

Zgodba

Filozofsko ozadje

Čeprav so se raziskave umetne inteligence začele leta 1956, segajo njene filozofske korenine globoko v preteklost. Vprašanje, ali lahko stroj misli ali ne, ima dolgo zgodovino. Tesno je povezano z razlikami med dualističnimi in materialističnimi pogledi. Z vidika dualizma misel ni materialna (ali vsaj nima materialnih lastnosti), zato uma ni mogoče razložiti zgolj s fizikalnimi koncepti. Po drugi strani pa materializem trdi, da je um mogoče razložiti fizično, s čimer pušča odprto možnost umetno ustvarjenega uma.

Alan Turing

Do leta 1956 so britanski znanstveniki 10 let raziskovali »strojno inteligenco«. Vprašanje je bilo pogost predmet razprav med člani kluba Ratio, neformalne skupine britanskih kibernetikov in raziskovalcev elektronike, ki je vključevala Alana Turinga, po katerem je bil test poimenovan.

Turing se je posebej ukvarjal s problemom strojne inteligence vsaj od leta 1941. Ena njegovih prvih omemb o "računalniški inteligenci" je bila podana leta 1947. V svojem govoru "Inteligentni stroji" je Turing raziskal vprašanje, ali lahko stroj izkazuje inteligentno vedenje, in v tej študiji je predlagal, kaj bi lahko veljalo za predhodnika njegovih nadaljnjih raziskav: "Ni težko oblikovati stroja, ki lahko igra šah dobro. Zdaj pa vzemimo tri osebe - subjekte eksperimenta. A, B in C. Naj A in C slabo igrata šah, B pa naj bo upravljalec stroja. […] Uporabljata se dve sobi in nekaj mehanizmov za sporočanje gibov. Udeleženec C igra z A ali s strojem. Udeleženec C bo morda težko odgovoril, s kom igra.”

Tako je Turing do takrat, ko je leta 1950 objavil svoj članek »Računalniški stroji in inteligenca«, že vrsto let razmišljal o možnosti umetne inteligence. Vendar pa je bil ta članek Turingov prvi članek, ki se ukvarja izključno s tem konceptom.

Turing začne svoj članek z izjavo: "Predlagam, da razmislimo o vprašanju 'Ali lahko stroji razmišljajo?'." Poudarja, da je tradicionalni pristop k temu vprašanju najprej opredeliti pojma »stroj« in »inteligenca«. Turing pa je izbral drugačno pot; namesto tega je prvotno vprašanje nadomestil z drugim, "ki je tesno povezano z izvirnikom in je navedeno relativno nedvoumno." V bistvu predlaga zamenjavo vprašanja "Ali stroji razmišljajo?" vprašanje "Ali lahko stroji naredijo to, kar zmoremo mi (kot misleča bitja)?" Turing trdi, da je prednost novega vprašanja v tem, da potegne »jasno mejo med človeškimi fizičnimi in intelektualnimi sposobnostmi«.

Za prikaz tega pristopa Turing predlaga test, ki ga je navdihnila družabna igra "Imitation game." V tej igri sta moški in ženska poslana v ločeni sobi, gostje pa ju poskušajo ločiti tako, da jima postavijo vrsto pisnih vprašanj in preberejo natipkane odgovore nanje. Po pravilih igre tako moški kot ženska poskušata goste prepričati, da je vse ravno obratno. Turing predlaga predelavo igre na naslednji način: »Sedaj pa se vprašajmo, kaj bi se zgodilo, če bi v tej igri vlogo A igral stroj? Ali bi se spraševalec tako pogosto zmotil, kot če bi igral s človekom? ženska Ta vprašanja nadomeščajo prvotno » Ali lahko stroj misli?

V istem poročilu Turing kasneje predlaga "enakovredno" alternativno formulacijo, ki vključuje sodnika, ki se pogovarja samo z računalnikom in človekom. Čeprav nobena od teh formulacij ne ustreza natančno različici Turingovega testa, ki je danes najbolj znana, je znanstvenik leta 1952 predlagal tretjo. V tej različici testa, o kateri je Turing razpravljal na radiu BBC, žirija postavlja vprašanja računalniku, vloga računalnika pa je, da velik del žirije prepriča, da je v resnici človek.

Turingov dokument obravnava 9 predlaganih vprašanj, ki vključujejo vse glavne ugovore zoper umetno inteligenco, izražene od prve objave dokumenta.

Eliza in PARRY

Blay Whitby opozarja na 4 glavne prelomnice v zgodovini Turingovega testa - objavo članka "Computing Machines and Intelligence" leta 1950, napoved, da je Joseph Weizenbaum ustvaril program Eliza (ELIZA) leta 1966, Kenneth Colby pa je ustvaril program Eliza. program PARRY, ki je bil prvič opisan leta 1972, in Turingov kolokvij leta 1990.

Načelo Elizinega dela je preučiti komentarje, ki jih vnesejo uporabniki, glede prisotnosti ključnih besed. Če je ključna beseda najdena, se uporabi pravilo, po katerem se uporabnikov komentar pretvori in vrne rezultatni stavek. Če ključne besede ni mogoče najti, Eliza vrne uporabniku splošen odgovor ali pa ponovi enega od prejšnjih komentarjev. Poleg tega je Weizenbaum programiral Elizo, da posnema vedenje terapevta, osredotočenega na stranko. To omogoča Elizi, da se "pretvarja, da ne ve skoraj nič o resničnem svetu." Z uporabo teh metod je Weisenbaumov program uspel zavesti nekatere ljudi, da so mislili, da se pogovarjajo z resnično osebo, nekatere pa je bilo "zelo težko prepričati, da Eliza […] ni človek." Na podlagi tega nekateri trdijo, da je Eliza eden od programov (morda prvi), ki je lahko opravil Turingov test. Vendar pa je ta izjava zelo sporna, saj so ljudje, ki so "spraševali", dobili navodila, da mislijo, da se bodo pogovarjali s pravim terapevtom, in se niso zavedali, da se lahko pogovarjajo z računalnikom.

Kolokvij o pogovornih sistemih, 2005

Novembra 2005 je Univerza v Surreyu gostila enodnevno srečanje razvijalcev ACE, ki so se ga udeležili zmagovalci praktičnih Turingovih testov v okviru tekmovanja za Loebnerjevo nagrado: Robby Garner, Richard Wallace, Rollo Carpenter. Gostujoči govorniki so bili David Hamill, Hugh Loebner in Huma Shah.

Simpozij društva AISB o Turingovem testu, 2008

Leta 2008 je skupaj z rednim natečajem za Loebnerjevo nagrado, ki je potekalo na Univerzi v Readingu, Društvo za preučevanje umetne inteligence in simulacije vedenja (AISB) pripravilo enodnevni simpozij, na katerem so razpravljali o Turingovem testu. Simpozij so organizirali John Barnden, Mark Bishop, Huma Shah in Kevin Warwick. Med govorniki so bili direktorica Kraljevega inštituta, baronica Susan Greenfield, Selmer Bringsjord, Turingov biograf Andrew Hodges in znanstvenik Owen Holland. Dogovora o kanoničnem Turingovem testu ni bilo, vendar je Bringsord predlagal, da bi večja premija spodbudila hitrejše opravljanje Turingovega testa.

Leto Alana Turinga in Turing-100 2012

Leta 2012 bo praznoval rojstni dan Alana Turinga. Skozi vse leto se bo zvrstilo veliko odličnih dogodkov. Mnogi od njih se bodo odvijali na mestih, ki so bila pomembna v Turingovem življenju: Cambridge, Manchester in Bletchy Park. Leto Alana Turinga poteka pod nadzorom organizacije TCAC (Turing Centenary Advisory Committee), ki skrbi za strokovno in organizacijsko podporo prireditev v letu 2012. Podporni dogodki so tudi: ACM, ASL, SSAISB, BCS, BCTCS, Bletchy Park, BMC, BLC, CCS, Association CiE, EACSL, EATCS, FoLLI, IACAP, IACR, KGS in LICS.

Za organizacijo dogodkov ob stoletnici Turingovega rojstva junija 2012 je bil ustanovljen poseben odbor, katerega naloga je posredovati Turingovo sporočilo o inteligentnem stroju, ki se odraža v hollywoodskih filmih, kot je Blade Runner, širši javnosti, vključno z otroki. Člani odbora so: Kevin Warwick, predsednik, Huma Sha, koordinator, Ian Bland, Chris Chapman, Marc Allen, Rory Dunlop, dobitnika nagrade Loebner Robbie Garne in Fred Roberts. Odbor podpirata Women in Technology in Daden Ltd.

Na tem tekmovanju so Rusi, katerih imena niso bila razkrita, predstavili program "Eugene". V 150 izvedenih testih (in pravzaprav petminutnih pogovorih) je sodelovalo pet novih programov, ki so se »izgubili« med 25 navadnimi ljudmi. Oddaja "Eugene", ki prikazuje 13-letnega dečka, ki živi v Odesi, je postala zmagovalka, saj je izpraševalce zavedla v 29,2% svojih odgovorov. Tako je programu manjkalo le 0,8 %, da bi v celoti prestal test.

Različice Turingovega testa

Igra posnemanja, kot jo opisuje Turing v članku "Računalniški stroji in inteligenca". Igralec C z nizom vprašanj poskuša ugotoviti, kateri od ostalih dveh igralcev je moški in kateri ženska. Igralec A, moški, poskuša zmesti igralca C, igralec B pa poskuša pomagati C-ju.

Začetni test, ki temelji na simulacijski igri, v kateri namesto igralca A igra računalnik. Računalnik bi zdaj moral zmešati igralca C, medtem ko igralec B še naprej poskuša pomagati gostitelju.

Obstajajo vsaj tri glavne različice Turingovega testa, od katerih sta bili dve predlagani v članku "Računalniški stroji in inteligenca", tretja različica, v terminologiji Saula Traigerja, pa je standardna razlaga.

Medtem ko obstaja nekaj razprav o tem, ali sodobna razlaga ustreza temu, kar je Turing opisal, ali je rezultat napačne razlage njegovega dela, se tri različice ne štejejo za enakovredne, njihove prednosti in slabosti pa se razlikujejo.

Igra posnemanja

Turing je, kot že vemo, opisal preprosta igra za zabave, ki vključujejo najmanj tri igralce. Igralec A je moški, igralec B je ženska in igralec C, ki igra vlogo voditelja pogovora, je katerega koli spola. Po pravilih igre C ne vidi ne A ne B in lahko z njima komunicira samo s pisnimi sporočili. Z vprašanji igralcema A in B skuša C ugotoviti, kateri od njiju je moški in kateri ženska. Naloga igralca A je, da zmede igralca C, da naredi napačen sklep. Hkrati je naloga igralca B pomagati igralcu C pri pravilni presoji.

V tem, kar S. G. Sterret imenuje Original Imitation Game Test, Turing predlaga, da vlogo igralca A igra računalnik. Tako je naloga računalnika, da se pretvarja, da je ženska, da bi zmedel igralca C. Uspeh takšne naloge se oceni s primerjavo izidov igre, ko je igralec A računalnik, in izidov, ko je igralec A moški:

Drugo možnost je predlagal Turing v istem članku. Kot v začetnem preizkusu vlogo igralca A igra računalnik. Razlika je v tem, da lahko vlogo igralca B igra moški ali ženska.

»Poglejmo konkreten računalnik. Ali je res, da lahko s spremembo tega računalnika, da ima dovolj prostora za shranjevanje, povečanjem njegove hitrosti in ustreznim programom, oblikujemo tak računalnik tako, da zadovoljivo igra vlogo igralca A v simulacijski igri, medtem ko vlogo igralca B izvaja moški?" - Turing, 1950, str. 442.

V tej različici oba igralca A in B poskušata prepričati vodjo, da sprejme napačno odločitev.

Standardna razlaga

Glavna ideja te različice je, da namen Turingovega testa ni odgovoriti na vprašanje, ali lahko stroj preslepi vodjo, temveč odgovoriti na vprašanje, ali lahko stroj posnema osebo ali ne. Čeprav obstaja nekaj razprav o tem, ali je to možnost nameraval Turing ali ne, Sterrett meni, da je to možnost nameraval Turing in tako združuje drugo možnost s tretjo. Hkrati skupina nasprotnikov, vključno s Treygerjem, ne misli tako. Toda to je še vedno vodilo do tega, kar bi lahko imenovali "standardna razlaga". V tej različici je igralec A računalnik, igralec B je oseba katerega koli spola. Naloga voditelja zdaj ni določiti, kdo od njiju je moški in ženska, ampak kdo od njiju je računalnik in kdo človek.

Igra imitacije v primerjavi s standardnim Turingovim testom

Obstaja nesoglasje o tem, katero možnost je imel Turing v mislih. Sterrett vztraja, da iz Turingovega dela izhajata dve stvari. različne možnosti testi, ki po Turingu med seboj niso enakovredni. Test, ki uporablja družabno igro in primerja stopnje uspešnosti, se imenuje Original Imitation Game Test, medtem ko se test, ki temelji na sodnikovem pogovoru s človekom in strojem, imenuje Standard Turing Test, pri čemer ugotavlja, da ga Sterrett enači s standardno interpretacijo, in ne na drugo različico simulacijske igre.

Sterrett se strinja, da ima standardni Turingov test (STT) pomanjkljivosti, na katere opozarja njegova kritika. A meni, da je, nasprotno, originalni test, ki temelji na igri posnemanja (OIG Test - Original Imitation Game Test) prikrajšan za številne izmed njih zaradi ključne razlike: Za razliko od STT ne upošteva človeško podobnega vedenja kot glavnega kriterija, čeprav upošteva človeško vedenje kot znak strojne inteligence. Oseba lahko pade na testu OIG, zato se verjame, da je to zasluga testa inteligence. Neuspešno opravljen test kaže na pomanjkanje iznajdljivosti: test OIG po definiciji meni, da je inteligenca povezana z iznajdljivostjo in ni zgolj "posnemanje pogovornega vedenja osebe". IN splošni pogled Test OIG se lahko uporablja celo v neverbalni različici.

Vendar pa so drugi pisci razlagali Turingove besede kot nakazovanje, da je treba samo simulacijsko igro obravnavati kot preizkus. Poleg tega ni pojasnjeno, kako povezati to stališče in Turingove besede, da test, ki ga je predlagal na podlagi partijske igre, temelji na kriteriju primerjalne pogostosti uspeha v tej imitacijski igri in ne na sposobnosti zmage. krog igre.

Ali bi moral sodnik vedeti za računalnik?

Turing v svojih delih ne pojasnjuje, ali sodnik ve, da bo med testiranci računalnik ali ne. Kar zadeva OIG, Turing pravi le, da je treba igralca A zamenjati s strojem, ne pove pa, ali igralec C to ve ali ne. Ko so Colby, F.D. Hilf in A.D. Kramer testirali PARRY, so se odločili, da sodnikom ni treba vedeti, da bo eden ali več sogovornikov računalnikov. Kot ugotavljajo A. Saygin in drugi strokovnjaki, to pušča pomemben pečat na izvedbi in rezultatih testiranja.

Prednosti testa

Širina teme

Moč Turingovega testa je, da lahko govorite o čemer koli. Turing je zapisal, da se "metoda vprašanja in odgovora zdi primerna za razpravo o skoraj vseh področjih človeškega zanimanja, o katerih želimo razpravljati." John Hogeland je dodal, da »samo razumevanje besed ni dovolj; razumeti morate tudi temo pogovora.« Da bi prestal dobro zasnovan Turingov test, mora stroj uporabljati naravni jezik, razmišljati, imeti znanje in se učiti. Preizkus je mogoče otežiti z vključitvijo video vhoda ali na primer z opremljanjem prehoda za prenos predmetov: stroj bo moral pokazati sposobnost videnja in robotike. Vse te naloge skupaj odražajo glavne probleme, s katerimi se sooča teorija umetne inteligence.

Skladnost in enostavnost

Moč in privlačnost Turingovega testa izhaja iz njegove preprostosti. Filozofi zavesti, psihologija v sodobni nevroznanosti ne morejo podati definicij »inteligence« in »mišljenja«, če so dovolj natančne in splošno uporabne za stroje. Brez takšne opredelitve ni mogoče odgovoriti na osrednja vprašanja filozofije o umetni inteligenci. Čeprav je Turingov test nepopoln, vsaj zagotavlja, da ga je mogoče dejansko izmeriti. Kot taka je pragmatična rešitev težkih filozofskih vprašanj.

Slabosti testa

Kljub vsem svojim prednostim in priljubljenosti je test kritiziran iz več razlogov.

Človeški um in um nasploh

Človeško vedenje in racionalno vedenje

Usmerjenost Turingovega testa je jasno izražena k človeku (antropomorfizem). Preizkuša se samo sposobnost stroja, da je podoben osebi, in ne inteligenca stroja na splošno. Test ne more oceniti splošne inteligence stroja iz dveh razlogov:

  • Včasih človeško vedenje kljubuje razumni razlagi. Turingov test hkrati zahteva, da je stroj sposoben posnemati vse vrste človeškega vedenja, ne glede na to, kako inteligenten je. Preizkuša tudi sposobnost posnemanja vedenja, ki se človeku ne bi zdelo razumno, na primer odziv na žalitve, skušnjavo laganja ali preprosto veliko število tipkarskih napak. Če stroj ne more natančno posnemati človeškega vedenja, tipkarskih napak in podobnega, potem pade na testu, kljub vsej inteligenci, ki jo morda ima.
  • Nekatera inteligentna vedenja niso lastna ljudem. Turingov test ne preizkuša visoko inteligentnega vedenja, kot je sposobnost reševanja zapletenih problemov ali ustvarjanja izvirnih idej. V bistvu test zahteva, da stroj goljufa: ne glede na to, kako pameten je stroj, se mora pretvarjati, da ni preveč pameten, da lahko opravi test. Če je stroj sposoben hitro rešiti določen računalniški problem, ki presega zmožnosti človeka, bo po definiciji padel na preizkusu.

Nepraktičnost

Na podlagi eksponentne rasti tehnologije v več desetletjih je futurist Raymond Kurzweil predlagal, da bodo stroji, ki bodo sposobni prestati Turingov test, na voljo približno okoli leta 2020. To odmeva Moorov zakon.

Projekt Long Bet vključuje stavo v vrednosti 20.000 $ med Mitchom Kaporjem (pesimistom) in Raymondom Kurzweilom (optimistom). Pomen stave: bo računalnik do leta 2029 opravil Turingov test? Določeni so tudi nekateri stavni pogoji.

Različice Turingovega testa

O številnih različicah Turingovega testa, vključno s prej opisanimi, se razpravlja že kar nekaj časa.

Obratni Turingov test in CAPTCHA

Sprememba Turingovega testa, pri kateri se zamenja cilj ali ena ali več vlog stroja in človeka, se imenuje obratni Turingov test. Primer tega testa je podan v delu psihoanalitika Wilfreda Biona, ki je bil še posebej fasciniran nad načinom, kako se miselna aktivnost aktivira ob srečanju z drugim umom.

R. D. Hinshelwood, ki je razširil to idejo, je um opisal kot »aparat za prepoznavanje uma«, pri čemer je opozoril, da bi se to lahko štelo za »dodatek« k Turingovemu testu. Zdaj bo naloga računalnika ugotoviti, s kom se pogovarja: z osebo ali drugim računalnikom. Ta dodatek k vprašanju je tisto, na kar je Turing poskušal odgovoriti, vendar verjetno uvaja dokaj visok standard za ugotavljanje, ali lahko stroj »razmišlja« na način, ki bi ga običajno uporabili za človeka.

CAPTCHA je vrsta obratnega Turingovega testa. Preden dovoli izvedbo nekega dejanja na spletnem mestu, uporabnik dobi popačeno sliko z nizom številk in črk in mora ta niz vnesti v posebno polje. Namen te operacije je preprečiti, da bi avtomatizirani sistemi napadli spletno mesto. Razlog za takšno operacijo je, da adijo Ni dovolj zmogljivih programov, da bi prepoznali in natančno reproducirali besedilo iz popačene slike (ali pa so navadnim uporabnikom nedostopni), zato se domneva, da je sistem, ki bi to zmogel, najverjetneje človeški. Zaključek bo (čeprav ne nujno), da umetna inteligenca še ni ustvarjena.

Turingov test s strokovnjakom

Ta različica testa je opisana na naslednji način: odgovor stroja se ne sme razlikovati od odgovora strokovnjaka - specialista na določenem področju znanja. Z razvojem tehnologij za skeniranje človeškega telesa bo mogoče kopirati potrebne informacije iz telesa in možganov v računalnik.

Test nesmrtnosti

Test nesmrtnosti je različica Turingovega testa, ki ugotavlja, ali je bil lik osebe ustrezno posredovan, in sicer ali je kopirani lik mogoče razlikovati od lika osebe, ki je služila kot njegov izvor.

Minimalni test inteligentnega signala (MIST)

MIST je predlagal Chris McKinstry. V tej različici Turingovega testa sta dovoljeni samo dve vrsti odgovorov - "da" in "ne". Običajno se MIST uporablja za zbiranje statističnih informacij, ki se lahko uporabijo za merjenje učinkovitosti programov, ki izvajajo umetno inteligenco.

Meta Turingov test

V tej različici testa se subjekt (recimo računalnik) šteje za inteligentnega, če je ustvaril nekaj, kar sam želi preizkusiti glede inteligence.

Hutterjeva nagrada

Organizatorji Hutterjeve nagrade menijo, da je stiskanje besedila v naravnem jeziku težka naloga za umetno inteligenco, enakovredna prestajanju Turingovega testa.

Test stiskanja informacij ima določene prednosti pred večino variant in različic Turingovega testa:

  • Njegov rezultat je ena sama številka, po kateri lahko presodimo, kateri od obeh strojev je "bolj inteligenten".
  • Računalnik ni dolžan lagati sodniku - naučiti računalnike lagati velja za slabo idejo.

Glavne slabosti tega testa so:

  • Nemogoče je preizkusiti osebo z njeno pomočjo.
  • Ni znano, kakšen rezultat (če sploh) je enakovreden uspešnosti Turingovega testa (na človeški ravni).

Drugi inteligenčni testi

Obstaja veliko testov inteligence, ki se uporabljajo za testiranje ljudi. Možno je, da jih je mogoče uporabiti za testiranje umetne inteligence. Nekateri testi (kot je test C), ki izhajajo iz Kolmogorove kompleksnosti, se uporabljajo za testiranje ljudi in računalnikov.

Besedilo
Artjom Lučko

Britanska univerza v Readingu je z velikim pompom objavila, da je bil dosežen "veliki mejnik v zgodovini računalništva" in da je računalnik prvič pravilno opravil Turingov test, kar je zavedlo sodnike, da so verjeli, da komunicira s 13-letnikom. Ukrajinski fant. Look At Me je ugotovil, kaj se v resnici skriva za tem dogodkom.

Kakšen je bil poskus


Univerza v Readingu, ki je izvedla prvi uspešen Turingov test

Preizkus chatbota je organizirala Šola za sistemski inženiring na Univerzi v Readingu, da bi obeležili 60. obletnico smrti Alana Turinga. Strokovnjaki so hkrati komunicirali z živo osebo in s programom, pri čemer so bili v različnih prostorih. Na koncu preizkusa se mora vsak sodnik opredeliti, kateri od njegovih dveh sogovornikov je oseba in kateri program. Za čistost eksperimenta je bilo uporabljenih pet računalnikov in 30 sodnikov, od katerih je vsak izvedel serijo 10 pisnih dialogov, ki so trajali 5 minut. Čeprav običajno na letnem tekmovanju programov umetne inteligence za Loebnerjevo nagrado ( v katerem programi tekmujejo za opravljanje Turingovega testa za nagrado 2000 $) Sodelujejo le 4 chatboti in 4 osebe. Kot rezultat eksperimenta je programu Eugene Goostman uspelo prepričati 33% žirije o svoji "človečnosti", kar se je zgodilo prvič v zgodovini. Robert Llewellyn, eden od sodnikov, britanski igralec in tehnološki navdušenec, je dejal:

Turingov test je bil neverjeten. Bilo je 10 sej po 5 minut, 2 zaslona, ​​1 oseba in 1 stroj. Samo 4-krat sem pravilno uganil. Ta robot se je izkazal za pametnega fanta ...

Chatbot Eugene Goostman je razvil Rus Vladimir Veselov (zdaj živi v ZDA) in Ukrajinec Evgeniy Demchenko, ki živi v Rusiji. Prva različica se je pojavila leta 2001. Starost najstnika ni bila izbrana po naključju: pri 13 letih otrok že ve veliko, ne pa vsega, kar otežuje nalogo sodnikov. Leta 2012 se je chatbot že precej približal uspehu: takrat je 29 % sodnikov verjelo v »človečnost« ukrajinskega šolarja. Programerjem je ob zadnjih izboljšavah uspelo virtualnega sogovornika pripraviti na vsa možna vprašanja in ga celo naučiti izbrati primere odgovorov na Twitterju.

Kaj je Turingov test,
in kakšne so njegove slabosti


Alan Turing star 16 let

Turingov test je prvi predlagal britanski matematik Alan Turing v svojem članku Računalništvo in inteligenca, objavljenem v reviji Mind leta 1950. V njem je znanstvenik postavil preprosto vprašanje: "Ali lahko stroj razmišlja." V najpreprostejši obliki je test naslednji: oseba komunicira z enim računalnikom in eno osebo. Na podlagi odgovorov na vprašanja mora ugotoviti, s kom govori: z osebo ali računalniškim programom. Namen računalniškega programa je zavesti osebo, da naredi napačno izbiro. Preizkus vključuje petminutni besedilni pogovor, med katerim mora vsaj 30 % sodnikov verjeti, da imajo opravka s človekom in ne s strojem. V tem primeru se vsi udeleženci testa seveda ne vidijo.


John Searle, ameriški filozof

Obstaja veliko različnih različic tega testa (v nekaterih različicah sodnik ve, da je eden od testiranih sogovornikov računalnik, v drugih pa za to ne ve), vendar ga mnogi znanstveniki in filozofi kritizirajo še danes. Ameriški filozof John Searle je preizkus izzval z miselnim eksperimentom, znanim kot "Kitajska soba". Dovolil si je namigovati, da sposobnost računalnika, da vodi pogovor in prepričljivo odgovarja na vprašanja, še zdaleč ni enaka kot imeti um in razmišljati kot oseba. »Predpostavimo, da sem bil zaklenjen v sobo in […] da ne znam niti ene besede kitajščine, ne pisane ne govorjene,« piše Searle leta 1980. Si je predstavljal, da je prejel vprašanja, zapisana v kitajski skozi vrzel v steni. Teh simbolov ni mogel brati, vendar je imel nabor navodil v angleščini, ki so mu omogočala, da se je na "en niz formalnih simbolov odzval z drugim nizom formalnih simbolov." Tako bi Searle teoretično lahko odgovoril na vprašanja preprosto tako, da bi sledil pravilom angleščine in izbral pravilna. kitajske pismenke. In njegovi sogovorniki bi bili prepričani, da zna govoriti kitajsko.

Večina kritikov Turingovega testa kot načina vrednotenja umetne inteligence je podobnega mnenja. Trdijo, da lahko računalniki uporabljajo samo sklope pravil in ogromne podatkovne baze, programirane tako, da odgovarjajo na vprašanja, da se zdijo inteligentni.

Kako je program zavedel žirijo


Profesor univerze Reading Kevin Warwick

Eugene Goostman je imel dva dejavnika, ki sta mu pomagala prestati test. Prvič, slovnična in slogovne napake, ki jih stroj omogoča pri posnemanju najstniškega pisanja, in drugič, pomanjkanje znanja o specifičnih kulturnih in zgodovinska dejstva, kar lahko pripišemo tudi starosti učenca.

Ni stopnje v razvoju umetne inteligence, ki bi bila bolj ikonična ali kontroverzna od uspešnosti Turingovega testa.

"Uspeh programa bo verjetno sprožil nekaj pomislekov glede prihodnosti informacijske tehnologije," je dejal profesor Kevin Warwick z Univerze v Readingu. - V razvoju umetne inteligence ni bolj ikonične ali kontroverzne stopnje kot uspešnost Turingovega testa, ko računalnik prepriča dovolj sodnikov, da verjamejo, da z njimi ne komunicira stroj, ampak oseba. Sam obstoj računalnika, ki lahko preslepi osebo, da misli, da je človeško bitje, je alarmni signal povezanih s kibernetsko kriminaliteto." Turingov test je še vedno pomembno orodje v boju proti tej grožnji. In zdaj morajo strokovnjaki bolje razumeti, kako lahko pojav tako naprednih chatbotov vpliva na spletno komunikacijo v internetu.

Sodeč po dnevnikih, ki jih je mogoče najti na internetu (bota še ni mogoče preizkusiti sami; verjetno zaradi pompa spletno mesto ni zdržalo prometa in je "padlo"), Klepetalni robot je precej primitiven in se, kot se zdi na prvi pogled, ne razlikuje zelo od podobnih razvojev, ki jih je mogoče najti na internetu. Enega od zanimivih dialogov z "Eugeneom" je predstavil novinar Leonid Bershidsky, ki mu je postavljal neprijetna vprašanja o odmevnem dogodku, ki ni mogel mimo mladega prebivalca Odese.

Tudi ob upoštevanju dobro razvitega značaja in biografije, napak in tipkarskih napak, ki jih lahko naredi pravi najstnik, je prepričljivost bota vprašljiva. V bistvu se tudi odziva na ključne besede, in ko se zatakne, daje vnaprej pripravljene in ne najbolj izvirne placeholder odgovore. Če bi program imel možnost uporabe Iskalnikiče bi bili v kontekstu trenutne situacije v svetu, bi lahko videli veliko bolj impresiven rezultat. To bo verjetno trajalo. Pred tem je znani futurist Raymond Kurzweil, ki zaseda položaj tehničnega direktorja pri Googlu, izjavil, da bodo računalniki do leta 2029 z lahkoto prestali Turingov test. Po njegovih domnevah bodo do takrat že obvladali človeški jezik in v inteligenci presegli ljudi.

7 superračunalnikov, ki lahko prelisičijo ljudi

ELIZA


Empirični poskus, v katerem oseba komunicira z računalniškim inteligentnim programom, ki simulira odzive kot oseba.

Predpostavlja se, da Turingov test mine, če oseba, ko komunicira s strojem, verjame, da komunicira z osebo in ne s strojem.

Britanski matematik Alan Turing je leta 1950 prišel do takšnega eksperimenta po analogiji z igro posnemanja, ki predvideva, da gresta 2 osebi v različne sobe, tretja oseba pa mora razumeti, kdo je kje, tako da se z njo pisno sporazumeva.

Turing je predlagal igranje takšne igre s strojem, in če bi stroj lahko zavedel strokovnjaka, bi to pomenilo, da lahko stroj razmišlja. Tako klasični test sledi naslednjemu scenariju:

Človeški strokovnjak prek klepeta komunicira s chatbotom in drugimi ljudmi. Na koncu pogovora mora strokovnjak razumeti, kateri od sogovornikov je bil človek in kateri bot.

Dandanes je Turingov test prejel veliko različnih modifikacij, razmislimo o nekaterih izmed njih:

Obratni Turingov test

Preizkus je sestavljen iz izvajanja nekaterih dejanj za potrditev, da ste oseba. Na primer, pogosto se lahko soočimo s potrebo po vnosu številk in črk v posebno polje iz popačene slike z nizom številk in črk. Ta dejanja ščitijo spletno mesto pred roboti. Z uspešno opravljenim preizkusom bi potrdili sposobnost stroja za zaznavanje zapletenih popačenih slik, ki pa še ne obstajajo.

Test nesmrtnosti

Test je sestavljen iz ponavljanja osebnih lastnosti osebe, kolikor je le mogoče. Menijo, da če je lik osebe kopiran čim bolj natančno in ga ni mogoče ločiti od vira, to pomeni, da je bil test nesmrtnosti opravljen.

Minimalni inteligentni test signala

Test predvideva poenostavljeno obliko odgovorov na vprašanja - samo da in ne.

Meta Turingov test

Preizkus predpostavlja, da stroj »lahko razmišlja«, če lahko ustvari nekaj, kar sam želi preizkusiti glede inteligence.

Prvi prehod klasičnega Turingovega testa je 6. junija 2014 zabeležil chatbot »Zhenya Gustman«, razvit v Sankt Peterburgu. Bot je strokovnjake prepričal, da komunicirajo s 13-letnim najstnikom iz Odese.

Na splošno so stroji že sposobni veliko, zdaj veliko strokovnjakov dela v tej smeri in čakajo nas vse bolj zanimive različice in opravljanje tega testa.

"Eugene Goostman" je uspel prestati Turingov test in prepričati 33 % sodnikov, da z njimi ne komunicira stroj. Program se je predstavljal kot trinajstletni deček po imenu Evgeny Gustman iz Odese in uspel je ljudi, ki so se pogovarjali z njim, prepričati, da odgovori, ki jih je ustvaril, pripadajo osebi.

Test je potekal v Royal Society of London in ga je organizirala Univerza v Readingu v Veliki Britaniji. Avtorja programa sta ruski inženir Vladimir Veselov, ki trenutno živi v ZDA, in Ukrajinec Evgeniy Demchenko, ki zdaj živi v Rusiji.

Kako je program "Evgeniy Gustman" prestal Turingov test?

V soboto, 7. junija 2014, je superračunalnik po imenu Eugene poskušal poustvariti inteligenco trinajstletnega najstnika Evgenyja Gustmana.

V testiranju, ki ga je organizirala School of Systems Engineering na Univerzi v Readingu (UK), je sodelovalo pet superračunalnikov. Test je bil sestavljen iz serije petminutnih pisnih dialogov.

Razvijalci programa so uspeli bota pripraviti na vsa možna vprašanja in ga celo usposobiti za zbiranje primerov dialogov prek Twitterja. Poleg tega so inženirji junaka obdarili s svetlim značajem. Virtualni "Evgeny Gustman", ki se je pretvarjal, da je 13-letni deček, med strokovnjaki ni vzbudil dvomov. Verjeli so, da deček morda ne pozna odgovorov na mnoga vprašanja, saj je povprečna otrokova raven znanja bistveno nižja kot pri odraslih. Hkrati so njegove pravilne in natančne odgovore pripisovali nenavadni erudiciji in erudiciji.

V testu je sodelovalo 25 "skritih" ljudi in 5 chatbotov. Vsak od 30 sodnikov je izvedel pet klepetov in poskušal ugotoviti pravo naravo sogovornika. Za primerjavo, na tradicionalnem letnem tekmovanju programov umetne inteligence za Loebnerjevo nagrado* sodelujejo le 4 programi in 4 skrite osebe.

Prvi program z "mladim prebivalcem Odese" se je pojavil leta 2001. Vendar je šele leta 2012 pokazala resnično resen rezultat, saj je prepričala 29% sodnikov.

To dejstvo dokazuje, da se bodo v bližnji prihodnosti pojavili programi, ki bodo lahko delovali brez težav Turingov test.



© 2024 rupeek.ru -- Psihologija in razvoj. Osnovna šola. Višji razredi