Betydelsen av AI i matematik: OpenAI:s nya genombrott

: By Tom Oliver, University of Westminster

Tack för besöket InnerSelf.com, där det finns 20,000+ livsförändrande artiklar som främjar "Nya attityder och nya möjligheter." Alla artiklar är översatta till 30+ språk. Prenumerera till InnerSelf Magazine, som publiceras varje vecka, och Marie T Russells Daily Inspiration. InnerSelf Magazine har publicerats sedan 1985.

bryta

Daboost / Shutterstock

Med nyligen avskedade och snabba återanställningar av Sam Altman av OpenAI, debatter kring utveckling och användning av artificiell intelligens (AI) är återigen i rampljuset. Vad som är mer ovanligt är att ett framträdande tema i medierapporteringen har varit förmågan att AI-system för att göra matematik.

Tydligen var en del av dramatiken på OpenAI relaterad till företagets utveckling av en ny AI-algoritm som kallas Q*. Systemet har talats om som ett betydande framsteg och en av dess framträdande egenskaper var förmågan att resonera matematiskt.

Men är inte matematiken grunden för AI? Hur kan ett AI-system ha problem med matematiska resonemang, med tanke på att datorer och miniräknare kan utföra matematiska uppgifter?

AI är inte en enda enhet. Det är ett lapptäcke av strategier för att utföra beräkningar utan direkta instruktioner från människor. Som vi kommer att se är vissa AI-system kompetenta i matematik.

En av de viktigaste nuvarande teknologierna, de stora språkmodellerna (LLM) bakom AI-chatbotar som ChatGPT, har hittills kämpat för att efterlikna matematiska resonemang. Detta beror på att de har utformats för att koncentrera sig på språket.

Om företagets nya Q*-algoritm kan lösa osedda matematiska problem, kan det mycket väl vara det bli ett betydande genombrott. Matematik är en gammal form av mänskligt resonemang stora språkmodeller (LLM) har hittills kämpat för att efterlikna. LLM är tekniken som ligger till grund för system som t.ex OpenAI:s ChatGPT.

I skrivande stund är detaljerna i Q*-algoritmen och dess möjligheter begränsade, men mycket spännande. Så det finns olika subtiliteter att tänka på innan man anser Q* vara en framgång.

Till exempel är matematik ett ämne som alla ägnar sig åt i olika utsträckning, och den matematiknivå som Q* är kompetent på är fortfarande oklart. Det har dock publicerats akademiskt arbete som använder alternativa former av AI för att främja matematik på forskningsnivå (inklusive några skrivna av mig själv, och en skriven av ett team av matematiker i samarbete med forskare på Google DeepMind).

Dessa AI-system kan beskrivas som kompetenta i matematik. Det är dock troligt att Q* inte används för att hjälpa akademiker i deras arbete utan snarare är avsedd för ett annat syfte.

Ändå, även om Q* är oförmögen att tänja på gränserna för spjutspetsforskning, finns det mycket sannolikt en viss betydelse i hur det har byggts som kan skapa lockande möjligheter för framtida utveckling.

Allt bekvämare

Som samhälle känner vi oss alltmer bekväma med att specialist-AI används för att lösa förutbestämda typer av problem. Till exempel, digitala assistenter, ansiktsigenkänningoch online rekommendationssystem kommer att vara bekant för de flesta. Det som förblir svårfångat är en sk "artificiell allmän intelligens" (AGI) som har breda resonemangsförmåga jämförbar med en människas.

Matematik är en grundläggande färdighet som vi strävar efter att lära ut till varje skolbarn, och skulle säkert kvalificera sig som en grundläggande milstolpe i sökandet efter AGI. Så hur skulle annars matematiskt kompetenta AI-system vara till hjälp för samhället?

Det matematiska tankesättet är relevant för en mängd tillämpningar, till exempel kodning och ingenjörskonst, och därför är matematiska resonemang en viktig överförbar färdighet för både mänsklig och artificiell intelligens. En ironi är att AI på en grundläggande nivå är baserad på matematik.

Till exempel kokar många av de tekniker som implementeras av AI-algoritmer i slutändan ner till ett matematiskt område känt som matris algebra. En matris är helt enkelt ett rutnät av tal, varav en digital bild är ett välbekant exempel. Varje pixel är inget annat än numeriska data.

Stora språkmodeller är också till sin natur matematiska. Baserat på ett stort urval av text kan en maskin lära sig sannolikheterna för de ord som är mest sannolikt att följa en uppmaning (eller fråga) från användaren till chatboten. Om du vill att en förutbildad LLM ska specialisera sig på ett visst ämne, kan den finjusteras på matematisk litteratur eller någon annan inlärningsdomän. En LLM kan generera text som läses som om den förstår matematik.

Tyvärr producerar det en LLM som är bra på att bluffa, men dålig på detaljer. Problemet är att ett matematiskt påstående per definition är ett som kan tilldelas en entydigt booleskt värde (det vill säga sant eller falskt). Matematiska resonemang innebär en logisk deduktion av nya matematiska påståenden från de tidigare etablerade.

djävulens advokat

Naturligtvis kommer varje inställning till matematiska resonemang som bygger på språkliga sannolikheter att köra utanför dess körfält. Ett sätt att kringgå detta skulle kunna vara att införliva något system för formell verifiering i arkitekturen (exakt hur LLM är uppbyggt), som kontinuerligt kontrollerar logiken bakom de språng som den stora språkmodellen gör.

En ledtråd om att detta har gjorts kan vara i namnet Q*, som troligen skulle kunna syfta på en algoritm utvecklades ända tillbaka på 1970-talet för att hjälpa till med deduktiva resonemang. Alternativt kan Q* syfta på Q-learning, där en modell kan förbättras över tid genom att testa och belöna slutsatser som är korrekta.

Men det finns flera utmaningar för att bygga matematiskt kapabla AI:er. Till exempel består en del av den mest intressanta matematiken av mycket osannolika händelser. Det finns många situationer där man kan tro att det finns ett mönster baserat på små siffror, men det bryter oväntat när man kontrollerar tillräckligt många fall. Denna förmåga är svår att införliva i en maskin.

En annan utmaning kan komma som en överraskning: matematisk forskning kan vara mycket kreativ. Det måste vara, eftersom utövare måste uppfinna nya koncept och ändå hålla sig inom formella regler för ett gammalt ämne.

Vilken AI-metod som helst som bara tränas för att hitta mönster i redan existerande matematik skulle förmodligen aldrig kunna skapa genuint ny matematik. Med tanke på pipelinen mellan matematik och teknik tycks detta utesluta uppfattningen om nya tekniska revolutioner.

Men låt oss spela djävulens advokat för ett ögonblick och föreställa oss om AI verkligen skulle kunna skapa ny matematik. Det tidigare argumentet mot detta har en brist, i det att man också kunde säga att de bästa mänskliga matematikerna också utbildades uteslutande på redan existerande matematik. Stora språkmodeller har överraskat oss tidigare, och kommer att göra det igen.

Tom Oliver, föreläsare, datavetenskap och teknik, University of Westminster

Denna artikel publiceras från Avlyssningen under en Creative Commons licens. Läs ursprungliga artikeln.

bryta

Tack för besöket InnerSelf.com, där det finns 20,000+ livsförändrande artiklar som främjar "Nya attityder och nya möjligheter." Alla artiklar är översatta till 30+ språk. Prenumerera till InnerSelf Magazine, som publiceras varje vecka, och Marie T Russells Daily Inspiration. InnerSelf Magazine har publicerats sedan 1985.

Tillgängliga språk

följ InnerSelf på

InnerSelf författare

en kvinna med en mängd färska grönsaker framför sig och håller upp en avokado

Den radikala lagen om att väva intuitivt ätande och intellekt

Lisa Masé

1995 skrev näringsterapeuterna Elyse Resch och Evelyn Tribole en av de första böckerna om konceptet intuitivt ätande. Den boken…

Att avslöja sekretesstrick online: Hur webbplatser döljer datadelning

Raymond A. Patterson, University of Calgary et al

Webbplatser döljer ibland hur mycket de delar vår personliga information, och kan gå långt för att dra ullen över ögonen.

Mäta Clean Tech Potential i Kanada och USA

Yrjo Koskinen, University of Calgary et al

Aktiemarknaderna signalerar en växande klyfta mellan kanadensiska och amerikanska clean tech-företag.

Midlife Health Secrets: Going Beyond the Waistline

Rob Newton, Edith Cowan University

Goda nyheter: hälsa i mitten av livet handlar om mer än ett midjemått. Här är varför...

Frukost och skolframgång: The Surprising Link Revealed

Andrew J. Martin, UNSW Sydney et al

Vår forskning tyder på att att äta en ohälsosam frukost kan ha en liknande effekt på ditt barns skoldag som att inte ha någonting alls.

MEST LÄS

Perma-receptet: Fem steg till varaktigt välbefinnande

Ben Gibson och Victoria Ruby-Granger, De Montfort University

Friskvårdsmodellen i fem steg som verkligen fungerar – och psykologin bakom...

Ung man spelar gitarr medan han bär hjälm täckt av elektroder som mäter hjärnaktivitet

Från övning till prestation: Vetenskapen om kreativt flöde

John Kounios och Yvette Kounios

Hjärnskanningar av Philly jazzmusiker avslöjar hemligheter för att nå kreativt flöde...

Hur kan en bebis lära sig två språk samtidigt?

Cameron Morin, ENS de Lyon

Språkinlärning hos barn är en av de mest fascinerande egenskaperna hos den mänskliga arten, såväl som en av de svåraste...

Ensamhet kan döda: Medelålders amerikaner är i riskzonen

Frank J. Infurna, Arizona State University

Medelålders amerikaner är ensammare än sina europeiska motsvarigheter. Det är nyckelresultatet i en nyligen genomförd studie, publicerad i amerikanska ...

Den överraskande ökningen av Mumprenörer som tar Kina med storm!

Lisa Xiong, EM Lyon Business School

Även om mycket bläck har hällts över Kinas ekonomiska tillväxt under de senaste decennierna, får kinesiska kvinnors bidrag ofta mindre...

en hand som håller en teckning av ett hjärta i seger

Hemligheterna till läkning från långdistanscovid

Vir McCoy

Jag spenderade alldeles för mycket pengar på läkare, healers och piller under min resa med långa Covid, till en punkt där jag var besatt av sjukdomen...