Daboost / Shutterstock

Med nyligen avskedade och snabba återanställningar av Sam Altman av OpenAI, debatter kring utveckling och användning av artificiell intelligens (AI) är återigen i rampljuset. Vad som är mer ovanligt är att ett framträdande tema i medierapporteringen har varit förmågan att AI-system för att göra matematik.

Tydligen var en del av dramatiken på OpenAI relaterad till företagets utveckling av en ny AI-algoritm som kallas Q*. Systemet har talats om som ett betydande framsteg och en av dess framträdande egenskaper var förmågan att resonera matematiskt.

Men är inte matematiken grunden för AI? Hur kan ett AI-system ha problem med matematiska resonemang, med tanke på att datorer och miniräknare kan utföra matematiska uppgifter?

AI är inte en enda enhet. Det är ett lapptäcke av strategier för att utföra beräkningar utan direkta instruktioner från människor. Som vi kommer att se är vissa AI-system kompetenta i matematik.

En av de viktigaste nuvarande teknologierna, de stora språkmodellerna (LLM) bakom AI-chatbotar som ChatGPT, har hittills kämpat för att efterlikna matematiska resonemang. Detta beror på att de har utformats för att koncentrera sig på språket.


innerself prenumerera grafik


Om företagets nya Q*-algoritm kan lösa osedda matematiska problem, kan det mycket väl vara det bli ett betydande genombrott. Matematik är en gammal form av mänskligt resonemang stora språkmodeller (LLM) har hittills kämpat för att efterlikna. LLM är tekniken som ligger till grund för system som t.ex OpenAI:s ChatGPT.

I skrivande stund är detaljerna i Q*-algoritmen och dess möjligheter begränsade, men mycket spännande. Så det finns olika subtiliteter att tänka på innan man anser Q* vara en framgång.

Till exempel är matematik ett ämne som alla ägnar sig åt i olika utsträckning, och den matematiknivå som Q* är kompetent på är fortfarande oklart. Det har dock publicerats akademiskt arbete som använder alternativa former av AI för att främja matematik på forskningsnivå (inklusive några skrivna av mig själv, och en skriven av ett team av matematiker i samarbete med forskare på Google DeepMind).

Dessa AI-system kan beskrivas som kompetenta i matematik. Det är dock troligt att Q* inte används för att hjälpa akademiker i deras arbete utan snarare är avsedd för ett annat syfte.

Ändå, även om Q* är oförmögen att tänja på gränserna för spjutspetsforskning, finns det mycket sannolikt en viss betydelse i hur det har byggts som kan skapa lockande möjligheter för framtida utveckling.

Allt bekvämare

Som samhälle känner vi oss alltmer bekväma med att specialist-AI används för att lösa förutbestämda typer av problem. Till exempel, digitala assistenter, ansiktsigenkänningoch online rekommendationssystem kommer att vara bekant för de flesta. Det som förblir svårfångat är en sk "artificiell allmän intelligens" (AGI) som har breda resonemangsförmåga jämförbar med en människas.

Matematik är en grundläggande färdighet som vi strävar efter att lära ut till varje skolbarn, och skulle säkert kvalificera sig som en grundläggande milstolpe i sökandet efter AGI. Så hur skulle annars matematiskt kompetenta AI-system vara till hjälp för samhället?

Det matematiska tankesättet är relevant för en mängd tillämpningar, till exempel kodning och ingenjörskonst, och därför är matematiska resonemang en viktig överförbar färdighet för både mänsklig och artificiell intelligens. En ironi är att AI på en grundläggande nivå är baserad på matematik.

Till exempel kokar många av de tekniker som implementeras av AI-algoritmer i slutändan ner till ett matematiskt område känt som matris algebra. En matris är helt enkelt ett rutnät av tal, varav en digital bild är ett välbekant exempel. Varje pixel är inget annat än numeriska data.

Stora språkmodeller är också till sin natur matematiska. Baserat på ett stort urval av text kan en maskin lära sig sannolikheterna för de ord som är mest sannolikt att följa en uppmaning (eller fråga) från användaren till chatboten. Om du vill att en förutbildad LLM ska specialisera sig på ett visst ämne, kan den finjusteras på matematisk litteratur eller någon annan inlärningsdomän. En LLM kan generera text som läses som om den förstår matematik.

Tyvärr producerar det en LLM som är bra på att bluffa, men dålig på detaljer. Problemet är att ett matematiskt påstående per definition är ett som kan tilldelas en entydigt booleskt värde (det vill säga sant eller falskt). Matematiska resonemang innebär en logisk deduktion av nya matematiska påståenden från de tidigare etablerade.

djävulens advokat

Naturligtvis kommer varje inställning till matematiska resonemang som bygger på språkliga sannolikheter att köra utanför dess körfält. Ett sätt att kringgå detta skulle kunna vara att införliva något system för formell verifiering i arkitekturen (exakt hur LLM är uppbyggt), som kontinuerligt kontrollerar logiken bakom de språng som den stora språkmodellen gör.

En ledtråd om att detta har gjorts kan vara i namnet Q*, som troligen skulle kunna syfta på en algoritm utvecklades ända tillbaka på 1970-talet för att hjälpa till med deduktiva resonemang. Alternativt kan Q* syfta på Q-learning, där en modell kan förbättras över tid genom att testa och belöna slutsatser som är korrekta.

Men det finns flera utmaningar för att bygga matematiskt kapabla AI:er. Till exempel består en del av den mest intressanta matematiken av mycket osannolika händelser. Det finns många situationer där man kan tro att det finns ett mönster baserat på små siffror, men det bryter oväntat när man kontrollerar tillräckligt många fall. Denna förmåga är svår att införliva i en maskin.

En annan utmaning kan komma som en överraskning: matematisk forskning kan vara mycket kreativ. Det måste vara, eftersom utövare måste uppfinna nya koncept och ändå hålla sig inom formella regler för ett gammalt ämne.

Vilken AI-metod som helst som bara tränas för att hitta mönster i redan existerande matematik skulle förmodligen aldrig kunna skapa genuint ny matematik. Med tanke på pipelinen mellan matematik och teknik tycks detta utesluta uppfattningen om nya tekniska revolutioner.

Men låt oss spela djävulens advokat för ett ögonblick och föreställa oss om AI verkligen skulle kunna skapa ny matematik. Det tidigare argumentet mot detta har en brist, i det att man också kunde säga att de bästa mänskliga matematikerna också utbildades uteslutande på redan existerande matematik. Stora språkmodeller har överraskat oss tidigare, och kommer att göra det igen.Avlyssningen

Tom Oliver, föreläsare, datavetenskap och teknik, University of Westminster

Denna artikel publiceras från Avlyssningen under en Creative Commons licens. Läs ursprungliga artikeln.