Nākotne, kas nāca 70 gadus. Kā attīstījās mākslīgais intelekts

RAKSTA CEĻVEDIS:

MI pirmssākumi

MI vēsture aizsākās pagājušā gadsimta 50. gados, kad zinātnieki sāka pētīt iespēju radīt mašīnas, kas spētu domāt kā cilvēki. 1950. gadā britu matemātiķis un datorzinātnes pionieris Alans Tjūrings publicēja savu ievērojamo rakstu “Computing Machinery and Intelligence”, kurā viņš izvirzīja jautājumu: “Vai mašīnas var domāt?”.

Tjūrings arī izstrādāja slaveno Tjūringa testu, kas kļuva par vienu no pirmajiem kritērijiem, lai novērtētu mašīnu intelektuālās spējas. Savā būtībā Tjūringa tests ir tāds kā izaicinājums datorzinātniekiem veidot programmu ar tādām sarunvalodas spējām, kas nebūtu atšķiramas no cilvēkam piemītošām. Uzskaitot nosacījumus, lai mašīnu varētu uzskatīt par inteliģentu, Tjūrings apgalvoja, ka, ja mašīna spēj veiksmīgi “izlikties” par cilvēku zinošam kritiskam novērotājam un vērtētājam, tad to noteikti vajadzētu uzskatīt par inteliģentu. Šķiet, ka modernie “asistenti”, čatboti jau varētu kvalificēties Tjūringa testam.

Spēja izprast mākslīgo intelektu var sniegt mums ieskatu par mūsu kā cilvēku stiprajām un vājajām pusēm. /Publicists un rakstnieks Alberts Makkeons/

1956. gads tiek uzskatīts par MI kā zinātnes lauka dzimšanas gadu, kad Džons Makkartijs, Marvins Minskis, Nāteins Ročesters un Klods Šenons organizēja Dārtmutas konferenci, kurā tika ieviests termins “mākslīgais intelekts”. Šajā laikā zinātnieki bija optimistiski noskaņoti, uzskatot, ka mašīnas ar pilnvērtīgu intelektu tiks izveidotas tikai pāris desmitgažu laikā. Dārtmutas konferences un tai sekojošajā vasaras pētījumu projektā, kurā piedalījās daži no savas paaudzes vadošajiem MI pētniekiem, tika izveidots arī pirmais MI valodas modelis.

Pēdējos gados ir parādījušies lielie valodu modeļi (angliski saīsinājumā tos sauc par LLM) – MI modeļi, kas spēj ģenerēt un saprast cilvēka valodu. Lielie valodu modeļi ir apmācīti, izmantojot miljoniem tekstu datu, un tie spēj veikt dažādus uzdevumus, piemēram, tulkot valodas, rakstīt tekstus un atbildēt uz jautājumiem. Šie modeļi ir pieejami publiski, un tos var izmantot ikviens, kam ir piekļuve internetam.

Nesenais lēciens mākslīgā intelekta attīstībā ir kaut kas pārsteidzošs – lielie valodas modeļi ir krasi mainījuši mūsu izpratni par to, ko datori spēj paveikt. Šie modeļi ne tikai saprot un rada tekstu, bet arī spēj veikt sarežģītus uzdevumus, sākot no programmu rakstīšanas līdz pat dzejošanai. Lielie valodu modeļi ir mainījuši veidu, kā mēs mijiedarbojamies ar tehnoloģijām, tie ir padarījuši MI pieejamāku un saprotamāku plašākai sabiedrībai, un šodien jau varam teikt, ka esam tajā MI attīstības stadijā, kādu savulaik paredzēja Dārtmutas konferences dalībnieki.

Bet kas īsti ir šie lielie valodas modeļi un kā tie darbojas?

Lai saprastu, kā darbojas lielie valodu modeļi, vispirms ir jāsaprot mašīnmācīšanās pamati. Mašīnmācīšanās ir veids, kā datori “mācās” no datiem, nevis tiek tieši programmēti. Iedomājieties, ka jūs mācāties lasīt, lasot daudz grāmatu. Līdzīgi valodu modeļi “mācās” no milzīga teksta daudzuma, piemēram, grāmatām, rakstiem, tīmekļa lapām un pat sociālo mediju tīklotnēs publicētajām ziņām.

Šo procesu var salīdzināt ar to, kā bērns mācās valodu – iesākumā bērns dzird vārdus un frāzes, tad pakāpeniski sāk saskatīt likumsakarības, bet jau ar laiku iemācās ne tikai atkārtot dzirdēto, bet arī veidot jaunas, jēgpilnas frāzes. Līdzīgi arī lielie valodu modeļi “mācās” no miljardiem teksta piemēru, atklājot sarežģītas valodas likumsakarības un struktūras.

Lielie valodu modeļi ir datori, kas ir apmācīti ar neskaitāmiem vārdiem un teikumiem un ir iemācījušies atpazīt vārdu sakarības un to, kā vārdi veido teikumus. Kad jūs uzdodat jautājumu, tas analizē jūsu jautājumu un mēģina atrast atbildi, balstoties uz to, ko ir “iemācījies”. Piemēram, ja jūs jautātu: “Kas ir kaķis?”, tas varētu atbildēt: “Kaķis ir zīdītājs, kas ir pazīstams ar savu spēju murrāt un medīt peles.” Valodas modelis ir iemācījies šo informāciju, analizējot miljoniem tekstu, kuros ir vārds “kaķis”.

Foto: Attēls veidots ar “Midjourney”.

Lielie valodas modeļi var arī ģenerēt jaunus tekstus, piemēram, stāstus vai dzejoļus. Kad jūs lūdzat tam ģenerēt tekstu, tas izmanto savas zināšanas par valodu, lai izveidotu jaunus teikumus un rindkopas.

Lai gan tās ir ļoti sarežģītas sistēmas, pamatideja ir vienkārša – tie ir datori, kas ir apmācīti ar miljoniem vārdu un teikumu, un tie ir iemācījušies atpazīt vārdu sakarības un ģenerēt jaunus tekstus.

Iedomājieties loģikas spēli “Papildini teikumu”. Kad jums dod teikuma sākumu “Saule šodien spīd…”, jūs varat to loģiski papildināt, piemēram, ar “…spoži” vai “…caur mākoņiem”. Lielie valodas modeļi darbojas līdzīgi, tikai daudz sarežģītākā līmenī. Modelis analizē iepriekšējos vārdus un, balstoties uz savu “pieredzi” (datu apjoma lauku), prognozē, kādi vārdi varētu sekot. Taču tas nedara to mehāniski – tas ir iemācījies saprast kontekstu un nozīmi, gramatikas likumus, loģiskās un tematiskās saistības.

Piemēram, ja modelim jautā par globālo sasilšanu, tas ne tikai “atceras” faktus, bet spēj tos apvienot jēgpilnā, kontekstam atbilstošā atbildē.

“ChatGPT”: Revolūcijas sākums

2022. gada novembrī uzņēmuma “OpenAI” publiskotais “ChatGPT” kļuva par lielo valodu modeļu popularitātes kāpuma katalizatoru. “ChatGPT”, kas balstījās uz “GPT-3.5” arhitektūru, bija revolucionārs savā pieejamībā un lietojamībā. Tas ļāva ikvienam, kam ir piekļuve internetam, izmantot jaudīgus valodu modeļus ikdienas uzdevumiem, piemēram, rakstīšanas palīdzībai, mācību materiālu sagatavošanai vai pat sarunu veidošanai.

“ChatGPT” kļuva par vienu no visātrāk augošajām lietotāju platformām modernās pasaules vēsturē, sasniedzot 100 miljonus lietotāju tikai divu mēnešu laikā. Šis panākums pārspēja tādus uzmanības zagļus kā gigantus “TikTok”, “Instagram” (platformā “Meta”), un bija negaidīts sasniegums pat daudz pārsteigumiem gatavajā tehnoloģiju nozarē.

“ChatGPT” veiksmīgais starts ir mudināja citus lielos tehnoloģiju uzņēmumus paātrināt savu lielo valodas modeļu izstrādi. Pēdējo 18 mēnešu laikā ir parādījušies vairāki jauni modeļi un platformas, kas veicina konkurenci un inovācijas – “Google” ir izlaidis “PaLM 2” – tas ir jaudīgāks valodu modelis, kas tiek izmantots pakalpojumos kā “Bard” un “Google Workspace”. Uzņēmums “Anthropic”, ko dibinājuši bijušie “OpenAI” pētnieki, ir izstrādājis “Claude”, kas ir konkurents “ChatGPT” ar uzsvaru uz ētisku mākslīgā intelekta izmantošanu. “Meta” ir izlaidis “LLaMA” (“Large Language Model Meta AI”) – tas ir atvērtā koda valodu modelis, kas paredzēts pētniekiem un izstrādātājiem. “Amazon” un “Microsoft” ir ieguldījuši miljardus dolāru mākslīgā intelekta uzņēmumos, lai paplašinātu savu piedāvājumu un konkurētu ar “OpenAI”.

Šī konkurence ir veicinājusi strauju tehnoloģiju attīstību, kā arī samazinājusi izmaksas, padarot šos rīkus pieejamus nesalīdzināmi plašākam lietotāju lokam. Sarunvalodā esam nonākuši tajā posmā, kas reiz valdīja kopēšanas mašīnu tirgū – visus dažādo ražotāju kopētājus sauca par “kseroksiem” kā ievērojamāko nozares spēlētāju “Xerox”. Tā arī tagad – lielie valodu modeļi ir “chat gpt”, lai gan realitātē cilvēki izmanto arī virkni citu lielo valodas modeļu.

Kad modelis ir apmācīts, tas spēj ģenerēt tekstu, balstoties uz ievadi, ko tas saņem. Piemēram, ja jūs uzdodat jautājumu “Kāds ir laiks?”, modelis analizē šo tekstu un mēģina paredzēt, kādi vārdi būtu vispiemērotākie atbildē. Modelis strādā, secīgi paredzot nākamo vārdu. Piemēram, ja ievade ir “Saule spīd…”, modelis varētu paredzēt, ka nākamais vārds ir “spilgti” vai “skaisti”.

Iespējas un draudi

Lielo valodu modeļu un mākslīgā intelekta attīstība ir izraisījusi plašu diskusiju par šo tehnoloģiju nozīmi un potenciālajiem riskiem. Vadošie jomas pētnieki ir izteikuši savus viedokļus par šiem jautājumiem, un viņu teiktais ir vērā ņemams, lai saprastu šo tehnoloģiju ietekmi uz mūsu sabiedrību.

Par iespējām:

Par lielo valodas modeļu un mākslīgā intelekta izmantošanas riskiem:

Lielo valodu modeļu un dziļās mācīšanās tehnoloģiju plašā pieejamība ir atvērusi jaunas iespējas, taču tā ir radījusi arī vairākus riskus, kas jāņem vērā. Šīs tehnoloģijas ir tik jaudīgas un daudzpusīgas, ka to neuzmanīga vai neētiska izmantošana var radīt nopietnas sekas.

Ķīniešu “DeepSeek” straujā popularitāte un akciju tirgus svārstības

Pēdējo 18 mēnešu laikā lielo valodu modeļu popularitāte ir piedzīvojusi eksponenciālu kāpumu. Šis periods ir bijis vēsturisks, jo tehnoloģijas, kas agrāk bija pieejamas tikai pētniekiem un lielajiem tehnoloģiju uzņēmumiem, tagad ir kļuvušas pieejamas ikvienam. Šīs pārmaiņas ir veicinājuši vairāki faktori, tostarp jaudīgu modeļu izstrāde, lietotāju draudzīgu rīku radīšana un plašs sabiedrības intereses pieaugums.

“DeepSeek” ir Ķīnas uzņēmuma izstrādāts rīks, kas pēdējo nedēļu laikā guvis ievērojamu popularitāti. Tas pazīstams ar savu spēju ģenerēt augstas kvalitātes tekstu un atbildēt uz jautājumiem ar lielu precizitāti. LSM jau rakstīja, ka šī LLM straujā popularitāte ir izraisījusi akciju tirgus svārstības, jo investori vienlaikus ir ieinteresēti šajā jaunajā tehnoloģijā un tās potenciālajā ietekmē uz tirgu, gan vīlušies līdzšinējo lielapjoma investīciju ieguldījumā citu izstrādātāju modeļos.

“DeepSeek” ir veidots, izmantojot jaunākās dziļās mācīšanās tehnoloģijas, un tas ir apmācīts, izmantojot miljoniem tekstu datu. “DeepSeek” ir spējīgs veikt dažādus uzdevumus, piemēram, tulkot valodas, rakstīt tekstus un atbildēt uz jautājumiem. Tas arī spējīgs ģenerēt radošu tekstu, piemēram, dzeju un prozu.

Daži investori uzskata, ka “DeepSeek” varētu būt revolucionāra tehnoloģija, kas varētu mainīt veidu, kā mēs mijiedarbojamies ar tehnoloģijām. Citi investori ir piesardzīgāki un uzskata, ka tas ir tikai vēl viens lielais valodu modelis, kas galu galā zaudēs savu popularitāti. Sausais atlikums gan ir visai iespaidīga teju miljarda vērtības krišanās visiem mākslīgā intelekta izstrādātājuzņēmumiem.

Lielie valodas modeļi, šķiet, fundamentāli mainījuši mūsu izpratni par mākslīgā intelekta iespējām. Tie nav vienkārši teksta ģeneratori, bet kompleksas sistēmas, kas spēj saprast, analizēt un radīt jēgpilnu saturu. Lai gan tehnoloģijai vēl ir daudz izaicinājumu, tās potenciāls mainīt dažādas dzīves jomas ir nenoliedzams.

Vēl par mākslīgo intelektu