Kas OpenAI päevad on nüüd loetud? Anthropicu uus mudel Claude 3 Opus on benchmarkides parem kui GPT-4. Mida see tähendab ja kuidas see kõik võimalikuks sai?

4. märtsil avalikustas Anthropic oma uue mudeliperekonna Claude 3. Claude 3 mudeliperekond koosneb kolmest erinevast mudelist:

  • Claude 3 Haiku,
  • Claude 3 Sonnet ja
  • Claude 3 Opus.

Iga järgnev mudel on eelmisest võimsam, andes kasutajatele võimaluse vastavalt nende spetsiifilistele vajadustele leida optimaalne tasakaal intelligentsuse, kiiruse ja hinna vahel .

Opus ja Sonnet on nüüd kättesaadavad claude.ai platvormil ja Claude API kaudu 159 riigis. Haiku muutub peagi samuti kättesaadavaks.

Claude 3 Opus on perekonna kõige intelligentsem mudel, ületades enamike tehisintellekti süsteemide seniseid hindamisnäitajaid, sealhulgas bakalaureuse tasemel erialateadmisi (MMLU), magistritasemel arutlusoskust (GPQA), elementaarset matemaatikat (GSM8K) ja palju muud. See demonstreerib keerukate ülesannete puhul peaaegu inimlikku arusaamis- ja väljendusoskust.

Kõik Claude 3 mudelid on võimekad analüüsi- ja ennustusvõime, sisu loomise, koodi genereerimise ning hispaania, jaapani, prantsuse jt keeltes suhtlemise osas.

Haiku on turul kõige kiirem ja kulutõhusam mudel oma kategoorias (nn GPT 3.5 klassis). See suudab vähem kui kolme sekundiga läbi töötada 10 000 tähemärgise teadustöö  koos diagrammide ja graafikutega.

Sonnet on enamike töökoormuste puhul kaks korda kiirem kui Claude 2 ja Claude 2.1, olles samal ajal nutikam. Opus pakub sarnast kiirust nagu Claude 2 ja 2.1, kuid märkimisväärselt kõrgema nutikuse tasemega.

Claude 3 mudelitel on ka visuaalse analüüsi võimekused, mis on võrreldavad teiste juhtivate mudelitega. Need suudavad töödelda mitmesuguseid visuaalseid formaate, näiteks fotosid, graafikuid, tabeleid ja tehnilisi jooniseid.

Neist kõige võimsama, Opuse, benchmarkide tulemused viitavad sellele, et esimest korda on tavakasutajatele tehtud kättesaadavaks suur alusmudel, mis on võimsam kui ükski hetkel kättesaadav OpenAI mudelitest.

Esialgu küll on meil võimalik toetuda vaid Anthropicu enda mõõtmistele ja päris sõltumatult seda veel kinnitatud pole.

image.png

Andmed: Anthropic, Märts 2024

Samas näitavad meie esmased katsetused seda, et enam vahet suurt ei ole, kas vastajaks on GPT-4, Claude 3, Gemini 1.0 Ultra või isegi Mistral Large.

Lähemalt Claude 3’st saad lugeda siit: https://buff.ly/49CvbJq

Mis juhtus OpenAI’ga?

Kuidas sai Claude 3-st äkki maailma parim suur mudel ja mis veelgi olulisem: kus on OpenAI GPT-5?

Mitte kunagi varem ei ole juhtunud, et OpenAI on jäänud “vastuse võlgu”. Reeglina on OpenAI kohe, kui kas Google või Anthropic on midagi uut välja lasknud, teinud ise ka mingi uue reliisi ja näidanud, et nad on tegelikult ikka veel kaugel ees. Kuid mitte seekord.

Spekuleeritakse, et OpenAI käed on uute mudelite väljalaskmiseks hetkel juristide ja kohtuhagide tõttu liiga seotud. Neist viimane kohtuasi Elon Muskiga tundub kõige kurioosem ja mõttetum.

Milles siis seisneb Elon Muski kaasus?

Elon Musk kaebas OpenAI kohtusse väites, et ettevõte on rikkunud neid põhimõtteid, mille väljatöötamisele ta 2015.a. kaasa aitas. Hagi on esitatud ka OpenAI juhi Sam Altmani vastu. Musk väidab, et ettevõte on eemaldunud oma algsest mittetulunduslikust ja avatud lähtekoodiga missioonist. Selle asemel, et püüda “inimkonna kasuks töötada”, nagu see oli algselt planeeritud, keskendub OpenAI nüüd suurinvestor Microsofti “kasumi maksimeerimisele”.

See ei tundu justkui kõige kaitstavam positsioon, kuid siin on üks aga ...

See "aga" seisneb selles, et OpenAI leping Microsoftiga käsitleb ainult AI tehnoloogiaid kuni AGIni. AGI valmissaamisega peaks aga asjad muutuma st AGIt ei tohiks Microsoft saada. Hetkel ei ole aga teada, et kas OpenAI salajane mudel Q* on valmis ja kas see on AGI.

Musk ilmselt püüabki OpenAI  kohtu ette tirida ja kätte saada infot, et kui kaugel OpenAI oma arendustega tegelikult on ja mis see Q* mudel on.

OpenAI peab aga ilmselt kohtus näitama, et neil ei ole veel mingit AGIt ja nad võivad Microsoftiga koostööd edasi teha. Seetõttu ilmselt ei tohi OpenAI (vähemalt hetkel) ka välja lasta GPT-4st võimekamaid mudeleid, isegi kui need juba olemas on.

Ilmselt see olukord tegigi võimalikuks asjaolu, et Claude 3 on hetkel parim suur multimodaalne mudel ja Sam Altman ei saa sinna midagi parata. Oleks tore muidugi, kui ma eksiks ja järgmise nädala alguses saaksime juba GPT-5 proovida ;)

Elon Muski case’ist endast võid lugeda siit
https://buff.ly/49wjlAD

PS. Illustreeriv pilt tehtud uue pildi AI mudeli/äpi Ideogram 1.0 abil, mis hetkel suudab turul olevatest mudelitest kõige paremini teksti ja pilti kokku panna.

PPS. Ideogramis tehtud pildi tegin paremaks Magnific.ai abil, mis oluliselt täpsustab pildi detailsust ja parandab kvaliteeti.