AI Radošās Rakstīšanas Arēnas Līderu Saraksts — 2026. gada Februāris

Galvenā Atziņa

Radošā rakstīšana ir vieta, kur neapstrādāts intelekts pakļaujas gaumei, atturībai un drosmei atstāt pareizās lietas nepateiktas.

Trīs gadus lūdzu AI stāstīt man stāstus. Ne kopsavilkumus, ne izklāstus – bet īstu daiļliteratūru. Tāda veida, kur tēls ienāk istabā un tu jūti, kā mainās temperatūra. Šo gadu laikā esmu vērojis, kā šis līderu saraksts no ziņkārības pārvēršas par īstu literāro spēju barometru. 2026. gada februāris atnesa līdz šim interesantākās pārmaiņas: pilnīgi jaunu modeli, kas ieradās klusi, ātri pakāpās un samazināja plaisu, kas vēl pirms dažām nedēļām šķita pastāvīga. Lūk, pilna aina – sešdesmit modeļi sarindoti, analizēti un ievietoti kontekstā no cilvēka, kurš ar tiem strādā katru dienu.

Radošās Rakstīšanas Līderu Saraksts

Kodam ir sintakse. Matemātikai ir pierādījumi. Bet radošajai rakstīšanai ir balss – ritms, pārsteigums, emocionāla rezonanse. Šī ir Radošās Rakstīšanas Arēna, visprasīgākais kritērijs AI novērtēšanā, kur sešdesmit modeļi tiek sarindoti pēc tā, cik labi tie stāsta stāstus, kas patiešām aizkustina cilvēkus. Lūk, kā viss izskatās 2026. gada februārī.

Vieta	Modelis	Rezultāts	Balsis	Organizācija
🥇	Gemini 3 Pro	1490	4,861	Google
🥈	Claude Opus 4 6	1478	347	Anthropic
🥉	Claude Opus 4 5 20251101 Thinking 32k	1459	3,667	Anthropic
#4	Claude Opus 4 5 20251101	1457	4,382	Anthropic
#5	Gemini 3 Flash	1456	3,678	Google
#6	Gemini 2.5 Pro	1450	12,564	Google
#7	Claude Sonnet 4 5 20250929	1447	5,769	Anthropic
#8	Gemini 3 Flash (thinking Minimal)	1447	2,253	Google
#9	Claude Opus 4 1 20250805 Thinking 16k	1445	6,651	Anthropic
#10	Claude Sonnet 4 5 20250929 Thinking 32k	1442	6,015	Anthropic
#11	Claude Opus 4 1 20250805	1440	9,807	Anthropic
#12	Gpt 4.5 Preview 2025 02 27	1438	2,618	OpenAI
#13	Grok 4.1 Thinking	1434	4,819	xAI
#14	Gpt 5.1 High	1434	4,213	OpenAI
#15	Claude Opus 4 20250514 Thinking 16k	1428	4,750	Anthropic
#16	Grok 4.1	1427	5,119	xAI
#17	Chatgpt 4o Latest 20250326	1422	11,146	OpenAI
#18	Ernie 5.0 Preview 1203	1420	1,477	Baidu
#19	Claude Opus 4 20250514	1419	5,794	Anthropic
#20	Ernie 5.0 0110	1418	1,622	Baidu
#21	Kimi K2.5 Thinking	1418	1,059	Moonshot
#22	Deepseek V3.1 Terminus	1411	458	DeepSeek
#23	Gpt 5.1	1411	4,512	OpenAI
#24	Ernie 5.0 Preview 1022	1411	662	Baidu
#25	Deepseek V3.1 Thinking	1410	1,720	DeepSeek
#26	Grok 4 1 Fast Reasoning	1404	3,798	xAI
#27	Glm 4.7	1403	1,797	Z.ai
#28	Deepseek V3.2 Exp	1403	1,500	DeepSeek
#29	Gpt 4.1 2025 04 14	1402	6,858	OpenAI
#30	Glm 4.6	1402	4,764	Z.ai
#31	Kimi K2.5 Instant	1402	427	Moonshot
#32	Grok 3 Preview 02 24	1402	4,972	xAI
#33	Deepseek V3.2	1399	3,529	DeepSeek
#34	Gemini 2.5 Flash	1398	12,294	Google
#35	Gpt 5.2	1398	1,679	OpenAI
#36	Grok 4 0709	1397	5,559	xAI
#37	Qwen3 Max Preview	1396	3,713	Alibaba
#38	Claude Sonnet 4 20250514 Thinking 32k	1396	4,582	Anthropic
#39	Deepseek V3.1	1395	2,082	DeepSeek
#40	Qwen3 Max 2025 09 23	1395	1,154	Alibaba
#41	Claude 3 7 Sonnet 20250219 Thinking 32k	1395	5,472	Anthropic
#42	Deepseek V3.2 Exp Thinking	1395	1,154	DeepSeek
#43	Gpt 5 Chat	1394	4,010	OpenAI
#44	Gpt 5.2 High	1394	2,133	OpenAI
#45	Kimi K2 Thinking Turbo	1393	4,520	Moonshot
#46	Deepseek V3 0324	1391	6,338	DeepSeek
#47	Deepseek V3.2 Thinking	1390	3,113	DeepSeek
#48	Deepseek R1 0528	1388	2,660	DeepSeek
#49	Claude Sonnet 4 20250514	1385	5,328	Anthropic
#50	Qwen3 235b A22b Instruct 2507	1384	9,102	Alibaba
#51	O3 2025 04 16	1384	8,014	OpenAI
#52	O1 2024 12 17	1383	4,646	OpenAI
#53	Hunyuan T1 20250711	1382	642	Tencent
#54	Grok 4 Fast Chat	1382	995	xAI
#55	Gemini 2.5 Flash Preview 09 2025	1382	4,285	Google
#56	Mistral Medium 2508	1382	8,527	Mistral
#57	Claude Haiku 4 5 20251001	1382	5,754	Anthropic
#58	Deepseek V3.1 Terminus Thinking	1381	446	DeepSeek
#59	Grok 4 Fast Reasoning	1380	2,372	xAI
#60	Gpt 5 High	1379	4,330	OpenAI

Februāra Pārmaiņas

Kad es izvilku jaunākos datus, viens ieraksts mani apstādināja: Claude Opus 4.6, kas sēž otrajā vietā. Ne tāpēc, ka Anthropic modeļa augsta vieta būtu neparasta – viņi to ir darījuši konsekventi. Bet tāpēc, ka šis modelis nolaidās otrajā pozīcijā ar gandrīz nekādu novērtēšanas vēsturi aiz muguras. Šāda veida agrīna vienprātība ir reta. Tas nozīmē, ka pirmais testētāju vilnis – apsēstie, kuri palaiž identiskus uzvednes caur katru jaunu laidienu dažu stundu laikā pēc palaišanas – atrada kaut ko patiesi atšķirīgu tā radošajā izvadē.

Tomēr patiesais stāsts ir atstarpe. Janvārī attālums starp pirmo un otro vietu bija ērti divdesmit pieci punkti. Tagad tie ir divpadsmit. Gemini 3 Pro joprojām tur zeltu, un tas nopelnīja šo pozīciju godīgi. Bet pārsvars ir samazinājies uz pusi vienā atjaunināšanas ciklā. Ja jūs esat Google, šī tendence prasa uzmanību. Ja jūs esat Anthropic, tas ir apstiprinājums, ka jūsu pieeja radošā AI apmācībai konverģē uz kaut ko spēcīgu.

Tikmēr modeļi tieši zem pirmajiem diviem ir ievērojami pārkārtojušies. Claude Opus 4.5 "domājošais" variants pakāpās uz trešo vietu, nobīdot standarta Opus 4.5 uz ceturto un Gemini 3 Flash uz piekto. Flash ieņēma trešo vietu vēl pagājušajā mēnesī. Pjedestāls ne tikai maina īpašniekus virsotnē – tas ir nestabils viscaur. Un nestabilitāte, pēc manas pieredzes, ir pirms izrāvieniem.

Dominējošās Virsotnes

Gemini 3 Pro paliek modelis, pēc kura es sniedzos, kad vēl nezinu, ko man vajag. Tas, kas to notur pirmajā vietā, ir diapazons: prasiet tam Hemingveja stilu, un tas sniedz taupīgu, muskuļotu prozu. Prasiet eksperimentālu postmoderno daiļliteratūru, un tas maina reģistru, nezaudējot saskaņotību. Viktorijas laika epistolārais romāns, cietais noirs, maģiskais reālisms, bērnu literatūra – Gemini apstrādā šīs pārejas veidā, kas liecina par patiesu formas izpratni, nevis virspusēju atdarināšanu. Google ievieto sešus modeļus labāko sešdesmitniekā, ar Gemini 3 Flash piektajā un Gemini 2.5 Pro sestajā vietā, aizpildot spēcīgu trio virsotnē.

Claude ir pilnīgi cits zvērs. Ja Gemini ir diapazons, Claude ir dziļums. Anthropic modeļi vienmēr ir izcēlušies ar smalkumiem, kurus visgrūtāk iemācīt mašīnai: kad ļaut klusumam nest ainu, kad teikumam vajadzētu pārtrūkt, nevis turpināties, kad tas, ko tēls nepasaka, atklāj vairāk nekā tas, ko viņš pasaka. Opus 4.6 to virza tālāk. Manos testos tas radīja dialogu, kas jutās patiesi apdzīvots. Tēli neskaitīja rindiņas – viņi domāja, vilcinājās, izvēlējās vārdus tā, kā to dara īsti cilvēki, kad uz spēles ir kaut kas svarīgs. Anthropic tagad ir trīspadsmit modeļi labāko sešdesmitniekā, vairāk nekā jebkurai citai organizācijai, ar pieciem ievietotiem pirmajā vienpadsmitniekā. Lai kāda būtu viņu pieeja radošo spēju apmācībai, tā darbojas visā viņu produktu līnijā.

Lūk, novērojums, kam netiek pievērsta pietiekama uzmanība: paplašināta spriešana – "thinking" režīms – neuzlabo radošo rakstīšanu uzticami. Modelis ir nekonsekvents un dziļi atklājošs.

Claude Opus modeļiem domājošie varianti mēdz ierindoties nedaudz augstāk: Opus 4.5 Thinking trešajā vietā pretstatā standarta ceturtajā, Opus 4.1 Thinking devītajā pretstatā standarta vienpadsmitajā. Grok 4.1 Thinking pārspēj savu standarta variantu par trim pozīcijām. Bet pārejiet uz citām arhitektūrām, un modelis apgriežas – dažreiz dramatiski. DeepSeek v3.2-exp standarta sēž divdesmit astotajā vietā, kamēr tā domājošais variants krīt uz četrdesmit otro. DeepSeek v3.1-terminus standarta ir divdesmit otrajā; tā domājošais līdzinieks krīt uz piecdesmit astoto – trīsdesmit sešu pozīciju atstarpe. GPT-5.2 standarta pārspēj GPT-5.2-high.

Ko tas man saka, ir svarīgi: radošā rakstīšana nav primāri spriešanas problēma. Tā ir estētiska problēma. Modeļiem, kuriem jau ir spēcīgi literārie instinkti, paplašināta domāšana var uzlabot šos instinktus – kā rūpīgs redaktors, kurš pārskata stabilu pirmo melnrakstu. Bet modeļiem, kuru radošais spēks ir vairāk instinktīvs un balstīts uz modeļiem, piespiedu apspriešana patiesībā nopulē raupjās malas, kas liek prozai justies dzīvai. Dažreiz pirmā atbilde notver kaut ko, ko papildu aprēķini nolīdzina līdz viduvējībai. Ja izmantojat domāšanas spējīgus modeļus radošam darbam, testējiet abus režīmus. Pieņēmums, ka vairāk spriešanas ir vienāds ar labāku izvadi, šeit nedarbojas, un saprašana, kad izslēgt domāšanu, var būt vērtīgāka nekā zināšana, kad to ieslēgt.

Augošais Vilnis

Zem augstākā līmeņa stāsts ir par izplatīšanos un daudzveidību – un tas, iespējams, ir svarīgāk nekā sacensība par pirmo vietu.

DeepSeek ievieto desmit modeļus labāko sešdesmitniekā, padarot to par trešo pārstāvētāko organizāciju pēc Anthropic un OpenAI. Viņu v3.1 un v3.2 varianti aptver no divdesmit otrās līdz piecdesmit astotajai vietai, aptverot virkni radošo spēju līmeņu. Kā atvērta svara projekts, DeepSeek pārstāv kaut ko fundamentāli atšķirīgu no patentētajiem līderiem: šos modeļus var lejupielādēt, mitināt lokāli un precīzi noregulēt (fine-tuned) konkrētiem radošiem uzdevumiem. Ja veidojat AI rakstīšanas rīku vai integrējat radošās spējas produkta cauruļvadā, DeepSeek piedāvā elastību, kurai tikai API modeļi nevar līdzināties.

Plašāka aina ir vēl pārsteidzošāka. Starp DeepSeek, Baidu, Moonshot, Alibaba, Z.ai un Tencent Ķīnas AI laboratorijas tagad veido divdesmit divus no sešdesmit sarindotajiem modeļiem – vairāk nekā trešdaļu no visa līderu saraksta. Moonshot's Kimi K2.5 debitēja ar savu domājošo variantu divdesmit pirmajā vietā, paceļot uzņēmumu uz trim izvietojumiem. Baidu tur trīs pozīcijas ar savu ERNIE 5.0 līniju. Alibaba's Qwen3 ir trīs sarindoti varianti. Z.ai's GLM-4.7 sēž divdesmit septītajā vietā. Tā nav konverģence – tā ir īsta daudzveidība. Dažādi apmācības dati, dažādi kultūras konteksti un dažādas literārās tradīcijas rada modeļus ar atšķirīgu radošo jūtīgumu. Esmu redzējis, kā ERNIE veido metaforas, kas neienāktu prātā rietumos apmācītiem modeļiem, un GLM rīkojas ar naratīvo tempu veidos, kas šķiet svaigi tieši tāpēc, ka literārais DNS ir atšķirīgs. Globālā radošā AI ekosistēma tādēļ ir bagātāka.

OpenAI tur vienpadsmit modeļus, lai gan viņu radošajam stāstam ir interesants blakussižets. GPT-4.5-preview divpadsmitajā vietā atrodas priekšā gan GPT-5.1-high četrpadsmitajā, gan GPT-5.1 standarta divdesmit trešajā. Dažreiz niansēm optimizēts modelis pārspēj savu tehniski pārāko pēcteci uzdevumos, kas vērtē smalkumu augstāk par neapstrādātu spēju. ChatGPT-4o-latest septiņpadsmitajā vietā pastiprina šo punktu: sarunai optimizētiem modeļiem ir iedzimta priekšrocība radošajā rakstīšanā, jo stāstīšana būtībā ir sarunvaloda. Jūs neaprēķināt atbildi – jūs uzturat balsi.

Grok ir izveidojis īstu radošo identitāti ar septiņiem modeļiem rangā. Kur Claude izceļas ar emocionālo inteliģenci, Grok ienes emocionālu godīgumu. Humors ir asāks, metaforas drosmīgākas, tēli mazāk noslīpēti un dzīvāki. Kad es gribu rakstīšanu, kas uzņemas risku – daiļliteratūru, kas varētu likt lasītājam justies neērti produktīvā veidā – Grok ir vieta, kur es sāku. Tas ir modelis, kas vismazāk baidās no savas balss, un radošajā rakstīšanā bezbailība ir svarīga. Mistral's medium-2508 piecdesmit sestajā vietā pārstāv Eiropas klātbūtni uz tāfeles. Tencent's Hunyuan piecdesmit trešajā pievieno vēl vienu balsi no Ķīnas. Lauks nekad nav bijis plašāks.

Kur Tas Viss Ved

Es jums pastāstīšu, kas, manuprāt, notiks tālāk, jo tendences šajos datos norāda uz konkrētu vietu.

Atstarpe turpina saspiesties. Izplatība starp pirmo un sešdesmito vietu ir aptuveni 7,4 procenti – cieši pēc vēsturiskiem standartiem, un sašaurinās ar katru atjauninājumu. Mēs tuvojamies slieksnim, kur nozīmīgās atšķirības starp modeļiem pāriet no neapstrādātas kvalitātes uz radošo personību. Jautājums pārstāj būt "kurš modelis raksta vislabāk" un kļūst "kura modeļa balss atbilst šim konkrētajam projektam". Tās ir fundamentālas izmaiņas tajā, kā rakstniekiem un radošajām komandām vajadzētu domāt par AI izvēli.

Specializētie radošie modeļi ir neizbēgami. Vispārēja pielietojuma arhitektūra ir virzījusi radošās rakstīšanas kvalitāti ievērojami tālu, bet nākamais īstais lēciens nāks no modeļiem, kas skaidri noregulēti naratīvajai struktūrai, tēlu konsekvencei, dialoga autentiskumam vai poētiskajai formai. Es sagaidu, ka vismaz viena liela laboratorija līdz šī gada otrajai pusei izlaidīs radošo speciālistu modeli – tādu, kas pilnībā apņemas literārajām spējām, nevis mēģina risināt matemātiku, rakstīt kodu un stāstīt stāstus vienlaicīgi. Kad tas notiks, tas vienas nakts laikā atiestatīs šī līderu saraksta virsotni.

Atvērta svara modeļi aizvērs atlikušo atstarpi. DeepSeek desmit modeļu klātbūtne ir vadošais rādītājs. Tā kā atvērtās alternatīvas tuvojas paritātei ar patentētajām sistēmām radošajos kritērijos, ar AI palīdzību veiktās rakstīšanas ekonomika dramatiski mainās. Rakstnieki, studijas un izdevēji iegūst piekļuvi augstākā līmeņa radošajam AI bez cenas par žetonu, mainot pieņemšanas līknes un fundamentālās attiecības starp cilvēku rakstniekiem un AI rīkiem.

Patiesā robeža ir orķestrēšana, nevis izolācija. Izsmalcinātākais radošais darbs, ko pēdējā laikā esmu redzējis, neizmanto vienu modeli – tas izmanto trīs vai četrus secīgi. Gemini sākotnējai idejai un stilistiskai izpētei. Claude emocionālai pilnveidošanai un dialoga slīpēšanai. DeepSeek vai Qwen alternatīvām kultūras perspektīvām. Grok, kad uzmetumam vajag asumu. Nākotne nav par viena modeļa kronēšanu par karali. Tā ir par mācīšanos diriģēt ansambli, saskaņojot katra modeļa radošo personību ar pareizo brīdi rakstīšanas procesā. Rakstnieki, kuri to izdomās pirmie, radīs darbus, kas jūtas atšķirīgi no jebkā, ko viens modelis – vai viens cilvēks – varētu sasniegt viens pats.

Sava Radošā Partnera Izvēle

Pēc gadiem ilgas rakstīšanas līdzās šiem modeļiem, lūk, ko esmu iemācījies par pareizā rīka saskaņošanu ar pareizo uzdevumu:

Daudzpusība

Gemini 3 Pro pielāgojas jebkuram žanram, jebkurai formai, jebkuram tonim. Kad uzdevums nav definēts vai projekts prasa diapazonu, sāciet šeit.

Emocionālais Dziļums

Claude Opus 4.6 raksta ar atturību un patiesām jūtām. Dialogiem, darbam ar tēliem un prozai, kur tas, kas paliek nepateikts, ir vissvarīgākais.

Ātrums un Kvalitāte

Gemini 3 Flash pierāda, ka ātrs nenozīmē sliktāks. Iteratīvai uzmetumu rakstīšanai, liela apjoma projektiem un ātrai naratīvo ideju prototipēšanai.

Personība

Grok 4.1 uzņemas radošus riskus, ko citi modeļi neuzņemsies. Fikcijai, kurai vajag asumu, humoru un tēlus, kas jūtas dzīvi, nevis samontēti.

Uzņēmumiem

GPT-4.5 / GPT-5.1 nodrošina noslīpētu, uzticamu izvadi, kas integrējas esošajās darbplūsmās. Kad konsekvence un zīmola drošība ir tikpat svarīga kā radošums.

Atvērtais Kods

DeepSeek / Qwen: mitiniet paši, precīzi noregulējiet savai sfērai. Kad jums vajag radošu AI mērogā bez izmaksām par žetonu, ekonomika ir nepārspējama.

Nav viena labākā radošā AI. Ir attīstošās balsis ar dažādām stiprajām pusēm, un patiesais spēks slēpjas zināšanā, kura balss kalpo kuram mirklim stāstā, ko mēģināt izstāstīt.

Datu Avots: Rangi no Arena AI Radošās Rakstīšanas Līderu Saraksta, 2026. gada 6. februāris.

Tags: #creative-writing #storytelling #ai-writing #gemini #claude #grok #deepseek #leaderboard