Radošā rakstīšana ir vieta, kur neapstrādāts intelekts pakļaujas gaumei, atturībai un drosmei atstāt pareizās lietas nepateiktas.
Trīs gadus lūdzu AI stāstīt man stāstus. Ne kopsavilkumus, ne izklāstus – bet īstu daiļliteratūru. Tāda veida, kur tēls ienāk istabā un tu jūti, kā mainās temperatūra. Šo gadu laikā esmu vērojis, kā šis līderu saraksts no ziņkārības pārvēršas par īstu literāro spēju barometru. 2026. gada februāris atnesa līdz šim interesantākās pārmaiņas: pilnīgi jaunu modeli, kas ieradās klusi, ātri pakāpās un samazināja plaisu, kas vēl pirms dažām nedēļām šķita pastāvīga. Lūk, pilna aina – sešdesmit modeļi sarindoti, analizēti un ievietoti kontekstā no cilvēka, kurš ar tiem strādā katru dienu.
Radošās Rakstīšanas Līderu Saraksts
Kodam ir sintakse. Matemātikai ir pierādījumi. Bet radošajai rakstīšanai ir balss – ritms, pārsteigums, emocionāla rezonanse. Šī ir Radošās Rakstīšanas Arēna, visprasīgākais kritērijs AI novērtēšanā, kur sešdesmit modeļi tiek sarindoti pēc tā, cik labi tie stāsta stāstus, kas patiešām aizkustina cilvēkus. Lūk, kā viss izskatās 2026. gada februārī.
| Vieta | Modelis | Rezultāts | Balsis | Organizācija |
|---|---|---|---|---|
🥇 | Gemini 3 Pro | 1490 | 4,861 | |
🥈 | Claude Opus 4 6 | 1478 | 347 | Anthropic |
🥉 | Claude Opus 4 5 20251101 Thinking 32k | 1459 | 3,667 | Anthropic |
#4 | Claude Opus 4 5 20251101 | 1457 | 4,382 | Anthropic |
#5 | Gemini 3 Flash | 1456 | 3,678 | |
#6 | Gemini 2.5 Pro | 1450 | 12,564 | |
#7 | Claude Sonnet 4 5 20250929 | 1447 | 5,769 | Anthropic |
#8 | Gemini 3 Flash (thinking Minimal) | 1447 | 2,253 | |
#9 | Claude Opus 4 1 20250805 Thinking 16k | 1445 | 6,651 | Anthropic |
#10 | Claude Sonnet 4 5 20250929 Thinking 32k | 1442 | 6,015 | Anthropic |
#11 | Claude Opus 4 1 20250805 | 1440 | 9,807 | Anthropic |
#12 | Gpt 4.5 Preview 2025 02 27 | 1438 | 2,618 | OpenAI |
#13 | Grok 4.1 Thinking | 1434 | 4,819 | xAI |
#14 | Gpt 5.1 High | 1434 | 4,213 | OpenAI |
#15 | Claude Opus 4 20250514 Thinking 16k | 1428 | 4,750 | Anthropic |
#16 | Grok 4.1 | 1427 | 5,119 | xAI |
#17 | Chatgpt 4o Latest 20250326 | 1422 | 11,146 | OpenAI |
#18 | Ernie 5.0 Preview 1203 | 1420 | 1,477 | Baidu |
#19 | Claude Opus 4 20250514 | 1419 | 5,794 | Anthropic |
#20 | Ernie 5.0 0110 | 1418 | 1,622 | Baidu |
#21 | Kimi K2.5 Thinking | 1418 | 1,059 | Moonshot |
#22 | Deepseek V3.1 Terminus | 1411 | 458 | DeepSeek |
#23 | Gpt 5.1 | 1411 | 4,512 | OpenAI |
#24 | Ernie 5.0 Preview 1022 | 1411 | 662 | Baidu |
#25 | Deepseek V3.1 Thinking | 1410 | 1,720 | DeepSeek |
#26 | Grok 4 1 Fast Reasoning | 1404 | 3,798 | xAI |
#27 | Glm 4.7 | 1403 | 1,797 | Z.ai |
#28 | Deepseek V3.2 Exp | 1403 | 1,500 | DeepSeek |
#29 | Gpt 4.1 2025 04 14 | 1402 | 6,858 | OpenAI |
#30 | Glm 4.6 | 1402 | 4,764 | Z.ai |
#31 | Kimi K2.5 Instant | 1402 | 427 | Moonshot |
#32 | Grok 3 Preview 02 24 | 1402 | 4,972 | xAI |
#33 | Deepseek V3.2 | 1399 | 3,529 | DeepSeek |
#34 | Gemini 2.5 Flash | 1398 | 12,294 | |
#35 | Gpt 5.2 | 1398 | 1,679 | OpenAI |
#36 | Grok 4 0709 | 1397 | 5,559 | xAI |
#37 | Qwen3 Max Preview | 1396 | 3,713 | Alibaba |
#38 | Claude Sonnet 4 20250514 Thinking 32k | 1396 | 4,582 | Anthropic |
#39 | Deepseek V3.1 | 1395 | 2,082 | DeepSeek |
#40 | Qwen3 Max 2025 09 23 | 1395 | 1,154 | Alibaba |
#41 | Claude 3 7 Sonnet 20250219 Thinking 32k | 1395 | 5,472 | Anthropic |
#42 | Deepseek V3.2 Exp Thinking | 1395 | 1,154 | DeepSeek |
#43 | Gpt 5 Chat | 1394 | 4,010 | OpenAI |
#44 | Gpt 5.2 High | 1394 | 2,133 | OpenAI |
#45 | Kimi K2 Thinking Turbo | 1393 | 4,520 | Moonshot |
#46 | Deepseek V3 0324 | 1391 | 6,338 | DeepSeek |
#47 | Deepseek V3.2 Thinking | 1390 | 3,113 | DeepSeek |
#48 | Deepseek R1 0528 | 1388 | 2,660 | DeepSeek |
#49 | Claude Sonnet 4 20250514 | 1385 | 5,328 | Anthropic |
#50 | Qwen3 235b A22b Instruct 2507 | 1384 | 9,102 | Alibaba |
#51 | O3 2025 04 16 | 1384 | 8,014 | OpenAI |
#52 | O1 2024 12 17 | 1383 | 4,646 | OpenAI |
#53 | Hunyuan T1 20250711 | 1382 | 642 | Tencent |
#54 | Grok 4 Fast Chat | 1382 | 995 | xAI |
#55 | Gemini 2.5 Flash Preview 09 2025 | 1382 | 4,285 | |
#56 | Mistral Medium 2508 | 1382 | 8,527 | Mistral |
#57 | Claude Haiku 4 5 20251001 | 1382 | 5,754 | Anthropic |
#58 | Deepseek V3.1 Terminus Thinking | 1381 | 446 | DeepSeek |
#59 | Grok 4 Fast Reasoning | 1380 | 2,372 | xAI |
#60 | Gpt 5 High | 1379 | 4,330 | OpenAI |
Februāra Pārmaiņas
Kad es izvilku jaunākos datus, viens ieraksts mani apstādināja: Claude Opus 4.6, kas sēž otrajā vietā. Ne tāpēc, ka Anthropic modeļa augsta vieta būtu neparasta – viņi to ir darījuši konsekventi. Bet tāpēc, ka šis modelis nolaidās otrajā pozīcijā ar gandrīz nekādu novērtēšanas vēsturi aiz muguras. Šāda veida agrīna vienprātība ir reta. Tas nozīmē, ka pirmais testētāju vilnis – apsēstie, kuri palaiž identiskus uzvednes caur katru jaunu laidienu dažu stundu laikā pēc palaišanas – atrada kaut ko patiesi atšķirīgu tā radošajā izvadē.
Tomēr patiesais stāsts ir atstarpe. Janvārī attālums starp pirmo un otro vietu bija ērti divdesmit pieci punkti. Tagad tie ir divpadsmit. Gemini 3 Pro joprojām tur zeltu, un tas nopelnīja šo pozīciju godīgi. Bet pārsvars ir samazinājies uz pusi vienā atjaunināšanas ciklā. Ja jūs esat Google, šī tendence prasa uzmanību. Ja jūs esat Anthropic, tas ir apstiprinājums, ka jūsu pieeja radošā AI apmācībai konverģē uz kaut ko spēcīgu.
Tikmēr modeļi tieši zem pirmajiem diviem ir ievērojami pārkārtojušies. Claude Opus 4.5 "domājošais" variants pakāpās uz trešo vietu, nobīdot standarta Opus 4.5 uz ceturto un Gemini 3 Flash uz piekto. Flash ieņēma trešo vietu vēl pagājušajā mēnesī. Pjedestāls ne tikai maina īpašniekus virsotnē – tas ir nestabils viscaur. Un nestabilitāte, pēc manas pieredzes, ir pirms izrāvieniem.
Dominējošās Virsotnes
Gemini 3 Pro paliek modelis, pēc kura es sniedzos, kad vēl nezinu, ko man vajag. Tas, kas to notur pirmajā vietā, ir diapazons: prasiet tam Hemingveja stilu, un tas sniedz taupīgu, muskuļotu prozu. Prasiet eksperimentālu postmoderno daiļliteratūru, un tas maina reģistru, nezaudējot saskaņotību. Viktorijas laika epistolārais romāns, cietais noirs, maģiskais reālisms, bērnu literatūra – Gemini apstrādā šīs pārejas veidā, kas liecina par patiesu formas izpratni, nevis virspusēju atdarināšanu. Google ievieto sešus modeļus labāko sešdesmitniekā, ar Gemini 3 Flash piektajā un Gemini 2.5 Pro sestajā vietā, aizpildot spēcīgu trio virsotnē.
Claude ir pilnīgi cits zvērs. Ja Gemini ir diapazons, Claude ir dziļums. Anthropic modeļi vienmēr ir izcēlušies ar smalkumiem, kurus visgrūtāk iemācīt mašīnai: kad ļaut klusumam nest ainu, kad teikumam vajadzētu pārtrūkt, nevis turpināties, kad tas, ko tēls nepasaka, atklāj vairāk nekā tas, ko viņš pasaka. Opus 4.6 to virza tālāk. Manos testos tas radīja dialogu, kas jutās patiesi apdzīvots. Tēli neskaitīja rindiņas – viņi domāja, vilcinājās, izvēlējās vārdus tā, kā to dara īsti cilvēki, kad uz spēles ir kaut kas svarīgs. Anthropic tagad ir trīspadsmit modeļi labāko sešdesmitniekā, vairāk nekā jebkurai citai organizācijai, ar pieciem ievietotiem pirmajā vienpadsmitniekā. Lai kāda būtu viņu pieeja radošo spēju apmācībai, tā darbojas visā viņu produktu līnijā.
Lūk, novērojums, kam netiek pievērsta pietiekama uzmanība: paplašināta spriešana – "thinking" režīms – neuzlabo radošo rakstīšanu uzticami. Modelis ir nekonsekvents un dziļi atklājošs.
Claude Opus modeļiem domājošie varianti mēdz ierindoties nedaudz augstāk: Opus 4.5 Thinking trešajā vietā pretstatā standarta ceturtajā, Opus 4.1 Thinking devītajā pretstatā standarta vienpadsmitajā. Grok 4.1 Thinking pārspēj savu standarta variantu par trim pozīcijām. Bet pārejiet uz citām arhitektūrām, un modelis apgriežas – dažreiz dramatiski. DeepSeek v3.2-exp standarta sēž divdesmit astotajā vietā, kamēr tā domājošais variants krīt uz četrdesmit otro. DeepSeek v3.1-terminus standarta ir divdesmit otrajā; tā domājošais līdzinieks krīt uz piecdesmit astoto – trīsdesmit sešu pozīciju atstarpe. GPT-5.2 standarta pārspēj GPT-5.2-high.
Ko tas man saka, ir svarīgi: radošā rakstīšana nav primāri spriešanas problēma. Tā ir estētiska problēma. Modeļiem, kuriem jau ir spēcīgi literārie instinkti, paplašināta domāšana var uzlabot šos instinktus – kā rūpīgs redaktors, kurš pārskata stabilu pirmo melnrakstu. Bet modeļiem, kuru radošais spēks ir vairāk instinktīvs un balstīts uz modeļiem, piespiedu apspriešana patiesībā nopulē raupjās malas, kas liek prozai justies dzīvai. Dažreiz pirmā atbilde notver kaut ko, ko papildu aprēķini nolīdzina līdz viduvējībai. Ja izmantojat domāšanas spējīgus modeļus radošam darbam, testējiet abus režīmus. Pieņēmums, ka vairāk spriešanas ir vienāds ar labāku izvadi, šeit nedarbojas, un saprašana, kad izslēgt domāšanu, var būt vērtīgāka nekā zināšana, kad to ieslēgt.
Augošais Vilnis
Zem augstākā līmeņa stāsts ir par izplatīšanos un daudzveidību – un tas, iespējams, ir svarīgāk nekā sacensība par pirmo vietu.
DeepSeek ievieto desmit modeļus labāko sešdesmitniekā, padarot to par trešo pārstāvētāko organizāciju pēc Anthropic un OpenAI. Viņu v3.1 un v3.2 varianti aptver no divdesmit otrās līdz piecdesmit astotajai vietai, aptverot virkni radošo spēju līmeņu. Kā atvērta svara projekts, DeepSeek pārstāv kaut ko fundamentāli atšķirīgu no patentētajiem līderiem: šos modeļus var lejupielādēt, mitināt lokāli un precīzi noregulēt (fine-tuned) konkrētiem radošiem uzdevumiem. Ja veidojat AI rakstīšanas rīku vai integrējat radošās spējas produkta cauruļvadā, DeepSeek piedāvā elastību, kurai tikai API modeļi nevar līdzināties.
Plašāka aina ir vēl pārsteidzošāka. Starp DeepSeek, Baidu, Moonshot, Alibaba, Z.ai un Tencent Ķīnas AI laboratorijas tagad veido divdesmit divus no sešdesmit sarindotajiem modeļiem – vairāk nekā trešdaļu no visa līderu saraksta. Moonshot's Kimi K2.5 debitēja ar savu domājošo variantu divdesmit pirmajā vietā, paceļot uzņēmumu uz trim izvietojumiem. Baidu tur trīs pozīcijas ar savu ERNIE 5.0 līniju. Alibaba's Qwen3 ir trīs sarindoti varianti. Z.ai's GLM-4.7 sēž divdesmit septītajā vietā. Tā nav konverģence – tā ir īsta daudzveidība. Dažādi apmācības dati, dažādi kultūras konteksti un dažādas literārās tradīcijas rada modeļus ar atšķirīgu radošo jūtīgumu. Esmu redzējis, kā ERNIE veido metaforas, kas neienāktu prātā rietumos apmācītiem modeļiem, un GLM rīkojas ar naratīvo tempu veidos, kas šķiet svaigi tieši tāpēc, ka literārais DNS ir atšķirīgs. Globālā radošā AI ekosistēma tādēļ ir bagātāka.
OpenAI tur vienpadsmit modeļus, lai gan viņu radošajam stāstam ir interesants blakussižets. GPT-4.5-preview divpadsmitajā vietā atrodas priekšā gan GPT-5.1-high četrpadsmitajā, gan GPT-5.1 standarta divdesmit trešajā. Dažreiz niansēm optimizēts modelis pārspēj savu tehniski pārāko pēcteci uzdevumos, kas vērtē smalkumu augstāk par neapstrādātu spēju. ChatGPT-4o-latest septiņpadsmitajā vietā pastiprina šo punktu: sarunai optimizētiem modeļiem ir iedzimta priekšrocība radošajā rakstīšanā, jo stāstīšana būtībā ir sarunvaloda. Jūs neaprēķināt atbildi – jūs uzturat balsi.
Grok ir izveidojis īstu radošo identitāti ar septiņiem modeļiem rangā. Kur Claude izceļas ar emocionālo inteliģenci, Grok ienes emocionālu godīgumu. Humors ir asāks, metaforas drosmīgākas, tēli mazāk noslīpēti un dzīvāki. Kad es gribu rakstīšanu, kas uzņemas risku – daiļliteratūru, kas varētu likt lasītājam justies neērti produktīvā veidā – Grok ir vieta, kur es sāku. Tas ir modelis, kas vismazāk baidās no savas balss, un radošajā rakstīšanā bezbailība ir svarīga. Mistral's medium-2508 piecdesmit sestajā vietā pārstāv Eiropas klātbūtni uz tāfeles. Tencent's Hunyuan piecdesmit trešajā pievieno vēl vienu balsi no Ķīnas. Lauks nekad nav bijis plašāks.
Kur Tas Viss Ved
Es jums pastāstīšu, kas, manuprāt, notiks tālāk, jo tendences šajos datos norāda uz konkrētu vietu.
Atstarpe turpina saspiesties. Izplatība starp pirmo un sešdesmito vietu ir aptuveni 7,4 procenti – cieši pēc vēsturiskiem standartiem, un sašaurinās ar katru atjauninājumu. Mēs tuvojamies slieksnim, kur nozīmīgās atšķirības starp modeļiem pāriet no neapstrādātas kvalitātes uz radošo personību. Jautājums pārstāj būt "kurš modelis raksta vislabāk" un kļūst "kura modeļa balss atbilst šim konkrētajam projektam". Tās ir fundamentālas izmaiņas tajā, kā rakstniekiem un radošajām komandām vajadzētu domāt par AI izvēli.
Specializētie radošie modeļi ir neizbēgami. Vispārēja pielietojuma arhitektūra ir virzījusi radošās rakstīšanas kvalitāti ievērojami tālu, bet nākamais īstais lēciens nāks no modeļiem, kas skaidri noregulēti naratīvajai struktūrai, tēlu konsekvencei, dialoga autentiskumam vai poētiskajai formai. Es sagaidu, ka vismaz viena liela laboratorija līdz šī gada otrajai pusei izlaidīs radošo speciālistu modeli – tādu, kas pilnībā apņemas literārajām spējām, nevis mēģina risināt matemātiku, rakstīt kodu un stāstīt stāstus vienlaicīgi. Kad tas notiks, tas vienas nakts laikā atiestatīs šī līderu saraksta virsotni.
Atvērta svara modeļi aizvērs atlikušo atstarpi. DeepSeek desmit modeļu klātbūtne ir vadošais rādītājs. Tā kā atvērtās alternatīvas tuvojas paritātei ar patentētajām sistēmām radošajos kritērijos, ar AI palīdzību veiktās rakstīšanas ekonomika dramatiski mainās. Rakstnieki, studijas un izdevēji iegūst piekļuvi augstākā līmeņa radošajam AI bez cenas par žetonu, mainot pieņemšanas līknes un fundamentālās attiecības starp cilvēku rakstniekiem un AI rīkiem.
Patiesā robeža ir orķestrēšana, nevis izolācija. Izsmalcinātākais radošais darbs, ko pēdējā laikā esmu redzējis, neizmanto vienu modeli – tas izmanto trīs vai četrus secīgi. Gemini sākotnējai idejai un stilistiskai izpētei. Claude emocionālai pilnveidošanai un dialoga slīpēšanai. DeepSeek vai Qwen alternatīvām kultūras perspektīvām. Grok, kad uzmetumam vajag asumu. Nākotne nav par viena modeļa kronēšanu par karali. Tā ir par mācīšanos diriģēt ansambli, saskaņojot katra modeļa radošo personību ar pareizo brīdi rakstīšanas procesā. Rakstnieki, kuri to izdomās pirmie, radīs darbus, kas jūtas atšķirīgi no jebkā, ko viens modelis – vai viens cilvēks – varētu sasniegt viens pats.
Sava Radošā Partnera Izvēle
Pēc gadiem ilgas rakstīšanas līdzās šiem modeļiem, lūk, ko esmu iemācījies par pareizā rīka saskaņošanu ar pareizo uzdevumu:
Daudzpusība
Gemini 3 Pro pielāgojas jebkuram žanram, jebkurai formai, jebkuram tonim. Kad uzdevums nav definēts vai projekts prasa diapazonu, sāciet šeit.
Emocionālais Dziļums
Claude Opus 4.6 raksta ar atturību un patiesām jūtām. Dialogiem, darbam ar tēliem un prozai, kur tas, kas paliek nepateikts, ir vissvarīgākais.
Ātrums un Kvalitāte
Gemini 3 Flash pierāda, ka ātrs nenozīmē sliktāks. Iteratīvai uzmetumu rakstīšanai, liela apjoma projektiem un ātrai naratīvo ideju prototipēšanai.
Personība
Grok 4.1 uzņemas radošus riskus, ko citi modeļi neuzņemsies. Fikcijai, kurai vajag asumu, humoru un tēlus, kas jūtas dzīvi, nevis samontēti.
Nav viena labākā radošā AI. Ir attīstošās balsis ar dažādām stiprajām pusēm, un patiesais spēks slēpjas zināšanā, kura balss kalpo kuram mirklim stāstā, ko mēģināt izstāstīt.
Datu Avots: Rangi no Arena AI Radošās Rakstīšanas Līderu Saraksta, 2026. gada 6. februāris.
Discussion
0 commentsLeave a comment
Be the first to share your thoughts on this article!