2026 m. vasario mėn. pabaigoje Alibaba Qwen AI kūrimo komanda išleido seriją modelių, kurie AI pramonę sukėlė šokiravimo bangomis. „Qwen3.5 Medium Model“ serija, kurią sudaro atviro svorio modeliai, kurių parametrai svyruoja nuo 27 milijardų iki 122 milijardų, pasiekė tai, ko daugelis manė neįmanomą: užtikrinti ribinio lygio našumą už mažesnę nei patentuotų alternatyvų sąnaudų ir skaičiavimo reikalavimų dalį.
Pasekmės yra gilios. Pirmą kartą kūrėjai ir organizacijos, neturinčios prieigos prie didžiulių skaičiavimo išteklių, gali paleisti modelius, kurie atitinka arba viršija Claude Sonnet 4.5, vienos iš pajėgiausių AI sistemų, prieinamų vos mėnesiais anksčiau, našumą. Tai reiškia esminį AI kraštovaizdžio pokytį, priartinantį mus prie ateities, kurioje pažangios AI galimybės bus prieinamos visiems, turintiems kuklią aparatinę įrangą.
Techninis pasiekimas
Qwen3.5 išskirtinis yra ne tik jo našumas, bet ir tai, kaip jis pasiekia tą našumą. Modeliuose naudojama sudėtinga hibridinė architektūra, kuri sujungia „Gated Delta Networks“ su negausia ekspertų mišinio (MoE) sistema. Ši konstrukcija leidžia modeliams būti ir dideliems, ir efektyviems.
Apsvarstykite Qwen3.5-35B-A3B modelį: nors jame yra 35 milijardai parametrų, jis suaktyvina tik 3 milijardus bet kurio žetono parametrų. Tai reiškia, kad modelis gali būti daug didesnis, nei rodo jo aktyvių parametrų skaičius, todėl jis gali saugoti daugiau žinių išlaikant pagrįstą išvadų greitį. Vidaus reikalų ministerijos lygmenyje naudojami 256 ekspertai, 8 nukreipti ekspertai ir 1 bendras ekspertas, kuriant sistemą, kuri gali specializuotis atliekant įvairių tipų užduotis, išlaikant bendrą nuoseklumą.
Bene įspūdingiausia tai, kad Qwen3.5 serija išlaiko beveik be nuostolių tikslumą, net kai kvantuojama iki 4 bitų svarmenų. Kvantifikavimas yra metodas, kuris sumažina modelio svorių tikslumą nuo 32 bitų slankiojo kablelio iki 4 bitų sveikųjų skaičių, žymiai sumažindama atminties poreikį ir leidžianti daryti išvadas apie vartotojo aparatinę įrangą. Daugumos modelių veikimas smarkiai pablogėja, kai tai agresyviai kvantuojama, tačiau Qwen3.5 išlaiko savo galimybes.
Kontekstas „Windows“, kuris konkuruoja su „Frontier“ modeliais
Viena ryškiausių Qwen3.5 savybių yra kontekstinio lango dydis. Qwen3.5-27B palaiko daugiau nei 800 000 konteksto žetonų. Qwen3.5-35B-A3B viršija 1 milijoną žetonų vartotojams skirtuose GPU su 32 GB VRAM. Pavyzdinis Qwen3.5-122B-A10B palaiko dar ilgesnius serverio lygio aparatūros kontekstus.
Kalbant apie tai perspektyvoje, 1 milijonas žetonų apytiksliai atitinka 750 000 žodžių arba maždaug 1 500 puslapių teksto. Tai reiškia, kad modeliui galėtumėte pateikti visą knygą, kelis mokslinius darbus arba didelę kodų bazę, ir tai išlaikytų kontekstą. Ši galimybė anksčiau buvo prieinama tik brangiausiuose patentuotuose modeliuose.
Gebėjimas apdoroti tokius ilgus kontekstus vietoje turi didelių pasekmių. Dabar organizacijos gali analizuoti didžiulius dokumentus, kodų bazes ar duomenų rinkinius nesiųsdamos jų į išorines API. Tai išsprendžia privatumo problemas, sumažina delsą ir pašalina brangių API skambučių poreikį.
Našumo palyginimas su realaus pasaulio galimybėmis
Qwen3.5 modeliai rodo įspūdingus etaloninius rezultatus. 35B-A3B modelis žymiai pranoksta daug didesnius pirmtakus, tokius kaip Qwen3-235B, taip pat OpenAI GPT-5 mini ir Anthropic Claude Sonnet 4.5 pagal keletą etalonų, įskaitant MMLU (žinios) ir MMMU-Pro (vaizdinis samprotavimas).
Tačiau, kaip išmoko dirbtinio intelekto bendruomenė, etalonai ne visada tiesiogiai reiškia realaus pasaulio našumą. Kai kurie vartotojai praneša, kad nors Qwen3.5 modeliai yra įspūdingi, jie ne visai atitinka Sonnet 4.5 sudėtingose, atvirose užduotyse. Modeliai yra žinomi kaip „atkaklūs“ – jie nuolat bando spręsti problemas įvairiais būdais, o tai gali būti naudinga, bet kartais priveda prie gudrumo, o ne elegantiškų sprendimų.
Svarbu suprasti šį atotrūkį tarp etaloninio našumo ir realaus pasaulio galimybių. Etalonai yra statinės, tiksliai apibrėžtos problemos, kurias modeliai gali per daug pritaikyti. Realaus pasaulio užduotys dažnai būna sudėtingesnės, dviprasmiškesnės ir reikalauja tokio niuansuoto samprotavimo, kurį sunkiau išmatuoti.
Be to, daugelis kūrėjų praneša, kad Qwen3.5 modeliai yra tikrai naudingi atliekant praktines užduotis. Kodavimui modeliai gali apdoroti sudėtingas Rust kodų bazes su šimtais integracijos testų. Tyrimams jie gali sintezuoti informaciją keliuose dokumentuose. Atliekant bendrąsias užduotis, jie suteikia galimybių, kurios anksčiau nebuvo pasiekiamos vietinėje aparatinėje įrangoje, lygį.
Kainodaros revoliucija
Be atviro svorio modelių, „Alibaba“ taip pat siūlo „Qwen3.5-Flash“ per savo debesies API. Kaina yra nuostabi:
- Įvestis: 0,10 USD už 1 milijoną žetonų
- Išeiga: 0,40 USD už 1 milijoną žetonų
- Iš viso: 0,50 USD už 1 milijoną žetonų
Dėl to Qwen3.5-Flash yra vienas iš prieinamiausių pasienio lygio modelių. Palyginimui, Claude Sonnet 4.5 kainuoja 3,00 USD už 1 milijoną įvesties žetonų ir 15,00 USD už 1 milijoną išvesties žetonų, iš viso 18,00 USD. Qwen3.5-Flash yra 36 kartus pigesnis.
Net palyginti su kitomis prieinamomis galimybėmis, Qwen3.5-Flash yra konkurencingas. „DeepSeek“ modeliai kainuoja 0,70 USD už 1 milijoną žetonų. „Google“ „Gemini 3 Flash“ kainuoja 3,50 USD. „Qwen3.5-Flash“ pralenkia juos visus, išlaikant palyginamus ar geresnius našumus.
Ši kainodaros struktūra turi svarbių pasekmių. Tai reiškia, kad net organizacijos, neturinčios išteklių modeliams paleisti vietoje, gali nebrangiai naudotis pasienio lygio galimybėmis. Startuolis, kuris anksčiau negalėjo sau leisti naudoti „Claude“ visoms savo užduotims atlikti, dabar gali naudoti „Qwen3.5-Flash“ ir nukreipti tas santaupas į kitas savo verslo sritis.
AI demokratizavimas
Tai, ką reiškia Qwen3.5, yra esminis AI galimybių demokratizavimas. Daugelį metų pasienio AI buvo gerai finansuojamų laboratorijų, turinčių prieigą prie didžiulių skaičiavimo išteklių, sritis. „OpenAI“, „Anthropic“, „Google“ ir keletas kitų kompanijų valdė galingiausius modelius.
Qwen3.5 tai pakeičia. Dabar kūrėjas, turintis 3000 USD GPU, gali paleisti modelius, kurie atitinka arba viršija sistemų, kurių kūrimas kainuoja milijonus, našumą. Tyrėjas gali vykdyti eksperimentus vietoje, nesijaudindamas dėl API sąnaudų ar greičio apribojimų. Maža įmonė gali kurti dirbtiniu intelektu varomus produktus, neatsižvelgdama nuo brangių debesijos paslaugų.
Ši demokratizacija turi keletą svarbių pasekmių:
Privatumas ir suverenitetas: dabar organizacijos gali apdoroti slaptus duomenis vietoje, nesiųsdamos jų į išorines API. Tai labai svarbu sveikatos priežiūros, finansų, vyriausybės ir kitiems sektoriams, kuriems taikomi griežti duomenų apsaugos reikalavimai.
Kaštų efektyvumas: Dramatiškai sumažėjusios išvadų sąnaudos reiškia, kad AI programos tampa ekonomiškai perspektyvios daug platesniam naudojimo atvejų spektrui. Užduotys, kurios buvo per brangios automatizuoti naudojant patentuotus modelius, tampa įmanomos naudojant Qwen3.5.
Inovacijos: Kai daugiau žmonių turi prieigą prie galingų įrankių, atsiranda daugiau naujovių. Tyrėjai gali eksperimentuoti su naujomis idėjomis nelaukdami API prieigos ir nesijaudindami dėl išlaidų. Kūrėjai gali kurti naujas programas, kurios anksčiau nebūtų buvę ekonomiškai įmanomos.
Konkurencija: Aukštos kokybės atvirų modelių prieinamumas padidina konkurenciją AI rinkoje. Įmonės nebegali pasikliauti patentuotais modeliais kaip grioviu. Jie turi konkuruoti kitais aspektais: naudojimo paprastumu, integravimu, specializuotomis galimybėmis ar puikiu našumu.
Iššūkiai priešakyje
Nepaisant įspūdingų galimybių, Qwen3.5 susiduria su iššūkiais. Modeliams reikalinga didelė techninė įranga, kad jie veiktų visu našumu. Nors 27B modelis gali veikti su vartotojų GPU, didesniems modeliams reikalinga serverio lygio aparatinė įranga. Net ir atliekant kvantavimą, 122B modelio paleidimas reikalauja didelių išteklių.
Taip pat kyla klausimas, ar etaloninis našumas reiškia realaus pasaulio galimybes. Kai kurie vartotojai praneša, kad nors Qwen3.5 yra įspūdingas, tam tikrose srityse jis vis tiek nesiekia pažangių modelių. Modeliai gali būti ypač silpni tose srityse, kuriose ribiniai modeliai buvo labai tiksliai suderinti, pvz., kodavimas ar matematinis samprotavimas.
Be to, susirūpinimą kelia mokymo duomenys ir galimi modelių paklaidai. Nors „Alibaba“ skaidriai kalbėjo apie modelių galimybes, mažiau žinoma apie mokymo procesą ir galimus apribojimus.
Ką tai reiškia AI pramonei
Tikėtina, kad Qwen3.5 paspartins kelias AI pramonės tendencijas:
Pereikite prie atvirų modelių: Qwen3.5 sėkmė greičiausiai paskatins kitas įmones išleisti atvirus modelius. Dėl to rinka gali išsiskirstyti, kai atsiras patentuoti modeliai specializuotoms užduotims ir atviri modeliai, skirti bendro naudojimo.
Sutelkite dėmesį į efektyvumą: Kai atviri modeliai tampa vis pajėgesni, įmonės konkuruos dėl efektyvumo. Galimybė paleisti galingus modelius vartotojų techninėje įrangoje taps vis svarbesnė.
Specializacija: Užuot konkuravusios dėl bendrosios paskirties pajėgumų, įmonės gali sutelkti dėmesį į specializuotus modelius konkrečioms sritims. Įmonė gali sukurti modelį, specialiai optimizuotą medicininei diagnostikai, teisinei analizei ar programinės įrangos kūrimui.
Reguliavimo tikrinimas: AI galimybių demokratizavimas gali pritraukti reguliavimo dėmesį. Vyriausybės gali susirūpinti dėl galingų AI sistemų prieinamumo ir siekti reguliuoti jų diegimą.
Išvada: nauja AI prieinamumo era
„Qwen3.5“ yra DI vystymosi taškas. Pirmą kartą pasienio lygio AI galimybės yra prieinamos visiems, turintiems nedidelius skaičiavimo išteklius. Šis demokratizavimas gali paspartinti naujoves, sumažinti išlaidas ir sudaryti sąlygas naujoms programoms, kurios anksčiau buvo neįmanomos.
Modeliai nėra tobuli. Jie gali neatitikti patentuotų modelių kiekviename domene. Jie reikalauja didelių išteklių, kad veiktų visu pajėgumu. Tačiau jie yra esminis AI kraštovaizdžio pokytis.
Pasekmės apima ne tik technines galimybes. Qwen3.5 meta iššūkį pasakojimui, kad dirbtinio intelekto plėtrai reikia didžiulių skaičiavimo išteklių ir milijardų dolerių biudžetų. Tai rodo, kad naudojant sumanią architektūrą ir kruopščią optimizavimą galima pasiekti įspūdingų rezultatų naudojant kuklesnius išteklius.
Kūrėjams, tyrėjams ir organizacijoms Qwen3.5 atveria naujų galimybių. Dabar galite kurti AI programas, kurios anksčiau buvo neįmanomos. Galite apdoroti neskelbtinus duomenis vietoje be išorinių priklausomybių. Galite eksperimentuoti su AI būdais, kurie anksčiau buvo per brangūs.
AI pramonė įžengia į naują etapą. Patentuotų modelių, kaip vienintelio pasienio lygio galimybių šaltinio, era baigiasi. Atviri modeliai, tokie kaip Qwen3.5, kelia kartelę, kas įmanoma naudojant prieinamus išteklius. Šis konkursas galiausiai bus naudingas visiems: vartotojai gaus geresnius modelius, kūrėjai turi daugiau galimybių, o dirbtinio intelekto sritis tobulėja greičiau.
„Alibaba“ „Qwen“ komanda labai prisidėjo prie šios demokratizacijos. Išleisdami aukštos kokybės atvirus modelius su įspūdingu našumu, jie parodė, kad ribinio lygio AI nebūtinai turi būti užrakintas už brangių API ar didžiulių skaičiavimo kliūčių. AI ateitis tampa vis atviresnė, prieinamesnė ir platesnė. Qwen3.5 yra svarbus žingsnis ta kryptimi.
Tiems, kurie nori tyrinėti Qwen3.5, modelius galima rasti Hugging Face ir ModelScope. Galite juos atsisiųsti ir paleisti vietoje arba pasiekti per įvairius debesų paslaugų teikėjus. Atėjo prieinamo pasienio lygio AI era. Dabar kyla klausimas, ką mes su juo statysime.
Jei tekste radote klaidą, siųskite pranešimą autoriui pažymėdami klaidą ir paspausdami Ctrl-Enter.
Nuoroda į informacijos šaltinį