Mistral avduker sin nye motstander til DeepSeek R1- og OpenAI o3-modellene
Etter hvert som konkurransen innen resonneringsmodeller intensiveres, presenterer Mistral AI, en raskt voksende fransk oppstartsbedrift, sin tilpasning til utfordringene fra aktører som DeepSeek og OpenAI. Med lanseringen av sitt nye utvalg av verktøy, inkludert Magistral-modellen, tar Mistral sikte på å etablere seg i et marked der ytelse og innovasjon har blitt avgjørende.
Mistral AI tar sikte på å konkurrere med modeller som DeepSeek R1 og OpenAI o3 ved å tilby løsninger tilpasset de ulike behovene til utviklere og bedrifter. Denne tilnærmingen er en del av en raskt utviklende teknologisk kontekst, der hastigheten og effektiviteten til resonneringsmodellresponser kan utgjøre hele forskjellen. La oss dykke ned i denne lovende innovasjonen og oppdage hva som skiller Mistral fra konkurrentene.
Introduksjon av Magistral: En ny resonneringsmodell fra Mistral AI Magistral-modellen, som nylig ble lansert av Mistral AI, kommer i to varianter: Magistral Small og Magistral Medium. Den første, tilgjengelig under en åpen Apache 2.0-lisens, er designet med 24 milliarder parametere, mens den andre er en proprietær versjon. Disse modellene er basert på en robust arkitektur, bygget på Mistral Small and Medium 3.1-plattformen, som gir et konkurransedyktig grunnlag i markedet.I motsetning til andre selskaper som er avhengige av eksisterende data, har Mistral AI valgt en unik tilnærming. Oppstartsbedriften har utviklet sin egen læringsprosess ved hjelp av teknikken Reinforcement Learning from Verifiable Rewards (RLVR). Dette strategiske valget demonstrerer Mistrals forpliktelse til å levere høytytende modeller tilpasset moderne krav. En innovativ tilnærming til læring
Mistral AIs metode for å trene modellene sine er basert på prinsipper fra policyoptimalisering, samtidig som man unngår bruk av vanlige teknikker som Proksimal Policy Optimization. I stedet bruker oppstartsbedriften Group Relative Policy Optimization (GRPO), inspirert av arbeidet til DeepSeek. Ved å kombinere belønninger fra flere utfall, utvikler Mistral AI modeller der læringen forbedres over tid, spesielt innen felt som matematikk og programmering. For å forbedre brukeropplevelsen har Mistral AI også sørget for å tilpasse modellene sine til flere språk. Ved å oversette 10 % av sine engelskspråklige problemer til språk som fransk, spansk, italiensk, tysk, kinesisk og russisk, unngår selskapet problemene med språkblanding, et problem rapportert av DeepSeek-brukere. Ytelsesforbedringen er ubestridelig. På AIMEs vitenskapelige benchmarks viser Mistrals modellers poengsummer resultater fra 4,3 % til 9,9 % høyere på engelsk enn på andre språk. Dette fokuset på språklig mangfold demonstrerer Mistral AIs ambisjon om å forbli konkurransedyktig i et globalt marked. Arkitektur- og treningseksempler
Mistrals treningsprosess fokuserte også på å optimalisere treningsdata. Fra 700 000 matematiske prøver brukte oppstartsbedriften et regelsystem for å velge ut omtrent 38 000 problemer og løsninger for å lage en raffinert versjon av Mistral Large 2. På samme måte ble 35 000 problemer integrert i Magistral Mediums opplæring for programmering.
Denne enorme databasen styrker modellenes læringskapasitet. Etter hvert som Magistral Medium forbedrer ytelsen, øker også kompleksiteten til problemene som sendes inn. Dette sikrer at modellene ikke bare lærer enkle svar, men også kan håndtere komplekse og varierte scenarier. Funksjoner
Magistral Small Magistral Medium Antall parametere
24 milliarder Proprietær Lisens
Apache 2.0
Proprietær PipelineoptimaliseringGroup Relative Policy Optimization Group Relative Policy Optimization Opplæringsdata 38 000 matteproblemer 38 000 problemer + 35 000 kodeproblemer
For å gi brukerne en idé om modellenes ytelse, har Magistral AI valgt å ramme inn noen av treningsfasene sine med overvåkede tester som tillater tilpasning av kompleksitetsnivåer. Ved å blande spørsmålene fant selskapet ut at dette mangfoldet er grunnleggende for en god start på resonnement.
| Evaluering av ytelse mot konkurrentene | Til tross for sine innovasjoner og unike metodikk, står Mistral AI overfor en betydelig utfordring: hard konkurranse fra giganter som DeepSeek og OpenAI. Magistral Mediums resultater presterer bra, men ligger fortsatt under markedsledernes. Det rapporteres at denne modellen under lignende evalueringsforhold oppnår resultater nær DeepSeeks R1 Zero- og R1-modeller, uten å overgå dem. | |
|---|---|---|
| For Mistral er målet ikke bare å konkurrere, men å stadig forbedre tilnærmingen sin. Mistral-forskere påpeker at selv om Magistral Smalls ytelse slutter å øke etter 40 000 tokens, når det teoretiske kontekstvinduet 128 000 tokens. | Denne rangeringen er fortsatt et avgjørende punkt i oppstartsbedriftens karriere, ettersom den har som mål å overskride disse begrensningene i fremtidige iterasjoner. | |
| Teknologi og suveren hastighet | En av de bemerkelsesverdige egenskapene til Mistrals modeller er utførelseshastigheten. | |
| Magistral Small | kan kjøre på en enkelt RTX 4090 GPU med 24 GB VRAM, i motsetning til de høyere maskinvarekravene til noen andre modeller. For brukere på ulike plattformer er en optimalisert versjon av denne modellen også under forberedelse for Apple Silicon-datamaskiner. | Når det gjelder respons, hevder Mistral at Magistral Medium-løsningen kan generere svar opptil 10 ganger raskere enn sine direkte konkurrenter. For eksempel, mens OpenAI o3 tar omtrent 40 sekunder å gi et svar, kan Mistral Medium gjøre det på bare 10 sekunder. Det er imidlertid viktig å merke seg at dybde i resonnementet fortsatt er et nøkkelkriterium. Tilgjengelighet og markedsintegrasjon |
| Tilgjengeligheten av Mistral AI-modeller på plattformer som Amazon SageMaker, IBM Watsonx og Azure AI markerer et betydelig skritt mot oppstartsbedriftens ambisjon om å ta betydelig markedsandel. Brukere kan også vurdere å distribuere disse modellene lokalt ved å kontakte Mistral AIs salgsteam, som legger til rette for tilpasset integrasjon. | Mistrals løfte om å gi bedrifter en oversikt over alle svar generert av modellene deres, bidrar til å forsikre kundene om transparensen og kvaliteten på resultatene. Disse elementene er avgjørende i sektorer som forskning, dataanalyse og informert beslutningstaking. Kriterier | Magistral Liten |
Magistral Medium
Responstid
10 sekunder 4 ganger raskere enn OpenAI o3 GPU kreves 1 x RTX 40901 x RTX 4090
Tilgang til plattformer Klemfjes, plattformen Forhåndsvisning på plattformen, Amazon SageMaker For å avslutte denne delen, skaper ikke Mistral AI bare konkurransedyktige modeller, men innoverer også for å omdefinere markedsstandarder. Med en sterk forpliktelse til ytelse og rask respons, ser den franske oppstartsbedriften for seg en fremtid der den ønsker å konkurrere med de beste i feltet.
Visjon for fremtiden: Utover prototyper
Mens Mistral AI forbereder seg på opptrappingen, virker oppstartsbedriftens visjon for fremtiden klar. Målet er å fortsette å innovere og utvikle modeller som er i stand til å løfte egenskapene til kunstig intelligens-systemer til nye høyder. For dette formålet planlegger selskapet å fokusere på følgende aspekter: Regelmessige iterasjoner:
Mistral AI er forpliktet til å kontinuerlig forbedre modellene sine for å sikre at de forblir i forkant av teknologien. Styrking av multimodale funksjoner: Selv om Magistral Medium og Small ble trent utelukkende på tekstdata, er integrering av multimodale funksjoner fortsatt et område for fremtidig innovasjon. Tilpasning til brukerbehov: Å forstå forretningsforventninger og tilpasse modeller deretter vil forbli en prioritet. Utvidet tilgjengelighet: Sørge for at løsninger er tilgjengelige for et bredere publikum, fra uavhengige utviklere til store bedrifter.Mistral planlegger også å implementere verktøy som forbedrer resonneringshastigheten samtidig som kvaliteten på svarene bevares. Ved å samle inn tilbakemeldinger fra brukerne har oppstartsbedriften til hensikt å justere tilbudet sitt ytterligere, ved å bruke data fra den virkelige verden for å forbedre algoritmene sine.
Evnen til å utvikle seg i en så dynamisk sektor er avgjørende. Etter hvert som teknologisk innovasjon fortsetter å utvikle seg, må selskaper som Mistral AI forbli fleksible for å utvikle seg med kundenes behov og skille seg ut i et stadig mer mettet marked.
Ekspertstøtte og strategiske partnerskap For å styrke sin kapasitet vurderer Mistral AI strategiske partnerskap med forskningsinstitusjoner og andre teknologiselskaper. Ved å samarbeide med bransjeeksperter håper Mistral å utnytte de nyeste vitenskapelige fremskrittene for å drive modellene sine til nye horisonter. Ved å fremme et samarbeidende økosystem kan oppstartsbedriften ikke bare dra nytte av ekstern ekspertise, men også posisjonere seg som en nøkkelaktør innen bærekraftig innovasjon av resonneringsteknologier.
| Kort sagt, mens Mistral AI forbereder seg på å ta opp kampen mot etablerte rivaler som DeepSeek og OpenAI, hviler oppstartsbedriftens fremtidige ambisjoner på et solid fundament av ytelse, innovasjon og samarbeid. De kommende månedene vil være avgjørende for å observere hvordan Mistral vil klare å overgå forventningene og forvandle utfordringer til muligheter. | ||
|---|---|---|
Catégories : Nyheter & AI
Tags : åpne o3, deepseek-r1, mistral, motstander, ny modell