Annyi a ChatGPT-nek? Új mesterséges intelligenciával álltak elő

Itt a GPT-5.6 szupermodell: döbbenetes képességekkel érkezik, de az amerikai kormány azonnal behúzta a kéziféket

Annyi a ChatGPT-nek? Új mesterséges intelligenciával álltak elő. A DeepSeek-R1 olcsó, nyílt mesterséges intelligencia modell lenyűgözte a tudósokat.

G Állítsd be az Ellenszelet megbízható forrásként ›

Kína új fejlesztése, a DeepSeek-R1 nyílt nagy nyelvi modell (LLM), jelentős figyelmet keltett a tudományos közösségben. A modell nemcsak az OpenAI o1-hez hasonlóan képes lépésről lépésre gondolkodni, hanem nyitott hozzáférést is kínál a kutatók számára. Ez az újítás olyan területeken, mint a kémia, matematika és programozás, jelentős előrelépést hozhat.

A DeepSeek-R1-et 2025. január 20-án mutatták be, és az első tesztek szerint a modell teljesítménye több feladatban az OpenAI o1 szintjén mozog. A kutatók különösen nagyra értékelik az „open-weight” hozzáférést, amely lehetővé teszi az algoritmus részletes tanulmányozását és további fejlesztését. Bár a modell nem teljesen nyílt forráskódú, mivel az edzéshez használt adatokat nem tették közzé, az MIT licenc lehetőséget biztosít a szabad felhasználásra.

Mario Krenn, a Max Planck Intézet mesterséges tudósok laboratóriumának vezetője szerint a DeepSeek átláthatósága kiemelkedő. „Az OpenAI modellei, például az o3, gyakorlatilag fekete dobozként működnek, ezzel szemben a DeepSeek modellje sokkal megközelíthetőbb,” mondta.

Olcsóbb és elérhetőbb technológia

A DeepSeek modell különlegessége az is, hogy az o1 működési költségének körülbelül harmincadáért érhető el. A cég emellett „destillált” változatokat is kínál, amelyek kevesebb számítási kapacitással rendelkező kutatók számára is hozzáférhetők. Egy olyan kísérlet, amely az o1-en több mint 300 fontba került volna, R1-en kevesebb mint 10 dollárba kerül, jegyezte meg Krenn.

Az R1 mögött álló kínai start-up, a DeepSeek, korábban egy hedge fundból alakult, és rövid idő alatt figyelemreméltó eredményeket ért el. Az Egyesült Államok exportkorlátozásai ellenére, amelyek megnehezítik a fejlett AI-chipek beszerzését, a cég hatékony erőforrás-gazdálkodással bizonyított. A fejlesztési költségek mindössze 6 millió dollárra rúgtak, szemben más, hasonló modellek 60 millió dolláros költségeivel.

A DeepSeek sikere újabb bizonyítéka annak, hogy az USA és Kína közötti mesterséges intelligencia-verseny szűkül. Szakértők szerint a két ország közötti együttműködés nagyobb előnyöket hozhatna, mint a jelenlegi „nyerhetetlen fegyverkezési verseny”.

Ez a nyílt megközelítés és a költséghatékonyság forradalmasíthatja a mesterséges intelligencia alkalmazását a tudományos kutatások területén, és lehetőséget teremt a kisebb kutatási csoportok számára is, hogy részt vegyenek az AI-alapú innovációban.

További cikkeinkért kövesd az Ellenszél Facebook-oldalát is!