Wprowadzenie na rynek przez Chiny modelu DeepSeek-R1 , w pełni opartego na licencji MIT, modelu rozumowania opartego na otwartym kodzie źródłowym, silnego konkurenta dla modelu o1 firmy OpenAI , wywołało dyskusje w mediach i salach konferencyjnych w kontekście historii Dawida i Goliata.
AI staje się nowym polem bitwy dla globalnych potęg, aby pokazać swoją dominację. Kilka dni po tym, jak Trump ogłosił 500 mld USD na budowę infrastruktury AI w USA, generując ponad 100 tys. miejsc pracy, chiński startup DeepSeek wprowadził R1, rzucając wyzwanie modelowi OpenAI.
A deweloperzy to uwielbiają . W przeciwieństwie do zamkniętego ekosystemu OpenAI, DeepSeek-R1 można modyfikować według własnego uznania, niezależnie od tego, czy chodzi o biznes, czy badania.
*„Żyjemy w czasach, w których firma spoza USA podtrzymuje pierwotną misję OpenAI — prawdziwie otwarte, pionierskie badania, które dają wszystkim siłę” — Jim Fan, starszy kierownik ds. badań i kierownik działu ucieleśnionej sztucznej inteligencji (GEAR Lab) w firmie NVIDIA
„Żyjemy w czasach, w których firma spoza USA podtrzymuje pierwotną misję OpenAI — prawdziwie otwarte, pionierskie badania, które dają wszystkim siłę” — powiedział AIM Jim Fan , starszy kierownik ds. badań i szef działu ucieleśnionej sztucznej inteligencji (GEAR Lab) w firmie NVIDIA.
„Naszym celem jest zbadanie potencjału LLM w zakresie rozwijania zdolności rozumowania bez żadnych nadzorowanych danych, skupiając się na ich samoistnej ewolucji poprzez czysty proces RL” – AIM zacytował zespół DeepSeek.
Społeczność zajmująca się sztuczną inteligencją z pewnością jest czujna i zwraca uwagę.
*„To naprawdę demokratyzuje AI i daje krajom, które nie mają istniejącej infrastruktury, ogromny krok naprzód, aby eksperymentować i być częścią pionierskiej technologii”. * — Bruce Keith, współzałożyciel i dyrektor generalny InvestorAi
Bruce Keith, współzałożyciel i dyrektor generalny InvestorAi , mówi: „DeepSeek R1 zdecydowanie rzucił wyzwanie dominacji kilku graczy w ekosystemie modeli i danych – najbardziej odczują to OpenAI, Google i Meta. R1 będzie miało znaczący wpływ na krajobraz AI. Ogłoszenie podkreśla znaczenie innowacji i skupienia się na aplikacjach i danych, a nie tylko na mocy przetwarzania. To naprawdę demokratyzuje AI i daje krajom, które nie mają istniejącej infrastruktury, ogromny krok naprzód, aby eksperymentować i stać się częścią granicy”.
W ciągu kilku dni chiński model AI wywrócił branżę do góry nogami, przewyższając o1 OpenAI, detronizując ChatGPT w App Store , podczas gdy kapitalizacja rynkowa NVIDIA spadła o 589 mld USD . W przeciwieństwie do zamkniętego ekosystemu OpenAI, DeepSeek-R1 jest open-source, darmowy w użyciu i radykalnie wydajny. Osiąga najnowocześniejszą wydajność bez konieczności stosowania ogromnych klastrów GPU, zmuszając branżę do przemyślenia wyścigu zbrojeń o wysokich kosztach w dziedzinie AI.
Donald Trump nazwał to już „sygnałem ostrzegawczym” dla amerykańskich firm zajmujących się sztuczną inteligencją.
To jest tanie
Chiński startup AI wywołał szok w Dolinie Krzemowej, podważając dominację USA na rynku AI. Zbudowany w całości na technologii open source i chipach niższej klasy, DeepSeek omija potrzebę sprzętu high-end ograniczonego przez amerykańską kontrolę eksportu i twierdzi, że opracował model za zaledwie 5,6 miliona dolarów . W rezultacie DeepSeek jest dostępny w cenie, która stanowi zaledwie 2% tego, co użytkownicy wydaliby na model O1 firmy OpenAI.
*„DeepSeek nie jest pierwszym modelem open source, ale jego licencja MIT i model myślenia R1 wyróżniają się dokładnością i niskimi kosztami szkolenia, demokratyzując dostęp do zaawansowanej AI, lokalnie lub za pośrednictwem dostępnych interfejsów API, napędzając tym samym innowację”. * — Christian Struve, współzałożyciel i dyrektor generalny Fracttal
„DeepSeek nie jest pierwszym modelem typu open source, ale jego licencja MIT i model myślowy R1 wyróżniają się dokładnością i niskimi kosztami szkolenia, demokratyzując dostęp do zaawansowanej sztucznej inteligencji, lokalnie lub za pośrednictwem dostępnych interfejsów API, napędzając tym samym innowację”.
Christian Struve , współzałożyciel i dyrektor generalny Fracttal .
*„DeepSeek bardzo łatwo znalazł się na tym samym poziomie co Meta, jako dobry konkurent dla dużych graczy w walce o „zwycięski” (przeważający) model w świecie aplikacji opartych na sztucznej inteligencji”. * — JD Raimondi, szef działu Data Science w Making Sense
„DeepSeek podjął inicjatywę, którą Meta podjęła wewnętrznie: konkurując z dużymi prywatnymi modelami publicznymi modelami, z których każdy może korzystać przy niskich kosztach. Ale wyróżnikiem DeepSeek w r1 jest coś nowego: oprócz tego, że jest darmowy, jest wydajny, niedrogi i ma wydajność porównywalną z dużymi chłopcami (GPT o1, GPT o4). DeepSeek bardzo łatwo pozycjonuje się na tym samym poziomie co Meta jako dobry konkurent dla dużych chłopców o „zwycięski” (przeważający) model w świecie aplikacji opartych na sztucznej inteligencji”, mówi JD Raimondi, szef Data Science w Making Sense .
Fakt, że stworzyli tę platformę, inwestując mniej niż 6 mln USD, wstrząsnął prezesami firm technologicznych na całym świecie, pokazując, że przełomowe innowacje niekoniecznie wymagają inwestycji rzędu miliardów dolarów.
„Jednakże, biorąc pod uwagę popyt i podaż, rynek procesorów graficznych, na którym dominuje firma Nvidia, wciąż jest daleki od osiągnięcia szczytowego popytu” – dodaje Bruce Keith.
Czy to moment TikToka dla sztucznej inteligencji?
Ale DeepSeek nie jest pozbawiony kontrowersji. Aplikacja podnosi kwestie takie jak prywatność danych, bezpieczeństwo narodowe i implikacje geopolityczne. Polityka prywatności DeepSeek potwierdza, że dane użytkowników są przechowywane w Chinach. Były indyjski minister IT Rajeev Chandrasekhar, jeden z indyjskich polityków znających się na technologii, już zapytał , czy DeepSeek jest TikTokiem AI.
„…istotne jest, aby szczegółowo przeanalizować jej szanse i wyzwania, a także jej rzeczywisty potencjał napędzania cyfrowej transformacji naszych klientów”. — Harold Barber, COO i CFO w Escala 24×7
„DeepSeek burzy rynek AI innowacyjną propozycją, która rzuca wyzwanie głównym graczom w tej dziedzinie i może radykalnie zmienić sposób, w jaki firmy uzyskują dostęp do tej technologii i z niej korzystają. Jednak kluczowe jest, aby szczegółowo przeanalizować jej szanse i wyzwania, a także jej rzeczywisty potencjał napędzania cyfrowej transformacji naszych klientów”, ostrzega Harold Barber , COO i CFO w Escala 24×7 .
Marynarka Wojenna USA już zakazała DeepSeek .
Mimo to, mimo że jest open-source, chińska wersja AI działa z surową cenzurą i nie odpowiada na politycznie drażliwe pytania. Jednocześnie jej natura open-source pozwala deweloperom na uruchamianie jej lokalnie, bez ograniczeń , co jest jej ogromną zaletą.
Historia Dawida kontra Goliat AI
Paramdeep Singh, współzałożyciel Shorthills AI , twierdzi, że DeepSeek całkowicie zmienia narrację GenAI.
„To tak, jakby Dawid pokonał Goliata. Stara historia GenAI głosiła, że tylko duże modele mogą wygrać. Wymagało to superspecjalistycznych umiejętności, ogromnych obliczeń, tysięcy najnowszych procesorów graficznych, danych na skalę sieci, bilionów węzłów i ogromnej ilości energii elektrycznej, aby wytrenować podstawowy model języka. Wszystko to przekładało się na miliony dolarów na wytrenowanie modelu. Oznaczało to, że firmy i kraje z głębokimi kieszeniami miały zmonopolizować ten rynek.
„To tak, jakby Dawid pokonał Goliata. Stara historia GenAI głosiła, że tylko duże modele mogą wygrać… Teraz mamy Deepseek, który całkowicie odwrócił tę historię. Mamy menedżera funduszu hedgingowego, który wypuszcza model, który pokonuje wielkich ojców GenAI pod każdym względem” — Paramdeep Singh, współzałożyciel Shorthills AI
„Teraz mamy Deepseek, który całkowicie odwrócił tę historię. Mamy menedżera funduszu hedgingowego, który wypuszcza model, który bije wielkich ojców GenAI na wszystkich parametrach. Model jest oszczędny i trenowany na wolnej pojemności GPU, które leżały bezczynnie. Model jest tak mały, że dosłownie może działać w przeglądarce. Jest po prostu modelem o najlepszym stosunku jakości do ceny. Mamy promyk nadziei, gdzie szkolenie i użytkowanie Large Language Model może zostać zdemokratyzowane. To nie ludzie siedzący w wieżach z kości słoniowej, ale talent z oszczędnym sprzętem, który może trenować najlepszy model. Wszyscy kochamy tę historię Dawida kontra Goliat” – mówi.
*„Wyścig AI nie zostanie wygrany poprzez stworzenie najbardziej zaawansowanego modelu; zostanie wygrany poprzez osadzanie AI w systemach biznesowych w celu generowania namacalnej wartości ekonomicznej. Globalne przywództwo w AI powinno być mierzone jego zastosowaniem, a nie tylko jego wynalazkiem.” * — Mike Capone, CEO Qlik
Piękno DeepSeek polega na jego zdolności do pomocy, a nie tylko zachwycania. Jak mówi Mike Capone , CEO Qlik , „Wyścig AI nie zostanie wygrany poprzez stworzenie najbardziej zaawansowanego modelu; zostanie wygrany poprzez osadzanie AI w systemach biznesowych w celu generowania namacalnej wartości ekonomicznej. Globalne przywództwo w AI powinno być mierzone jego zastosowaniem, a nie tylko jego wynalazkiem”.
A historia chwały trwa. DeepSeek właśnie ogłosił Janus Pro , model obrazu AI, który może rywalizować z DALL·E 3 firmy OpenAI. Jeśli, a może raczej powinniśmy powiedzieć, kiedy DeepSeek zajmie się generowaniem wideo, konkurenci tacy jak Veo firmy Google i Sora firmy OpenAI mogą znaleźć się w tarapatach.
Tymczasem Alibaba wydała swój model Qwen 2.5 AI, który, jak twierdzi, przewyższa DeepSeek . Presja jest nie tylko na dużych technologiach lub tylko na USA, ale także na mniejszych graczach i krajach, takich jak Indie.
Navanwita Bora Sachdev , redaktor, The Tech Panda