
Photo by Solen Feyissa on Unsplash
Deepseek Wypuszcza Aktualizację Swojego Modelu Rozumowania AI R1
Startup związany z AI, DeepSeek, wypuścił najnowszą aktualizację swojego modelu rozumowania AI, R1, na platformie Hugging Face w czwartek. Aktualizacja, R1-0528, została uruchomiona bez oficjalnej zapowiedzi i zaledwie kilkoma podanymi szczegółami.
W pośpiechu? Oto szybkie fakty:
- DeepSeek wydało nową aktualizację dla swojego modelu R1, zawierającą licencję MIT.
- R1-0528 działał prawie tak dobrze, jak modele na czele technologii, takie jak o3 i Gemini 2.5 Pro.
- Najnowsza wersja oferuje zmniejszoną częstotliwość halucynacji.
Według TechCrunch, chińska firma podzieliła się wpisem na platformie społecznościowej WeChat w środę, informując obserwatorów o najnowszym rozwoju. Aktualizacja obejmuje „drobną” poprawkę: przyjęcie liberalnej licencji MIT, która pozwala na komercyjne wykorzystanie modelu.
„W najnowszej aktualizacji, DeepSeek R1 znacznie poprawił swoje zdolności do wnioskowania i inferencji, wykorzystując zwiększone zasoby obliczeniowe i wprowadzając mechanizmy optymalizacji algorytmicznej podczas post-treningu,” informuje dokument udostępniony przez DeekSeek na Hugging Face. „Jego ogólna wydajność teraz zbliża się do czołowych modeli, takich jak o3 i Gemini 2.5 Pro.”
Na wykresach wyników testów benchmarkowych, DeepSeek R1-0528 radzi sobie równie dobrze – lub lepiej – niż podobne modele konkurencyjne. W benchmarku AIME 2025, DeepSeek R1-0528 osiągnął wynik 87,5, poniżej modelu OpenAI o3 z 88,9 punktami, ale lepiej niż Gemini-2.5 Pro 0506, Qwen3-235B, oraz własnej poprzedniej wersji, DeepSeek-R1.
„Oprócz ulepszonych zdolności logicznego rozumowania, ta wersja oferuje również zmniejszoną częstotliwość halucynacji, lepsze wsparcie dla wywoływania funkcji oraz lepsze doświadczenia z kodowaniem vibe,” mówi dokument.
Clément Delangue, współzałożyciel i CEO firmy Hugging Face, podał wiadomość o aktualizacji R1 na platformie mediów społecznościowych X. „Zaledwie kilka minut później, a zaktualizowany R1 jest już dostępny u niektórych naszych partnerów inferencyjnych,” napisał Delangue. „Wszystko na stronie modelu – piękne!” Wielu użytkowników podzieliło się zainteresowaniem najnowszą wersją R1.
DeepSeek niedawno był zaangażowany w przypadek naruszenia danych, w którym jego baza danych została wystawiona, umożliwiając dostęp stron trzecim do około 1 miliona logów, kluczy API i historii czatów. Podatność została już załatwiona przez DeepSeek.