© ROOT-NATION.com - Тази статия е автоматично преведена от AI. Извиняваме се за евентуални неточности. За да прочетете оригиналната статия, изберете English в превключвателя на език по-горе.
Днес ще разгледаме по-отблизо DeepSeek, нов езиков модел, който вдигна доста шум. Нека да разберем какво кара всички да говорят.
Изглежда, че интернет има нов фаворит в света на изкуствения интелект и това не е най-новата версия на ChatGPT от добре познатите OpenAI. Вместо това, този нов претендент идва от Китай, предизвиквайки вълни в света на ИИ.
Китайски AI чатбот се изкачи до върха на Apple App Store, превръщайки се в най-популярното безплатно приложение. Този скок на популярност следва пускането на модела „мислене“. DeepSeek-R1 на 20 януари, което е надминало OpenAIЕ ChatGPT в изтеглянията. Ето по-отблизо как се разви това.

Прочетете още: Могат ли САЩ да поставят знамето си на Марс? САЩ
Защо DeepSeek е интересно
Този китайски стартъп се фокусира върху разработването на отворени AI модели, което позволява на всеки разработчик да има достъп до технологията и да създава нови модели.
Това, което отличава DeepSeek с изключение на ChatGPT е способността му да формулира верига от разсъждения, преди да даде отговор. Потребителски отзиви в Apple App Store и Google Play Store показват, че това ниво на прозрачност е добре прието от публиката.
Приложението е безплатно за изтегляне и използване, въпреки че потребителите трябва да се регистрират, преди да получат достъп до AI.
На 20 януари китайският стартъп DeepSeek пусна своя водещ AI модел, R1, изненадвайки Силиконовата долина с разширените възможности на модела. R1 съответстваше или дори надминаваше функционалността на AI системите, разработени от OpenAI, Google и Meta— като всичко това работи със значително по-малък бюджет и без да разчита на най-новите AI чипове.
През изминалата седмица приложението придоби значителна популярност сред обществеността. Това надмина ChatGPT по популярност, достигайки място №1 в App Store на Apple в САЩ и класирайки се сред най-добрите безплатни приложения за Android в Google Play Store по време на писането.
Освобождаването на DeepSeek R1 предизвика въпроси дали милиардите долари, похарчени за изкуствен интелект през последните години, са били оправдани. Това също предизвиква схващането, че САЩ остават глобален лидер в развитието на ИИ.
Прочетете още: Панамски канал: История на изграждането му и основа на претенциите на САЩ
Кой е създал DeepSeek R1
DeepSeek е изследователска лаборатория за изкуствен интелект, базирана в Ханджоу, Китай, и R1 е нейният най-нов модел с изкуствен интелект. Компанията е основана през 2023 г. от Liang Wenfeng, инженер и предприемач с опит в AI и финанси. Преди установяване DeepSeek, Liang ръководи частния инвестиционен фонд High-Flyer, който получи признание за използването на AI за анализ на финансови данни.
Екипът на DeepSeek основно се състои от млади възпитаници от най-добрите китайски университети, включително университета Цинхуа и Пекинския университет.
През март 2023 г. фондът на Liang обяви чрез своя официален акаунт в WeChat, че „започва отначало“, преминавайки отвъд търговията, за да фокусира всички ресурси върху изграждането на „нова независима изследователска група, която да изследва същността на AGI“ (общ изкуствен интелект). По-късно същата година, DeepSeek беше основан.
DeepSeekГолемият езиков модел (LLM) на 's дебютира за първи път през ноември 2023 г. като DeepSeek Coder, инициатива с отворен код. Това беше последвано от освобождаването на DeepSeek-V2 през май 2024 г. Компанията пусна най-новия си модел, DeepSeek-V3, през декември 2024 г. Оттогава популярността на платформата нарасна, като нейното мобилно приложение надхвърли 1.6 милиона изтегляния.
Докато DeepSeek LLM е до голяма степен подобен на други популярни чатботове, като Google Gemini or ChatGPT, безплатните модели на приложението придобиха значителна популярност сред потребителите. Освен това, неговото удобно за разработчиците ценообразуване на API го направи фокусна точка в дискусиите в индустрията.
Прочетете още: Как Тайван, Китай и САЩ се борят за технологично господство: голямата война за чипове
Какво е DeepSeek R1
DeepSeek в момента предлага два модела: R1 и R1 Zero. В момента само R1 е достъпен за потребителите, въпреки че разликите между двата AI модела не са очевидни веднага. на хартия, DeepSeek R1 е AI система с общо предназначение, докато DeepSeek R1 Zero използва Reinforcement Learning, което означава, че е способен на пълно самообучение. Това обаче са технически аспекти, които може да не са от особено значение за типичните потребители.
Важно е да се отбележи това DeepSeek R1 е AI модел, разработен от китайска компания, и стои наравно с най-новите налични AI системи, като напр. OpenAIGPT на Anthropic и Claude на Anthropic.
Прочетете още: Ядрени отпадъци: какво представляват и как се изхвърлят
DeepSeek R1 е безплатен и неограничен
Една от основните причини DeepSeek предизвика такъв шум е неговата цена за крайните потребители: той е напълно безплатен. В известен смисъл това е първата изключително усъвършенствана AI система, достъпна за потребителите без заплащане. За други системи като OpenAIЕ ChatGPT и Claude на Anthropic се изисква платен абонамент и дори тогава използването често е ограничено. на Google Gemini също се предлага безплатно, но е ограничено до по-стари модели и има ограничения за използване. DeepSeek, от друга страна, изглежда няма такива ограничения, което го прави напълно достъпен без ограничения засега.
Прочетете още: 10 грешки, които опростяват работата на хакерите
DeepSeek R1 е изключително рентабилен
Една от причините DeepSeek е безплатно вероятно се дължи на това, което се казва, че са някои ключови технологични пробиви. Едно от най-големите предимства на DeepSeek R1 е неговата рентабилност. Докато моделите харесват OpenAIЕ ChatGPT o1 такса около $15 за милион входни жетони, същите задачи DeepSeek може да струва само $0.55. Тази ниска цена вероятно е причината DeepSeek R1 е достъпен безплатно за крайни потребители. Изглежда, че DeepSeek успя да оптимизира своята AI система до такава степен, че да не изисква огромни изчислителни ресурси или изобилие от графични карти, поддържайки ниски разходи.
Всъщност ефективността е ключовият фактор, който привлече вниманието DeepSeek, особено в САЩ Само преди няколко седмици подобна ефективност се смяташе за невъзможна. Но сега, с DeepSeek демонстрирайки какво може да се постигне само с няколко милиона долара, харесват AI компаниите OpenAI и Google, които харчат милиарди, започват да изглеждат като истински изостанали.
Прочетете още: Транзистори на бъдещето: Нова ера на чипове ни очаква
DeepSeek R1 е с отворен код
Това е друг ключов момент, който привлече вниманието. За разлика от OpenAI или системи на Google, DeepSeek R1 е с отворен код. По същество това означава, че DeepSeek не само кара големите американски технологични компании да изглеждат екстравагантни и безотговорни в разходите си, но също така премахва възможността им да повишават цените на своите продукти. В крайна сметка, DeepSeek по същество казва на хората, че не е нужно да харчите $1000 за достъп OpenAI или антропни системи. Вместо това можете просто да вземете този модел с отворен код, да го персонализирате според вашите нужди и да го използвате както искате.
В същото време последиците не са свързани само с бизнеса. Те имат и геополитически аспект. Вместо AI да се превърне в още една силно желана и строго охранявана система, притежавана от определени страни като САЩ, модел с отворен код като DeepSeek освобождава технология, която всяка страна по света може да използва за разработване на свои собствени системи за изкуствен интелект. Сега е ясно, че DeepSeek R1 е един от най-забележителните и впечатляващи пробиви, които някога сме виждали, и е огромен подарък за света.
Също интересно: Neuralink Чип за телепатия: какво представлява и как работи
Как да започнем с DeepSeek R1
Можете да го използвате във всеки браузър от отваряне на връзката да се DeepSeek R1 или го изтеглете и инсталирайте от Apple App Store или Google Play Store.
Най-интересното е, че можете да опитате DeepSeek R1 дори без регистрация. В този случай обаче не работи много ефективно.
Що се отнася до приложението за смартфон, потребителите напоследък се оплакват, че не могат да се регистрират поради големия поток от хора, които искат да изпробват новия китайски модел. Мисля, че този проблем скоро ще бъде решен.
Прочетете още: Всичко за суперкомпютъра Frontier
DeepSeek е все по-ефективен в завладяването на Запада
Внезапният скок в популярността на модела не е случаен. Динамичното развитие на технологиите за изкуствен интелект и нарастващото търсене на усъвършенствани аналитични инструменти накараха потребителите да търсят по-точни и ефективни решения. Оказва се, че DeepSeek отговори на тези нужди, като предложи инструмент, който не само обработва данни, но и интерпретира значението им в конкретен контекст.
Ключовото постижение на DeepSeek е намаляването на потреблението на памет и ускоряването на изчисленията, без значително да се жертва точността на резултатите. Компанията се фокусира върху рационализиране на процеса на решаване на проблеми, като избягва подробни обяснения на всяка стъпка, което значително намали времето за изчисление.
Това позволява на модела R1 да демонстрира изключителна производителност в математически и програмни задачи, използвайки подход на верига от мисли, подобен на този на ChatGPT o1.
Прочетете още: Най-добър софтуер за корпоративни срещи: Повишете бизнес комуникацията си
DeepSeek срещу други езикови модели: тестове
Време е да видим дали новият модел наистина може да представлява заплаха за съществуващите AI гиганти на пазара. За да оценим това, ще разгледаме външни тестове, които вече са проведени.
Важно е обаче да се отбележи, че DeepSeek не е включен в много официални тестове, поне поради две причини. Първо, това е сравнително нов играч в областта на ИИ. Моделът R1 беше представен едва на 20 януари 2025 г., което означава, че много по-ранни тестове не можеха да го включват.
Второ, китайската компания е приложила уникален подход за обучение на своя модел, като се фокусира върху софтуерната оптимизация и ефективност, което я отличава от традиционните методи, използвани от други модели. Това вероятно ще доведе до предизвикателства при директното сравняване с други модели в стандартните тестове.
Бенчмарк тест за прегръщане на лице
Нека да разгледаме тестовете проведено от Hugging Face, компания, която разработва изчислителни инструменти за изграждане на приложения за машинно обучение.
DeepSeek-R1 постига много високи резултати в много от тестовете на Hugging Face, превъзхождайки модели като Claude-3.5, GPT-4o и дори някои варианти на OpenAI o1 (макар и не всички).
Основни силни страни на DeepSeek-R1:
- Умения за мислене: В English езикова категория, той се откроява със своята впечатляваща гъвкавост и способност да предоставя точни отговори, особено в MMLU и DROP тестове.
- Кодиране и математика: При кодирането моделът показва изключителна производителност, печелейки високи резултати на LiveCodeBench и Codeforces. в математиката, DeepSeek-R1 превъзхожда конкурентите си в тестове като AIME 2024 и MATH-500.
- Многоезична поддръжка: Силна производителност и в двете English и китайски.
Сравнителен изкуствен анализ от Artificial Analysis
Нека да разгледаме допълнителни тестове от Изкуствен анализ, компания, която предоставя независим анализ на AI модели и API доставчици. Този сравнителен анализ разглежда моделите от малко по-различна гледна точка.
В категорията за качество, OpenAI o1 и DeepSeek R1 споделят първото място по отношение на качеството, отбелязвайки съответно 90 и 89 точки по индекса за качество. Тези модели демонстрират най-висока ефективност при генериране на точни и контекстуално подходящи отговори, което ги прави лидери в тази категория. Все пак си струва да се отбележи, че разликата между тях според теста е минимална.
По отношение на скоростта на генериране на токени, DeepSeek R1 постига 53.6 токена в секунда, поставяйки го пред OpenAI1 (32.3 токена/секунда) и го прави един от най-бързите модели в тази категория. Въпреки това, той все още изостава от модели като ChatGPT o1-mini (210.5 токена/секунда) и някои версии на Gemini.
Следващата категория е латентност (време до първи отговор). DeepSeek R1 има латентност от 29.88 секунди, което го поставя в средата на диапазона. Модели като Gemini 2.0 Flash (0.46 секунди) или GPT-4o (0.46 секунди) генерират първия отговор много по-бързо, което може да бъде от решаващо значение за приложения, които изискват незабавна обратна връзка.
Прочетете още: Най-очарователните иновации в роботиката за 2024 г
DeepSeek AI срива пазарите
Целият пазар е в смут и основната причина за това е потенциалът на новата технологична революция, донесена от DeepSeek AI, което очевидно изисква много евтина инфраструктура. Освен това този нов AI използва чипове, които са много по-евтини в сравнение с тези, използвани от американските компании за AI.
Ефективното DeepSeek AI моделът вся страх сред инвеститорите и търговците по целия свят, което доведе до скок на криптовалутата и фондовите пазари. След въвеждането на AI, цените на базираните на AI акции и криптовалути се повишиха рязко.
Компаниите, работещи върху технологии за разработване на AI алгоритми, до голяма степен разчитат на скъпи GPU чипове. Въведете DeepSeek AI, който използва достъпни чипове в сравнение с други американски компании за AI.
Това предизвика страх сред инвеститорите, които са инвестирали значителни средства във финансови продукти, базирани на AI. Ако китайците DeepSeek обхваща сектора на изкуствения интелект, това може да намали господството на американските компании за изкуствен интелект на пазара и да доведе до значителни загуби за инвеститорите.
Големите технологични компании, фокусирани върху изкуствения интелект, вече са изправени пред трудни времена. NvidiaАкциите на компанията паднаха с повече от 10%, повличайки надолу други западни играчи като ASML. И това е само началото.
Какво следва?
Този проблем сега тревожи почти целия технологичен свят. DeepSeek дебютира като блокбастър в технологичната среда. Появата му като сериозен конкурент в пространството на ИИ сигнализира за промяна в глобалната технологична конкуренция. Чрез използването на икономически ефективен модел и принципа на отворения код, той има за цел да разруши сектора на ИИ и да доминира компаниите в САЩ, работещи в тази област.
Успехът на модела вече е забелязан във високите политически кръгове в Китай. На 20 януари денят DeepSeek-R1 беше представен, основателят Liang Wenfen присъства на затворен симпозиум за бизнесмени и експерти, организиран от китайския премиер Li Qiang, според държавната информационна агенция Xinhua.
Присъствието на Liang Wenfen на срещата сигнализира, че успехът на AI може да бъде от решаващо значение за политическите цели на Пекин за преодоляване на експортния контрол на Вашингтон и постигане на самодостатъчност в стратегически сектори като AI.
Въпреки това, DeepSeekНавлизането на AI в пространството на AI създаде напрежение в индустрията, тъй като пазарът се страхува от неговите възможности и високоефективен модел. Експертите смятат, че всяка нова иновация носи своя дял от страхове и промени. Какво ще излезе от това, предстои да видим. Едно обаче е сигурно – няма да има скучни моменти.
Прочетете още:
- OpenAI Официално пуска Sora за обществено ползване
- Биомимикрия: Как природата вдъхновява инженерите за иновации
Почти целият технологичен свят. Deep Seek дебютира като блокбъстър в технологичната среда. Появата му като сериозен конкурент в пространството на ИИ сигнализира за промяна в глобалната технологична конкуренция. Чрез използването на икономически ефективен модел и принципа на отворения код, той има за цел да разруши сектора на ИИ и да доминира компаниите в САЩ, работещи в тази област.