Pre BMS, autobus, priemyselný, prístrojový kábel.

Keď sa jarný festival blíži ku koncu, vzrušenie obklopujúce Deepseek zostáva silné. Nedávna dovolenka zdôraznila významný zmysel pre konkurenciu v technologickom priemysle, pričom mnohí diskutovali a analyzovali tento „sumca“. Silicon Valley prežíva bezprecedentný zmysel pre krízu: Obhajcovia otvoreného zdroja opäť vyjadrujú svoje názory a dokonca aj OpenAI prehodnocuje, či jej stratégia uzavretých zdrojov bola najlepšou voľbou. Nová paradigma nižších výpočtových nákladov vyvolala reťazovú reakciu medzi čipovými gigantmi, ako je NVIDIA, čo viedlo k rekordným jedným denným stratám trhovej hodnoty v histórii akciového trhu v USA, zatiaľ čo vládne agentúry skúmajú dodržiavanie čipov používaných spoločnosťou Deepseek. Uprostred zmiešaných recenzií Deepseek v zámorí, na domácom trhu, prežíva mimoriadny rast. Po spustení modelu R1 sa v pridruženej aplikácii zaznamenalo prudký nárast prevádzky, čo naznačuje, že rast v sektoroch aplikačných sektorov poháňa celkový ekosystém AI vpred. Pozitívnym aspektom je, že Deepseek rozšíri možnosti aplikácie, čo naznačuje, že spoliehanie sa na chatgpt nebude v budúcnosti tak drahé. Tento posun sa odráža v nedávnych činnostiach spoločnosti OpenAI, vrátane poskytovania modelu zdôvodnenia s názvom O3-Mini pre slobodných používateľov v reakcii na Deepseek R1, ako aj následné vylepšenia, vďaka ktorým bol myšlienkový reťazec O3-mini verejne. Mnoho zámorských používateľov vyjadrilo vďaku Deepseekovi za tento vývoj, hoci tento myšlienkový reťazec slúži ako zhrnutie.
Optimálne je zrejmé, že Deepseek zjednocuje domácich hráčov. So svojím zameraním na znižovanie nákladov na školenie sa k ekosystému aktívne pripájajú rôzni výrobcovia čipov, poskytovatelia stredných cloudu a početné startupy aktívne pripájajú k ekosystému, čím sa zvyšuje nákladová efektívnosť pri používaní modelu DeepSeek. Podľa novín spoločnosti Deepseek vyžaduje úplné školenie modelu V3 iba 2,788 milióna H800 GPU Hours a tréningový proces je veľmi stabilný. Architektúra MOE (zmes odborníkov) je rozhodujúca pre zníženie nákladov na predbežné školenie o desať v porovnaní s Llama 3 so 405 miliardami parametrov. V súčasnosti je V3 prvým verejne uznávaným modelom, ktorý demonštruje takú vysokú riedkosť v MOE. Okrem toho MLA (viacvrstvová pozornosť) funguje synergicky, najmä v aspektoch uvažovania. „Čím riedšia je MOE, tým väčšia je veľkosť dávky potrebná počas zdôvodnenia na úplné využitie výpočtovej energie, pričom veľkosť KVCache je kľúčovým faktorom obmedzujúcim obmedzením; MLA významne znižuje veľkosť kvcache,“ poznamenal výskumník z technológie Chuanjing v analýze technológie AI. Úspech Deepseeka celkovo spočíva v kombinácii rôznych technológií, nielen jednej. Priemyselní zasvätenci oceňujú inžinierske schopnosti tímu DeepSeek, zaznamenávajúc ich dokonalosť v paralelnom tréningu a optimalizácii operátorov a dosahujú priekopnícke výsledky zdokonaľovaním všetkých detailov. Open-source prístup spoločnosti Deepseek ďalej podporuje celkový vývoj veľkých modelov a predpokladá sa, že ak sa podobné modely rozšíria na obrázky, videá a ďalšie, výrazne to stimuluje dopyt v celom odvetví.
Príležitosti na služby uvažovania tretích strán
Údaje naznačujú, že od svojho vydania spoločnosť Deepseek narábala 22,15 milióna denných aktívnych používateľov (DAU) do 21 dní, dosiahla 41,6% používateľskej základne Chatgpt a prekonala 16,95 milióna denných aktívnych používateľov Doubao, čím sa stáva najrýchlejšou aplikáciou globálne, pričom sa nabitý obchodom Apple App v 157 krajinách/regiónoch. Kým sa však používatelia húfy hrnú v húfoch, kybernetickí hackeri neúnavne útočia na aplikáciu DeepSeek, čo spôsobilo výrazné zaťaženie jeho serverov. Priemyselní analytici sa domnievajú, že je to čiastočne spôsobené zavádzaním kariet DeepSeek na školenie, pričom im chýba dostatočná výpočtová sila na zdôvodnenie. Zasvätený priemysel informoval pre kontrolu technológie AI: „Časté problémy servera sa dajú ľahko vyriešiť účtovaním poplatkov alebo financovaním za nákup viacerých strojov; v konečnom dôsledku záleží na rozhodnutiach spoločnosti DeepSeek.“ To predstavuje kompromis pri zameraní na technológiu verzus produkciu. Deepseek sa vo veľkej miere spoliehal na kvantovú kvantizáciu pre sebestačnosť, keď dostal malé vonkajšie financovanie, čo malo za následok relatívne nízky tlak v hotovosti a čistejšie technologické prostredie. V súčasnosti na základe vyššie uvedených problémov niektorí používatelia naliehajú na Deepseek na sociálnych médiách, aby zvýšili prahové hodnoty využitia alebo zaviedli platené funkcie na zlepšenie pohodlia používateľov. Okrem toho vývojári začali využívať oficiálne API alebo API tretích strán na optimalizáciu. Otvorená platforma spoločnosti Deepseek však nedávno oznámila: „Aktuálne zdroje servera sú zriedkavé a nabíjanie služieb API boli pozastavené.“
To nepochybne otvára viac príležitostí predajcom tretích strán v sektore infraštruktúry AI. Mnohé domáce a medzinárodné cloudové giganty nedávno uviedli na trh API DeepSeek Model - Overseas Giants Microsoft a Amazon boli medzi prvými, ktorí sa pripojili koncom januára. Domáci vodca, Huawei Cloud, urobil prvý krok a vydal odôvodnené služby Deepseek R1 a V3 v spolupráci s tokom založeným na kremíku 1. februára. Správy z prehľadu technológie AI naznačujú, že služby Flows Silicon založené na kremíku zaznamenali príliv používateľov, ktorý účinne „havaruje“ platformu. Veľké tri technologické spoločnosti-BAT (Baidu, Alibaba, Tencent) a Bytedance-tiež vydali nízkonákladové ponuky s obmedzeným časom, ktoré sa začali 3. februára, pripomínajúce minuloročné cenové vojny dodávateľa cloudu zapaľované spoločnosťou Deepseekov model V2, kde Deepseek začal nazývať „cenové mäsiar“. Zúfalo akcie predajcov cloudu odrážajú predchádzajúce silné väzby medzi Microsoft Azure a OpenAI, kde v roku 2019 spoločnosť Microsoft uskutočnila značnú investíciu do OpenAI a získala výhody po spustení Chatgpt v roku 2023. Tento úzky vzťah sa však začal rozvíjať po meta otvorenej Llame, čo umožnilo ostatným predajcom mimo mikrosoftovej ecosystém, ktorá konkurovala ich veľkým modelom. V tomto prípade DeepSeek nielen prekonal Chatgpt, pokiaľ ide o produktové teplo, ale tiež zaviedol modely s otvoreným zdrojom po vydaní O1, podobne ako vzrušenie, ktoré obklopuje Llamu oživenie GPT-3.
V skutočnosti sa poskytovatelia cloudu tiež umiestňujú ako dopravné brány pre aplikácie AI, čo znamená, že prehĺbenie väzieb s vývojármi sa prekladá do preventívnych výhod. Správy naznačujú, že spoločnosť Baidu Smart Cloud mala viac ako 15 000 zákazníkov, ktorí využívali model DeepSeek prostredníctvom platformy Qianfan v deň uvedenia modelu. Okrem toho niekoľko menších firiem ponúka riešenia vrátane toku založeného na kremíku, technológie Luchen, technológie Chuanjing a rôznych poskytovateľov AI Infra, ktorí začali podporovať modely DeepSeek. AI Technology Review sa dozvedel, že súčasné príležitosti na optimalizáciu lokalizovaných nasadení Deepseeka existujú predovšetkým v dvoch oblastiach: jedna optimalizuje riedky charakteristiky modelu MOE pomocou zmiešaného prístupu k zdôvodneniu na nasadenie modelu 671 miliárd parametrov MOE lokálne pri využívaní hybridného GPU/CPU inferencie. Optimalizácia MLA je navyše nevyhnutná. Dva modely spoločnosti Deepseek však stále čelia niektorým výzvam pri optimalizácii nasadenia. „Vzhľadom na veľkosť modelu a početné parametre je optimalizácia skutočne zložitá, najmä pre miestne nasadenia, v ktorých bude dosiahnutie optimálnej rovnováhy medzi výkonom a nákladmi náročné,“ uviedol výskumný pracovník z technológie Chuanjing. Najvýznamnejšia prekážka spočíva v prekonávaní limitov kapacity pamäte. „Prijímame heterogénny prístup k spolupráci na plné využitie CPU a iných výpočtových zdrojov, pričom na spracovanie pomocou vysoko výkonných operátorov CPU umiestňujeme iba nezdieľané časti riedkej matice MOE,“ vysvetlil ďalej. Správy naznačujú, že kTransformátory otvorených zdrojov spoločnosti Chuanjing v primárne vkladajú rôzne stratégie a operátory do pôvodnej implementácie transformátorov prostredníctvom šablóny, čo výrazne vylepšuje rýchlosť inferencie pomocou metód ako CUDAAGRAP. DeepSeek vytvoril príležitosti pre tieto startupy, pretože rastové prínosy sa prejavujú; Mnoho firiem oznámilo výrazný rast zákazníkov po spustení rozhrania API DeepSeek, ktorý získal otázky od predchádzajúcich klientov, ktorí hľadajú optimalizácie. Zasvätenci v priemysle poznamenali: „V minulosti boli do istej miery zavedené skupiny klientov často zamknuté do štandardizovaných služieb väčších spoločností, ktoré sú pevne viazané svojimi nákladovými výhodami v dôsledku mierky. Po dokončení nasadenia DeepSeek-R1/V3 pred tým, ako sme zaviedli naše DeepSeek Festival, sme náhle dostali požiadavky na spoluprácu od niekoľkých známych klientov, a náhle sme dostali požiadavky na spoluprácu.“ V súčasnosti sa zdá, že DeepSeek robí výkonnosť modelu čoraz kritickejší a so širšími prijatím veľkých modelov to bude naďalej výrazne ovplyvniť vývoj v infra odvetví AI. Ak by sa model na úrovni Deepseek mohol nasadiť lokálne za nízku cenu, veľmi by pomohlo vládnemu a podnikovému úsiliu digitálnej transformácie. Výzvy však pretrvávajú, pretože niektorí klienti môžu mať vysoké očakávania týkajúce sa veľkých modelových schopností, čo je zrejmé, že vyváženie výkonnosti a nákladov sa pri praktickom nasadení stáva nevyhnutným.
Na vyhodnotenie toho, či je Deepseek lepší ako chatgpt, je nevyhnutné pochopiť ich kľúčové rozdiely, silné stránky a prípady použitia. Tu je komplexné porovnanie:
Funkcia | Hlboký | Chatgpt |
---|---|---|
Vlastníctvo | Vyvinuté čínskou spoločnosťou | Vyvinutý spoločnosťou OpenAi |
Zdrojový model | Open source | Vlastnícky |
Náklady | Voľné použitie; Lacnejšie možnosti prístupu API | Predplatné alebo cena za použitie za použitie |
Prispôsobenie | Vysoko prispôsobiteľné, čo používateľom umožňuje vyladiť a stavať na ňom | K dispozícii je obmedzené prispôsobenie |
Výkon v konkrétnych úlohách | Vyniká v určitých oblastiach, ako je analýza údajov a získavanie informácií | Všestranný so silným výkonom v tvorivých písacích a konverzačných úlohách |
Podpora jazyka | Silné zameranie na čínsky jazyk a kultúru | Široká jazyková podpora, ale zameraná na USA |
Výcvik | Nižšie náklady na školenie, optimalizované pre efektívnosť | Vyššie náklady na školenie, ktoré si vyžadujú značné výpočtové zdroje |
Odozva | Môže ponúknuť rôzne reakcie, prípadne ovplyvnené geopolitickým kontextom | Konzistentné odpovede založené na údajoch o školení |
Publikum | Zameraný na vývojárov a výskumných pracovníkov, ktorí chcú flexibilitu | Zamerané na všeobecných používateľov, ktorí hľadajú konverzačné schopnosti |
Prípady | Efektívnejšie pre generovanie kódu a rýchle úlohy | Ideálne na generovanie textu, odpovede na otázky a zapojenie sa do dialógu |
Kritický pohľad na „narušenie NVIDIA“
V súčasnosti, okrem Huawei, niekoľko domácich výrobcov čipov, ako sú Moore Threads, Muxi, Biran Technology a Tianxu Zhixin, sa tiež prispôsobujú dvom modelom Deepseeka. Výrobca čipov povedal AI Technology Review: „Štruktúra spoločnosti Deepseek demonštruje inovácie, napriek tomu zostáva LLM. Naša adaptácia spoločnosti Deepseek sa primárne zameriava na uvažovanie aplikácií, vďaka čomu je technická implementácia pomerne priamou a rýchlou a rýchla.“ Prístup MOE si však vyžaduje vyššie požiadavky, pokiaľ ide o skladovanie a distribúciu, spojený s zabezpečením kompatibility pri nasadení s domácimi čipmi, čím predstavuje početné technické výzvy, ktoré si vyžadujú rozlíšenie počas adaptácie. „V súčasnosti sa domáca výpočtová sila nezhoduje s použiteľnosťou a stabilitou NVIDIA, ktorá si vyžaduje pôvodnú účasť v továrni na nastavenie softvérového prostredia, riešenie problémov a optimalizáciu základnej výkonnosti,“ uviedol na základe praktických skúseností odborník v priemysle. Súčasne „v dôsledku veľkej stupnice parametrov Deepseek R1 si domáca výpočtová sila vyžaduje viac uzlov pre paralelizáciu. Domáce hardvérové špecifikácie sú navyše stále trochu pozadu; napríklad Huawei 910B v súčasnosti nemôže podporovať inferenciu FP8 zavedenú Deepseek.“ Jedným z vrcholov modelu Deepseek V3 je zavedenie miešaného výcvikového rámca FP8, ktorý bol efektívne overený na extrémne veľký model, čo označuje významný úspech. Predtým hlavní hráči ako Microsoft a NVIDIA navrhli súvisiacu prácu, ale pochybnosti v tomto odvetví pretrvávajú, pokiaľ ide o uskutočniteľnosť. Rozumie sa, že v porovnaní s INT8 je primárnou výhodou FP8, že kvantizácia po tréningu môže dosiahnuť takmer bezstratovú presnosť, zatiaľ čo výrazne zvýši inferenčnú rýchlosť. Pri porovnaní s FP16 môže FP8 realizovať až dvojnásobné zrýchlenie na H20 NVIDIA a viac ako 1,5 -násobok zrýchlenia na H100. Najmä ako diskusie týkajúce sa trendu domácej výpočtovej sily plus domáce modely, ktoré získavajú dynamiku, špekulácie o tom, či by sa NVIDIA mohla narušiť, a či je možné obísť Cuda Moat, sa stáva čoraz viac prevládajú. Jednou z nepopierateľných faktov je, že Deepseek skutočne spôsobil výrazný pokles trhovej hodnoty NVIDIA, ale tento posun vyvoláva otázky týkajúce sa špičkovej výpočtovej energie NVIDIA. Predtým akceptované príbehy týkajúce sa výpočtovej akumulácie založenej na kapitále sú spochybňované, pre NVIDIA však zostáva ťažké plne nahradiť v tréningových scenároch. Analýza hlbokého používania CUDA Deepseeka ukazuje, že flexibilita - napríklad využívanie SM na komunikáciu alebo priamo manipuluje s sieťovými kartami - nie je možné, aby sa pravidelné prispôsobenie GPU. Názory v priemysle zdôrazňujú, že priekopa NVIDIA zahŕňa skôr celý ekosystém CUDA ako iba samotný CUDA a pokyny PTX (paralelné vlákno), ktoré spoločnosť DeepSeek zamestnáva, sú stále súčasťou ekosystému CUDA. „Z krátkodobého hľadiska nemožno obísť výpočtovú silu NVIDIA - to je obzvlášť jasné v školení; nasadenie domácich kariet z dôvodu odôvodnenia bude relatívne jednoduchšie, takže pokrok bude pravdepodobne rýchlejší. Prispôsobenie domácich kariet sa však primárne zameriava na inferenciu na inferenciu; zatiaľ sa nepodarilo vycvičiť model DeepSeek na domácich kartách v rozsahu,“ priemyselný analytik zaznamenal analyzáciu AI. Celkovo z hľadiska inferencie sú okolnosti povzbudzujúce pre domáce veľké modelové čipy. Príležitosti pre výrobcov domácich čipov v oblasti inferencie sú zrejmejšie z dôvodu príliš vysokých požiadaviek na školenie, ktoré bránia vstupu. Analytici tvrdia, že stačí jednoducho využiť domáce inferenčné karty; Ak je to potrebné, získanie ďalšieho stroja je uskutočniteľné, zatiaľ čo tréningové modely predstavujú jedinečné výzvy - zvládanie zvýšeného počtu strojov sa môže stať zaťažujúcim a vyššia miera chybovosti môže negatívne ovplyvniť výsledky školenia. Výcvik má tiež špecifické požiadavky na rozsah klastru, zatiaľ čo požiadavky na zhluky na inferenciu nie sú také prísne, čím sa zmierňujú požiadavky GPU. V súčasnosti výkonnosť singlovej karty H20 NVIDIA neprekonáva výkonnosť spoločnosti Huawei alebo Cambrian; Jeho sila spočíva v zoskupovaní. Na základe celkového vplyvu na trh výpočtovej energie, zakladateľ Luchen Technology, You Yang, ktorý bol zaznamenaný v rozhovore pre AI Technology Review, „Deepseek môže dočasne oslabiť zriadenie a prenájom ultra-hodnotových školiacich výpočtových klastrov. dopyt na trhu s výpočtovou energiou. “ Okrem toho „zvýšený dopyt spoločnosti Deepseek po odôvodnení a doladiacich službách je kompatibilnejší s domácim výpočtovým prostredím, kde sú miestne kapacity relatívne slabé, čo pomáha zmierňovať odpad z nečinných zdrojov po klastrovom zriadení; vytvára to životaschopné príležitosti pre výrobcov na rôznych úrovniach domáceho výpočtového ekosystému.“ Spoločnosť Luchen Technology spolupracovala s Huawei Cloudom na spustení API Series DeepSeek R1 a odôvodnenia API a cloudových zobrazovacích služieb založených na domácej výpočtovej sile. Vy ste vyjadrili optimizmus v budúcnosti: „Deepseek vnáša dôveru v riešenia vyrábané na domácom trhu, podporuje väčšie nadšenie a investície do domácich výpočtových schopností v budúcnosti.“

Záver
Či je DeepSeek „lepší“ ako Chatgpt, závisí od konkrétnych potrieb a cieľov používateľa. Pre úlohy, ktoré si vyžadujú flexibilitu, nízke náklady a prispôsobenie, môže byť Deepseek lepší. V prípade kreatívneho písania, všeobecného prieskumu a užívateľsky prívetivých konverzačných rozhraní sa môže spoločnosť Chatgpt ujať vedenia. Každý nástroj slúži na rôzne účely, takže výber bude výrazne závisieť od kontextu, v ktorom sa používajú.
Ovládacie káble
Systém štruktúrovaného kabeláže
Sieť a údaje, optický kábel, opravný kábel, moduly, čelná doska
16. apríla-18., 2024, na Strednom východe v Dubaji
16.-18.-18., 2024 Securika v Moskve
9. mája, 2024 Nové podujatia Products & Technologies v Šanghaji
22. októbra-25. októbra 2024 Čína v Pekingu
19.-20. novembra 2024 Connected World KSA
Čas príspevku: 10. február-2025