亚洲有码一区,欧美在线网站一区三区,91极品无码国产在线观看,日韩中文欧美中文字幕

心滿意得網(wǎng)心滿意得網(wǎng)

突然火爆全網(wǎng)!中國(guó)“神秘力量”震動(dòng)美國(guó)科技圈

  近日,神秘力量國(guó)產(chǎn)AI DeepSeek在中國(guó)、火爆美國(guó)的全網(wǎng)圈科技圈受到廣泛關(guān)注,甚至被認(rèn)為是中國(guó)震動(dòng)大模型行業(yè)的最大“黑馬”,在外網(wǎng),美國(guó)DeepSeek被不少人稱為“神秘的科技東方力量”。

  1月27日,神秘力量DeepSeek應(yīng)用登頂蘋果美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜,火爆在美區(qū)下載榜上超越了ChatGPT。全網(wǎng)圈同日,中國(guó)震動(dòng)蘋果中國(guó)區(qū)應(yīng)用商店免費(fèi)榜顯示,美國(guó)DeepSeek成為中國(guó)區(qū)第一??萍?/p>蘋果美國(guó)區(qū)應(yīng)用商店蘋果美國(guó)區(qū)應(yīng)用商店蘋果APP Store中國(guó)區(qū)免費(fèi)榜蘋果APP Store中國(guó)區(qū)免費(fèi)榜

  1月27日

  相關(guān)微博熱搜刷屏

  游戲科學(xué)創(chuàng)始人、CEO,火爆《黑神話:悟空》制作人馮驥評(píng)價(jià)DeepSeek:可能是全網(wǎng)圈個(gè)國(guó)運(yùn)級(jí)別的科技成果。

  DeepSeek是啥?

  DeepSeek,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立于2023年7月17日,是一家創(chuàng)新型科技公司,專注于開(kāi)發(fā)先進(jìn)的大語(yǔ)言模型(LLM)和相關(guān)技術(shù)。

  去年12月DeepSeek-V3發(fā)布后,AI數(shù)據(jù)服務(wù)公司Scale AI創(chuàng)始人Alexander Wang就發(fā)帖稱,DeepSeek-V3是中國(guó)科技界帶給美國(guó)的苦澀教訓(xùn)?!爱?dāng)美國(guó)休息時(shí),中國(guó)(科技界)在工作,以更低的成本、更快的速度和更強(qiáng)的實(shí)力趕上?!?/p>

  不到一個(gè)月之后,今年1月20日,DeepSeek正式開(kāi)源R1推理模型。

  據(jù)DeepSeek介紹,其最新發(fā)布的模型DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,性能比肩OpenAI o1正式版。

  這一模型發(fā)布后,引發(fā)了海外AI圈眾多科技大佬的討論。例如,英偉達(dá)高級(jí)研究科學(xué)家Jim Fan就在個(gè)人社交平臺(tái)上公開(kāi)發(fā)表推文表示:“我們正身處這樣一個(gè)歷史時(shí)刻:一家非美國(guó)公司正在延續(xù)OpenAI最初的使命——通過(guò)真正開(kāi)放的前沿研究賦能全人類??此撇缓铣@恚钣腥さ慕Y(jié)局往往最可能成真?!?/p>圖源:證券時(shí)報(bào)圖源:證券時(shí)報(bào)

  DeepSeek為何突然爆火?

  26日,DeepSeek出現(xiàn)了短時(shí)閃崩現(xiàn)象。不少網(wǎng)友反映,使用時(shí)遇到 “服務(wù)器繁忙” 的提示。

  對(duì)此,DeepSeek回應(yīng)稱,當(dāng)天下午確實(shí)出現(xiàn)了局部服務(wù)波動(dòng),但問(wèn)題在數(shù)分鐘內(nèi)就得到了解決。此次事件可能是由于新模型發(fā)布后,用戶訪問(wèn)量激增,服務(wù)器一時(shí)無(wú)法滿足大量用戶的并發(fā)需求。不過(guò),官方狀態(tài)頁(yè)并未將這一事件標(biāo)記為事故。

  據(jù)了解,此前DeepSeek在美區(qū)榜單的排名并無(wú)特別突出表現(xiàn),處于穩(wěn)步上升階段,但未進(jìn)入前十。此次突然躥升,與其近期一系列突出表現(xiàn)有直接關(guān)系。

  據(jù)廣州日?qǐng)?bào)報(bào)道,“DeepSeek爆火的原因主要可以歸結(jié)為兩點(diǎn):性能和成本。”薩摩耶云科技集團(tuán)首席經(jīng)濟(jì)學(xué)家鄭磊告訴記者。DeepSeek解釋稱,R1在后訓(xùn)練階段大規(guī)模使用了強(qiáng)化學(xué)習(xí)技術(shù),在僅有極少標(biāo)注數(shù)據(jù)的情況下,極大提升了模型推理能力。這種卓越的性能不僅吸引了科技界的廣泛關(guān)注,也讓投資界看到了其巨大的商業(yè)潛力。

  更為關(guān)注的是,DeepSeek R1真正與眾不同之處在于它的成本——或者說(shuō)成本很低。DeepSeek的R1的預(yù)訓(xùn)練費(fèi)用只有557.6萬(wàn)美元,僅是OpenAI GPT-4o模型訓(xùn)練成本的不到十分之一。同時(shí),DeepSeek公布了API的定價(jià),每百萬(wàn)輸入tokens 1元(緩存命中)/4元(緩存未命中),每百萬(wàn)輸出tokens 16元。這個(gè)收費(fèi)大約是OpenAI o1運(yùn)行成本的三十分之一,也因此,DeepSeek被稱為AI界的“拼多多”。

  鄭磊直言,DeepSeek對(duì)硬件市場(chǎng)產(chǎn)生了重大影響,因?yàn)樗赡軙?huì)降低人工智能模型的硬件成本,從而推動(dòng)人工智能技術(shù)的發(fā)展。

  團(tuán)隊(duì)不到140人,都來(lái)自國(guó)內(nèi)頂尖高校

  DeepSeek之所以能取得這些創(chuàng)新并非一日之功,而是“孵化”數(shù)年之久,長(zhǎng)期謀劃后的結(jié)果。DeepSeek創(chuàng)始人梁文鋒也是頭部量化私募幻方量化的創(chuàng)始人。Deepseek充分利用了其幻方量化積累的資金、數(shù)據(jù)和卡。梁文鋒本科、研究生畢業(yè)于浙江大學(xué),擁有信息與電子工程學(xué)系本科和碩士學(xué)位。2008年起,他開(kāi)始帶領(lǐng)團(tuán)隊(duì)使用機(jī)器學(xué)習(xí)等技術(shù)探索全自動(dòng)量化交易。2023年7月,DeepSeek正式成立,進(jìn)軍通用人工智能領(lǐng)域,至今從未對(duì)外融資。

  此前,OpenAI前政策主管、Anthropic聯(lián)合創(chuàng)始人Jack Clark認(rèn)為DeepSeek雇用了“一批高深莫測(cè)的奇才”,對(duì)此,梁文峰在接受自媒體采訪時(shí)曾透露過(guò),并沒(méi)有什么高深莫測(cè)的奇才,都是來(lái)自Top高校的畢業(yè)生、沒(méi)畢業(yè)的博四、博五實(shí)習(xí)生,還有一些畢業(yè)才幾年的年輕人。從目前已有的媒體公開(kāi)報(bào)道中可以看出,DeepSeek團(tuán)隊(duì)最大的特點(diǎn)是名校、年輕,即使是團(tuán)隊(duì)Leader級(jí)別,年紀(jì)也多在35歲以下。不到140人的團(tuán)隊(duì),工程師和研發(fā)人員幾乎都來(lái)自清華大學(xué)、北京大學(xué)、中山大學(xué)、北京郵電大學(xué)等國(guó)內(nèi)頂尖高校,工作時(shí)間都不長(zhǎng)。

  番外

  專家解讀:中國(guó)新AI大模型為何火爆全網(wǎng)

  近日,一個(gè)名為DeepSeek(深度求索)的中國(guó)AI初創(chuàng)公司成為國(guó)內(nèi)外人工智能(AI)大模型領(lǐng)域熱議話題。在不到30天的時(shí)間里,DeepSeek先后發(fā)布了DeepSeek-V3和DeepSeek-R1兩款大模型,其成本與動(dòng)輒數(shù)億甚至上百億美元的國(guó)外大模型項(xiàng)目相比堪稱低廉,而性能與國(guó)外頂尖大模型相當(dāng)。同時(shí),DeepSeek與外國(guó)大模型巨頭閉源的路徑不同,采用開(kāi)源模式。中國(guó)這家公司的發(fā)展模式與成果讓硅谷高度關(guān)注,多家西方主流媒體紛紛發(fā)文感嘆“中國(guó)AI模型震驚硅谷”,甚至引發(fā)了國(guó)內(nèi)外多家知名廠商與機(jī)構(gòu)連夜嘗試復(fù)現(xiàn)DeepSeek成果的“熱潮”。DeepSeek的發(fā)展具有哪些特點(diǎn)?是否對(duì)國(guó)產(chǎn)大模型的發(fā)展路徑以及創(chuàng)新思路帶來(lái)一些啟示?《環(huán)球時(shí)報(bào)》記者26日采訪了多位人工智能領(lǐng)域的專家。

  “OpenAI o1經(jīng)濟(jì)實(shí)惠且開(kāi)放的競(jìng)爭(zhēng)對(duì)手”

  DeepSeek公司本月20日發(fā)布大模型R1,并表示“在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,性能比肩OpenAI o1正式版”,引發(fā)外媒特別是美國(guó)媒體高度關(guān)注這家中國(guó)公司及其最新大模型成果。

  “中國(guó)便宜、開(kāi)放的人工智能模型 DeepSeek讓科學(xué)家興奮不已?!薄蹲匀弧冯s志24日以此為題稱,中國(guó)研制的大語(yǔ)言模型DeepSeek-R1令科學(xué)家們興奮不已,它被認(rèn)為是OpenAI o1等“推理”模型的經(jīng)濟(jì)實(shí)惠且開(kāi)放的競(jìng)爭(zhēng)對(duì)手。

  《紐約時(shí)報(bào)》24日以“中國(guó)人工智能初創(chuàng)企業(yè)DeepSeek如何與硅谷巨頭競(jìng)爭(zhēng)”為題報(bào)道稱,能做到上述成績(jī)本已是一個(gè)里程碑,但DeepSeek-V3大模型背后的團(tuán)隊(duì)描述了一個(gè)更大的進(jìn)步。他們?cè)谟?xùn)練該系統(tǒng)時(shí)只用了先進(jìn)人工智能公司所用的高度專業(yè)化計(jì)算機(jī)芯片的一小部分。中國(guó)工程師稱,他們只花了約600萬(wàn)美元以及約2000個(gè)英偉達(dá)專用芯片就完成了新模型的訓(xùn)練,無(wú)論資金以及芯片使用規(guī)模都遠(yuǎn)低于世界領(lǐng)先的人工智能公司。

  “這不是中國(guó)追趕美國(guó)的問(wèn)題,而是開(kāi)源追趕閉源的問(wèn)題”

  DeepSeek備受關(guān)注,除了性價(jià)比超高,還有另一個(gè)原因:開(kāi)源。連日來(lái),網(wǎng)絡(luò)上已經(jīng)出現(xiàn)了一波復(fù)現(xiàn)DeepSeek的熱潮。加州大學(xué)伯克利分校、香港科技大學(xué)、知名人工智能公司HuggingFace等紛紛成功復(fù)現(xiàn),只用強(qiáng)化學(xué)習(xí),沒(méi)有監(jiān)督微調(diào),甚至只用幾十美元的成本就能完成復(fù)現(xiàn)。

  美國(guó)紅迪網(wǎng)25日稱,中國(guó)DeepSeek的模型是開(kāi)源的,這是令人興奮的真正原因?;旧?,他們將制造這些東西的知識(shí)免費(fèi)提供給全世界,確保沒(méi)有人能夠真正壟斷它。中國(guó)公司基本上與美國(guó)公司的做法完全相反。你能看到OpenAI、Anthropic或谷歌開(kāi)源任何強(qiáng)大的模型嗎?到目前為止,我們從他們那里得到的只是皮毛。Meta是唯一一家對(duì)開(kāi)源大模型做出重大貢獻(xiàn)的西方大公司,但他們將來(lái)可能不會(huì)開(kāi)源其最好的模型。被譽(yù)為“深度學(xué)習(xí)三巨頭”之一的Yann LeCun(楊立昆)在社交平臺(tái)X上表示,這不是中國(guó)追趕美國(guó)的問(wèn)題,而是開(kāi)源追趕閉源的問(wèn)題。

  北京郵電大學(xué)人機(jī)交互與認(rèn)知工程實(shí)驗(yàn)室主任劉偉在接受《環(huán)球時(shí)報(bào)》記者采訪時(shí)表示,大模型三大核心要素是數(shù)據(jù)、算法、算力,Deepseek使用較少的數(shù)據(jù)、較少的算力,通過(guò)算法的優(yōu)化實(shí)現(xiàn)了與國(guó)外知名大模型等效甚至更優(yōu)的效果,這是非常值得肯定的。同時(shí)還要看到它是開(kāi)源的,可以供全球希望使用這一大模型的用戶來(lái)使用和復(fù)現(xiàn)。

  清華大學(xué)新聞學(xué)院、人工智能學(xué)院教授沈陽(yáng)26日對(duì)《環(huán)球時(shí)報(bào)》記者表示,DeepSeek的大模型是全球開(kāi)源大模型當(dāng)中相當(dāng)優(yōu)秀的一款,是混合使用多種先進(jìn)技術(shù)實(shí)現(xiàn)超越傳統(tǒng)預(yù)訓(xùn)練技術(shù)的創(chuàng)新突破。他結(jié)合自身使用的感受談了這款大模型的幾個(gè)優(yōu)點(diǎn)。一是它把目前提升AI大模型能力的方法進(jìn)行了工程上的微創(chuàng)新組合。二是DeepSeek公布了相關(guān)論文,整個(gè)過(guò)程可以讓大家去復(fù)現(xiàn),這就是開(kāi)源的力量。三是DeepSeek的推理過(guò)程,有自身的創(chuàng)新。沈陽(yáng)作為AI領(lǐng)域的研究者,使用AI超過(guò)3萬(wàn)次,他認(rèn)為,DeepSeek跟美國(guó)的AI相比,還有很多中國(guó)元素在里面,如中國(guó)網(wǎng)絡(luò)當(dāng)中的一些熱詞。

  提升推理能力

  對(duì)于Deepseek的發(fā)展模式為國(guó)內(nèi)大模型發(fā)展以及創(chuàng)新提供了怎樣的重要啟示,劉偉認(rèn)為,“創(chuàng)新不是規(guī)劃出來(lái)的,需要市場(chǎng)、專業(yè)機(jī)構(gòu)通過(guò)長(zhǎng)時(shí)間的研究來(lái)另辟蹊徑,尤其是一些長(zhǎng)期關(guān)注垂直領(lǐng)域的商業(yè)公司可以通過(guò)對(duì)技術(shù)路徑的反思、對(duì)市場(chǎng)發(fā)展的嗅覺(jué),來(lái)找到更好的創(chuàng)新點(diǎn)。OpenAI最初的發(fā)展過(guò)程也是這樣,并不是美國(guó)官方與科技巨頭砸重金規(guī)劃出來(lái)的。”

  日前,OpenAI、軟銀等公司公布了“星際之門”計(jì)劃,要在4年中砸5000億美元來(lái)加速美國(guó)人工智能的發(fā)展。劉偉強(qiáng)調(diào),這種集中人力、財(cái)力、物力,再給予政策傾斜的發(fā)展路徑,在未來(lái)研究方向與研究結(jié)果方面都存在一定的不確定性?!斑€是要鼓勵(lì)國(guó)內(nèi)更多商業(yè)公司、科研院所聚焦自身的研究領(lǐng)域,找到適合自己的創(chuàng)新與發(fā)展路徑?!?/p>

  沈陽(yáng)表示,在AI發(fā)展歷史中,新的突破往往是由不顯眼的工程創(chuàng)新與科學(xué)探索共同驅(qū)動(dòng)的。這種趨勢(shì)在DeepSeek的成果中得到了深刻體現(xiàn),它不僅突破了傳統(tǒng)的訓(xùn)練方式,也為推理能力的提升帶來(lái)了全新的視角?!氨M管它的成就尚處于一個(gè)階段性水平,但其工程貢獻(xiàn)和理論創(chuàng)新已經(jīng)為未來(lái)的AI發(fā)展奠定了重要基礎(chǔ)?!鄙蜿?yáng)認(rèn)為,DeepSeek團(tuán)隊(duì)在基礎(chǔ)模型預(yù)訓(xùn)練方面的貢獻(xiàn),不僅是在技術(shù)層面上的突破,更在于其工程方法的精細(xì)與高效。DeepSeek的這種工程創(chuàng)新,標(biāo)志著AI模型訓(xùn)練的一個(gè)全新階段,這不僅降低了開(kāi)發(fā)成本,也為其他公司提供了可借鑒的路徑。同時(shí),DeepSeek的核心創(chuàng)新還體現(xiàn)在推理能力的提升上,尤其是通過(guò)相關(guān)算法創(chuàng)新來(lái)推動(dòng)模型的自然推理能力,證明了AI領(lǐng)域的一種潛力——無(wú)須大量昂貴的思維鏈標(biāo)注,模型依然能夠涌現(xiàn)出推理能力。

  沈陽(yáng)認(rèn)為,DeepSeek的成功也讓我們看到了未來(lái)AI產(chǎn)業(yè)的發(fā)展方向:更多的開(kāi)源創(chuàng)新、硬件與軟件的深度協(xié)同,以及對(duì)模型開(kāi)發(fā)成本與推理能力的不斷優(yōu)化。同時(shí),我們也必須看到,DeepSeek雖然取得了顯著的階段性成果,要想在未來(lái)發(fā)展道路上實(shí)現(xiàn)進(jìn)一步突破,仍然需要面對(duì)許多深層次的挑戰(zhàn),例如需要更多的原創(chuàng)性訓(xùn)練數(shù)據(jù)和算法創(chuàng)新。

  來(lái)源:環(huán)球時(shí)報(bào)-環(huán)球網(wǎng)記者 劉揚(yáng)、環(huán)球時(shí)報(bào)-環(huán)球網(wǎng)特約記者 任重、中國(guó)新聞社綜合自DeepSeek官方微信 澎湃新聞 每日經(jīng)濟(jì)新聞 界面新聞 財(cái)聯(lián)社 廣州日?qǐng)?bào) 證券時(shí)報(bào)等

贊(19381)
未經(jīng)允許不得轉(zhuǎn)載:>心滿意得網(wǎng) » 突然火爆全網(wǎng)!中國(guó)“神秘力量”震動(dòng)美國(guó)科技圈