※ 本文轉寄自 ptt.cc 更新時間: 2024-12-29 19:09:21
看板 Stock
作者 標題 [請益] Deepseek v3 對台積電有影響嗎
時間 Sat Dec 28 19:08:23 2024
https://www.ettoday.net/amp/amp_news.php7?news_id=2882228&ref=mw&from=google.c
號稱匹敵GPT-4o 陸AI模型DeepSeek-V3訓練僅花558萬美元 | ETtoday大陸新聞 | ETtodayAMP
中國大陸AI公司深度求索(DeepSeek)26日發表了全新大型開源AI模型「DeepSeek-V3」。據其官方的數據,DeepSeek-V3在性能上已可匹敵世界頂尖的閉源模型 GPT-4o 以及 Claude-3.5-Sonnet。 ...
中國大陸AI公司深度求索(DeepSeek)26日發表了全新大型開源AI模型「DeepSeek-V3」。據其官方的數據,DeepSeek-V3在性能上已可匹敵世界頂尖的閉源模型 GPT-4o 以及 Claude-3.5-Sonnet。 ...
中國展示了他們的新模型
重點在它極低的成本
好奇這樣是不是代表科技巨頭們不需要這麼多晶片?
會對台積電的晶片需求有影響嗎
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.137.70.92 (臺灣)
※ 作者: Latte7 2024-12-28 19:08:23
※ 文章代碼(AID): #1dRzmfo7 (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1735384105.A.C87.html
→ : 所以微軟、谷歌、Meta、亞馬遜、馬斯克,他們都是1F 12/28 19:10
→ : 傻瓜,中國這間最聰明,是這樣嗎?
→ : 建議你放空美股七巨頭和台積電,一定賺大錢的
→ : 傻瓜,中國這間最聰明,是這樣嗎?
→ : 建議你放空美股七巨頭和台積電,一定賺大錢的
推 : 樓上這想法很危險4F 12/28 19:11
推 : 26的AI是真有點東西,這個看論文可以知道,但也僅5F 12/28 19:13
→ : 就這樣
→ : 就這樣
→ : 可以畫出屠殺最多中國人的人嗎?8F 12/28 19:15
推 : 泡沫9F 12/28 19:16
→ : 吹和gpt 4o一個等級是他們論文的數據,寫過論文的10F 12/28 19:17
→ : 都知道這邊論文肯定是挑最好的擺,實際如何還得實
→ : 際驗證,到時候chatbot arena 或者hugging face 看
→ : 看?
→ : 都知道這邊論文肯定是挑最好的擺,實際如何還得實
→ : 際驗證,到時候chatbot arena 或者hugging face 看
→ : 看?
推 : 表示兩國AI競爭更激進,是利多14F 12/28 19:18
推 : 是不是剛聽完股癌XD15F 12/28 19:18
推 : 抖音的世界線核融合能電池都已經誕生了16F 12/28 19:21
推 : 那這種再靠gb200跑不就爽到飛天17F 12/28 19:25
推 : 等其他人複現出來再說吧 都忘記超導的論文了嗎18F 12/28 19:28
推 : 那張圖?19F 12/28 19:31
推 : AI已死20F 12/28 19:35
→ : 能實際運用再說…21F 12/28 19:37
推 : 要跑很久22F 12/28 19:43
→ : 參數也比較少
→ : 參數也比較少
→ : 對岸的碼農工作時數應該抵美國五個24F 12/28 19:54
推 : 對,用 55nm 就跑得動,all in 力積電25F 12/28 19:56
推 : 短期內不會有什麼影響...26F 12/28 19:57
推 : 你是不是聽了今天的股癌27F 12/28 19:57
推 : 對普通人夠用了,scalling law比較重要28F 12/28 20:02
推 : 很多人跳進去了 還有人在質疑ai29F 12/28 20:04
→ : 西台灣因為算力不足,所以才需要模型剪枝,美國能用30F 12/28 20:05
→ : 百萬顆GPU去硬幹,就不需要省成本
→ : 西台灣是在為愈來愈難取得老黃的GPU做準備
→ : 百萬顆GPU去硬幹,就不需要省成本
→ : 西台灣是在為愈來愈難取得老黃的GPU做準備
推 : 我記得 去年有人說 訓練大部分時間都在搬運33F 12/28 20:08
→ : 所以時間差不了太多
→ : 甚至有人開始考慮分散式訓練
→ : 也才導致 後來出現HBM 記憶體 降低搬運
→ : 重點是對岸每年有1200萬畢業的大學生 出來肝
→ : 其他國家沒有
→ : 對岸鮮肉多 還內卷....
→ : 所以時間差不了太多
→ : 甚至有人開始考慮分散式訓練
→ : 也才導致 後來出現HBM 記憶體 降低搬運
→ : 重點是對岸每年有1200萬畢業的大學生 出來肝
→ : 其他國家沒有
→ : 對岸鮮肉多 還內卷....
→ : 搞不好可以用手連線出ai40F 12/28 20:14
推 : 介殼在馬來西亞就可以買到GB200了41F 12/28 20:16
→ : 剪枝本身可能會加入人為bias 但不好說這模型變好壞42F 12/28 20:18
推 : 這個deepseek 對政治有特定立場 可以去試試看 嘻嘻43F 12/28 20:19
→ : 基本上是把黑的說成白的
→ : 基本上是把黑的說成白的
推 : 還不錯啊,就AI模型的戰爭45F 12/28 20:32
→ : 但是都要晶片倒是真的
→ : 但是都要晶片倒是真的
推 : 你是不是聽股癌講的47F 12/28 20:37
推 : 丸子,下週ai股一根48F 12/28 20:40
→ : inference time scale law49F 12/28 21:07
→ : 7樓圖是真的嗎50F 12/28 21:11
推 : 7樓是真的,但只代表訓練資料偷的,模型應該是真的51F 12/28 21:17
推 : 股癌要獲利了結52F 12/28 21:29
推 : 其實是中國網站轉問GPT然後再改的53F 12/28 21:31
推 : 吹了半天 碼農跟中企還是乖乖架梯子想辦法弄GPT54F 12/28 21:48
→ : 用GPT 出錯了可以怪GPT 用中國垃圾 出錯就準備被告
→ : 用GPT 出錯了可以怪GPT 用中國垃圾 出錯就準備被告
→ : 我怎麼想都覺得這東西撼動不了hyperscaler ,56F 12/28 22:17
→ : 看推文去聽股癌,感覺他講的沒什麼根據,歐美會拿
→ : 中國的東西challenge 自己嗎… 他們應該覺得這超low
→ : 吧..
→ : 看推文去聽股癌,感覺他講的沒什麼根據,歐美會拿
→ : 中國的東西challenge 自己嗎… 他們應該覺得這超low
→ : 吧..
推 : 這個如果用先進製程會更猛 對面是沒先進製程只好這60F 12/28 22:35
→ : 樣玩
→ : 樣玩
→ WD640G …
推 : 他們不用考慮智慧財產權的話 訓練出來是真低猛63F 12/28 22:43
噓 : 阿就股癌想出貨了啊64F 12/28 23:05
→ : 都開源的 因為知道其他人訓練不了65F 12/28 23:07
→ : xAI 開源當天 一堆人下載後發現要8張H100 就砍了
推 : xAI Grok-1 model size 310B , deepseek 670B
→ : 看起來模型參數不小
→ : xAI 開源當天 一堆人下載後發現要8張H100 就砍了
推 : xAI Grok-1 model size 310B , deepseek 670B
→ : 看起來模型參數不小
噓 : 上面講出貨的….出貨要吹好的,不是吹壞的…69F 12/28 23:18
推 : 股癌 蠻有道理的阿 有人拿既有的模型優化70F 12/28 23:21
→ : 像是GPT 4o
→ : 或是最新的openAI o3
→ : 只要有人願意餵AI 中文資料 應該都樂見
→ : 把四庫全書 龍藏經 一堆古文全部餵進去
→ : 反正對岸 破壞價格也不是一天兩天
→ : 手機 面板 記憶體 電動車 只要內卷後都爛大街
推 : 不過 openAI 看起來更重視 AGI指數
→ : 不用知道太多 但是要符合人性
→ : 像是GPT 4o
→ : 或是最新的openAI o3
→ : 只要有人願意餵AI 中文資料 應該都樂見
→ : 把四庫全書 龍藏經 一堆古文全部餵進去
→ : 反正對岸 破壞價格也不是一天兩天
→ : 手機 面板 記憶體 電動車 只要內卷後都爛大街
推 : 不過 openAI 看起來更重視 AGI指數
→ : 不用知道太多 但是要符合人性
推 : 誰出貨是放利空== 有夠韭79F 12/28 23:33
推 : 通用AI 以後應該會偏向AGI 困難的都不回答80F 12/28 23:44
→ : 都會叫你去問專業的
→ : 然後就要收錢了
→ : 資料中心蓋了也不是只訓練 通用模型
→ : 專業模型才是有錢賺 而且不開源
→ : 蛋白質 和 化學組成
→ : 都會叫你去問專業的
→ : 然後就要收錢了
→ : 資料中心蓋了也不是只訓練 通用模型
→ : 專業模型才是有錢賺 而且不開源
→ : 蛋白質 和 化學組成
推 : 整天妄想別人要出貨 真可悲86F 12/28 23:53
推 : 看他的商業模式跟如何獲利,再看模型優劣是否為致87F 12/28 23:58
→ : 命因素。
→ : 命因素。
推 : 現在在搞知識蒸餾 之後語言模型一定會變小89F 12/29 00:05
推 : 這隻用moe才這麼省90F 12/29 00:43
噓 : 講出貨的是87是不是?哪個主力會想要在自己出貨前91F 12/29 01:39
→ : 股價先崩啊,傻逼是不是啊
→ : 股價先崩啊,傻逼是不是啊
推 : 看到推文就可以安心放空了 一堆8793F 12/29 09:36
推 : GPU即將泡沫了94F 12/29 10:04
噓 : 穩了 一堆沒聽仔cc95F 12/29 10:52
推 : GG幾年前就有在招AI人才了 我也被邀去面過96F 12/29 12:33
→ : 不過聽完覺得GG還沒準備在AI上下重本 或許這幾年又
→ : 有變化
→ : 不過聽完覺得GG還沒準備在AI上下重本 或許這幾年又
→ : 有變化
推 : 對岸ai論文多就是敢說謊跟造假99F 12/29 12:57
推 : 推文真的蠻好笑的 台灣啥屁都沒有 還有臉說別人XD100F 12/29 13:57
--
※ 看板: Stock 文章推薦值: 0 目前人氣: 0 累積人氣: 51
作者 Latte7 的最新發文:
- om 中國展示了他們的新模型 重點在它極低的成本 好奇這樣是不是代表科技巨頭們不需要這麼多晶片? 會對台積電的晶片需求有影響嗎100F 44推 4噓
- 15F 3推
- 8F 4推 1噓
- 25F 10推 3噓
- 46F 16推 21噓
點此顯示更多發文記錄
→
guest
回列表(←)
分享