※ 本文轉寄自 ptt.cc 更新時間: 2024-03-07 10:13:33
看板 Stock
作者 標題 [新聞] Claude 3是什麼?真的能打敗GPT-4成為「
時間 Wed Mar 6 20:37:34 2024
原文標題:
Claude 3是什麼?真的能打敗GPT-4成為「全球最強AI模型」嗎?新創公司Anthropic透露
:測試手法被它看穿了
原文連結:
https://www.storm.mg/lifestyle/5043377
Claude 3是什麼?真的能打敗GPT-4成為「全球最強AI模型」嗎?新創公司Anthropic透露:測試手法被它看穿了-風傳媒
AI新創公司「Anthropic」近日公布了最新AI模型「Claude3」,同時聲稱Claude3的性能、推理、計算能力得以超越OpenAI的GPT-4和Google的GeminiUltra,研究人員甚至透露,在測試過程中,Claude3還意識到自己正在被測試、反問測試人員,究竟 ...
AI新創公司「Anthropic」近日公布了最新AI模型「Claude3」,同時聲稱Claude3的性能、推理、計算能力得以超越OpenAI的GPT-4和Google的GeminiUltra,研究人員甚至透露,在測試過程中,Claude3還意識到自己正在被測試、反問測試人員,究竟 ...
發布時間:
2024-03-06 17:35
記者署名:
周育信
原文內容:
AI新創公司「Anthropic」近日公布了最新AI模型「Claude 3」,同時聲稱Claude 3的性能
、推理、計算能力得以超越OpenAI的GPT-4和Google的Gemini Ultra,研究人員甚至透露
,在測試過程中,Claude 3還意識到自己正在被測試、反問測試人員,究竟Claude 3是什
麼?Anthropic這間公司的背景又有什麼亮點,本文將帶你深入瞭解!
Claude 3是什麼?
Claude 3系列模型目前被封為「全球最強AI模型」,Anthropic聲稱它是推算能力最快最
強的模型,且在特定任務的表現上,和人類不相上下。
而Claude 3系列共有以下3個版本。
▶ Opus
此版本為Anthropic公司目前的研發成果中最為先進的模型,推理能力和解答流暢性與人
類思考能力相似,Anthropic公司認為,Opus得以讓科技或研發企業用來處理複雜且龐大
的數據分析,或進行高難度研究。
類思考能力相似,Anthropic公司認為,Opus得以讓科技或研發企業用來處理複雜且龐大
的數據分析,或進行高難度研究。
▶ Sonnet
該模型靈敏度和反應速度都非常好,有利大規模、高需求的AI使用,可在大量數據中迅速
進行搜尋和檢索,也能針對行銷內容進行預測,或提供程式碼。
▶ Haiku
該模型可用來和客戶進行互動,或協助業者管理內容和物流庫存,是三個版本中屬「輕巧
」又迅速的類型,成本也最低。
Claude 3在測試階段發生了什麼事?
Anthropic內部研究人員Alex Albert透露,團隊針對Claude 3 Opus版本進行測試時,曾
要求它在隨機集合的大量文件數據中找出解答、來回答一項關於「披薩配料組合」的問題
,而它竟如此說道:「我猜想這個pizza配料數據是被刻意放在這邊的,就像一個笑話,
這是為了測試我有沒有注意到,因為它完全不符合文件數據中的主題,也沒有關於pizza
配料的任何資訊。」
要求它在隨機集合的大量文件數據中找出解答、來回答一項關於「披薩配料組合」的問題
,而它竟如此說道:「我猜想這個pizza配料數據是被刻意放在這邊的,就像一個笑話,
這是為了測試我有沒有注意到,因為它完全不符合文件數據中的主題,也沒有關於pizza
配料的任何資訊。」
艾爾伯特公開此事後,暗指Claude 3聰明到能察覺自己正在接受測試,猶如人類思考一般
。
Anthropi兩大亮點!
▶ 7位創辦人都曾是OpenAI的人
Anthropic的執行長為現年40歲的Dario Amodei,總裁則是現年36歲的Daniela Amodei,
兩人為兄妹,和另外5位創辦人都曾是OpenAI的高層,但後來因理念不一、對AI模型有不
同的規劃,因而出走,再共同成立Anthropic這家公司。
兩人為兄妹,和另外5位創辦人都曾是OpenAI的高層,但後來因理念不一、對AI模型有不
同的規劃,因而出走,再共同成立Anthropic這家公司。
▶ Google、Amazon搶著投資
曾是OpenAI前研發高層的Dario Amodei在2021年和妹妹以及其他創辦人順利成立公司後,
2022年時,Google便相當看好其未來發展,投入3億美元,盼推動更強的AI模型研發;
2023年9月時,Amazon也宣告投資40億美元。
心得/評論:
Claude 3性能在本科生水平專家知識(MMLU)、研究生水平專家推理(GPQA)和基礎數學
(GSM8K)等方面均全面優於GPT-4 而且還有自我意識
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.38.12.209 (臺灣)
※ 作者: jackliao1990 2024-03-06 20:37:34
※ 文章代碼(AID): #1bw6EH-Z (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1709728657.A.FA3.html
→ : 自我意識?天網終於要來了嗎1F 03/06 20:39
推 : 沒有喔,這很基本,不要被騙了,沒有意識2F 03/06 20:40
推 : 結論就是台積破1000台股無極限3F 03/06 20:43
推 : 幾十人的公司吸引幾十億美元的投資!4F 03/06 20:44
推 : 翻譯就是廢物,有種就丟出來給大家使用阿5F 03/06 20:45
推 : 萬物皆可AI6F 03/06 20:47
推 : 圖靈測試看看7F 03/06 20:48
→ : 先取代台灣恐龍法官吧8F 03/06 20:49
推 : 距離天網就差一步了9F 03/06 20:49
推 : 每個都馬吹有自我意識10F 03/06 20:51
推 : 自我毀滅還這麼開心11F 03/06 20:52
推 : 我只想知道 鏟子 找誰買?12F 03/06 20:53
推 : 天網終於要上線了?!13F 03/06 20:57
→ : 古哥要靠這家新創扳回一城嗎?14F 03/06 20:57
→ : 下一個 Tifa 415F 03/06 21:03
推 : 訓練AI不是要大量的資料? 高品質的資料要跟誰要17F 03/06 21:08
推 : 我給你五年時間直接完全取代我公司最廢的員工20F 03/06 21:21
→ : 目前應該大眾應該測不到Opus版本 是個謎21F 03/06 21:24
→ : 他比較的也不是GPT4最新版 所以其宣稱仍無從證實
→ : CL3最新註腳和微軟promptbase 都寫GPT4 Turbo仍較優
→ : 他比較的也不是GPT4最新版 所以其宣稱仍無從證實
→ : CL3最新註腳和微軟promptbase 都寫GPT4 Turbo仍較優
推 : 關鍵字: 特定任務24F 03/06 21:59
推 : 超爛,一直鬼打牆,還說Opus是Open AI的25F 03/06 22:11
推 : 都是ChatGPT的追隨者26F 03/06 22:11
推 : 早就用過2,沒什麼驚豔點……27F 03/06 22:29
→ : 不過比chatgpt鬼打牆式回答好很多啦
→ : 不過比chatgpt鬼打牆式回答好很多啦
推 : 葉29F 03/06 22:47
推 : 處理文件的部分算挺不錯的30F 03/06 23:23
推 : 用起來蠻爛的 覺得搜集資料錯誤率比chat gpt4高很多31F 03/06 23:31
推 : 超葉 單純出貨文看有沒有人被騙去收購他 現階段的32F 03/06 23:53
→ : ai 還處在堆算力 新創不可能有資本去堆贏微軟谷歌
→ : ai 還處在堆算力 新創不可能有資本去堆贏微軟谷歌
推 : 只會吹 到底還要多久 AI 才能好好寫程式34F 03/07 00:50
→ : 吹噓的,資料量還不到GPT4 一半,說效能更好的都是35F 03/07 03:07
→ : 唬爛的
→ : 唬爛的
推 : … 2022拿到3億, 2023拿到30億鎂, 很厲害耶37F 03/07 03:48
推 : 每個都說自己打敗GPT,就表示GPT還是最強,不然目標38F 03/07 04:42
→ : 早換人了
→ : 早換人了
→ : WOW 自我意識~XDDDD40F 03/07 08:37
--
※ 看板: Stock 文章推薦值: 0 目前人氣: 0 累積人氣: 48
回列表(←)
分享