※ 本文轉寄自 ptt.cc 更新時間: 2024-09-14 09:07:15
看板 Stock
作者 標題 [情報] OpenAI模型o1-preview考2021年指考數學甲
時間 Fri Sep 13 15:13:42 2024
標題:
OpenAI模型o1-preview考2021年指考數學甲
來源:
fb看到一個工程師做的實驗
網址:
FB: 軟體工程師 Roger
https://tinyurl.com/4v7c34fh
內文:
軟體工程師 Roger
我讓 OpenAI 最新模型 o1-preview 考了 2021 年指考數學甲,跟 GPT-4o 相比大幅進步
了 23.6 分!
其他細節請到該作者臉書觀看。
前陣子也看了speak app英語教學的相關影片或業配,覺
得有些教學部分,有可能AI可以做到取代真人。
股點: 增加各位對於AI概念的信心,美國市值型ETF通包。
--
被動收入存錢筒~
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.126.254.52 (臺灣)
※ 作者: Tox 2024-09-13 15:13:42
※ 文章代碼(AID): #1cu-OsFB (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1726211638.A.3CB.html
推 : 丸惹 我躺平了= =1F 09/13 15:15
推 : 那些指考答案網路上都有 有什麼厲害?2F 09/13 15:16
→ : 有種拿全新的題目來測
→ : 有種拿全新的題目來測
推 : 完了,考不上了4F 09/13 15:16
推 : 作答時間?5F 09/13 15:16
→ : 抄答案是有個鳥用6F 09/13 15:17
推 : 不會累,不會算錯,沒有把人的變數考慮進去是有什7F 09/13 15:17
→ : 麼好比...
→ : 麼好比...
→ : 證明網路搜尋能力更利害?9F 09/13 15:17
推 : 確實應該拿還沒有公布答案的考題來考比較合理10F 09/13 15:19
→ : 但相信一樣考贏一堆人 很多人open book一樣不會寫
→ : 但相信一樣考贏一堆人 很多人open book一樣不會寫
推 : 沒公布答案的考題也有考古題啊12F 09/13 15:21
推 : 人類要丸 大家準備失業了13F 09/13 15:21
→ : 這個openAI沒有查到數甲解答嗎14F 09/13 15:21
推 : 你叫他計算後選出最正確答案 那它就是計算而不是找15F 09/13 15:24
推 : 沒公布的考題至少數字會改吧 不太可能複製貼上16F 09/13 15:25
→ : 不懂?所以是搜尋能力還是解題能力?17F 09/13 15:25
推 : 考得上台大醫科嗎18F 09/13 15:25
推 : 應該要列出算式19F 09/13 15:25
→ : 類型一樣 只要數字不一樣 考的就不會是搜尋能力20F 09/13 15:25
→ : 這哪是open book 直接抄答案21F 09/13 15:26
→ : 智商157 ?22F 09/13 15:27
推 : 欸欸 羅傑說你是248623F 09/13 15:28
→ : 沒有滿分,下去24F 09/13 15:29
→ : 覺得是抄答案的可以自己微調題目 再驗證GPT的答案阿25F 09/13 15:29
噓 : 上面有JB26F 09/13 15:30
推 : 這個o1模型是標榜邏輯能力強27F 09/13 15:30
→ : 會算數學會寫程式 但是沒有其他方面的知識
→ : 會算數學會寫程式 但是沒有其他方面的知識
→ : o1就之前新聞說的草莓 今天新出的29F 09/13 15:32
推 : AI不算是計算,他是推論30F 09/13 15:37
推 : Open booook31F 09/13 15:37
噓 : 花個20美金試用一下再來發表意見說他是直接抄答案32F 09/13 15:38
→ : o1-preview回答數學問題會列出思考和計算過程
→ : o1-preview回答數學問題會列出思考和計算過程
噓 : 股點?34F 09/13 15:39
推 : 是抄答案那怎麼會有錯35F 09/13 15:39
→ : 訓練完之後,就是個黑盒子,除非設計成它有去網路找36F 09/13 15:39
→ : 資料的能力
→ : 資料的能力
推 : 只要題意稍微變化一下,就答不出來了啦38F 09/13 15:40
推 : 而且o1-preview能力還比完整版弱一點39F 09/13 15:41
推 : 都多久了怎麼還有人在否定AI啊40F 09/13 15:41
→ : 台灣人真的很喜歡考試,連AI模型都叫他們要考試41F 09/13 15:41
推 : 老師除了心靈指導跟體育老師之外都可以淘汰了嗎42F 09/13 15:42
推 : 幹英文也才考76好像沒有很屌…43F 09/13 15:42
推 : 厲害什麼殺手級應用呢?考試能帶進去嗎?能的話就44F 09/13 15:42
→ : 有獲利點
→ : 告訴我一個每個人每天都要用且能賺錢的模式
→ : 有獲利點
→ : 告訴我一個每個人每天都要用且能賺錢的模式
推 : 題目再怎改就那些,重點當然是AI能理解問題47F 09/13 15:43
→ : 只改數字那些,沒意義
→ : 只改數字那些,沒意義
噓 : 英文不算作文的話是全對...49F 09/13 15:44
推 : 英文是最高的99分50F 09/13 15:44
→ : 考不上體育系51F 09/13 15:45
推 : 很多時候給你open book也考不好啦52F 09/13 15:45
→ : 賺錢點就是有AI的產品會淘汰沒有AI的產品,你不弄AI53F 09/13 15:45
→ : 就是會被別人弄死
→ : 就是會被別人弄死
→ : 這種對手就拔它網路線,還要我教?56F 09/13 15:47
推 : OpenAI:我們不要GPT了 蛋雕!57F 09/13 15:48
推 : 資料庫厲害58F 09/13 15:51
推 : 看不到圖片照樣給妳解題, 好強...59F 09/13 15:57
推 : 一整片回應都沒提到思維鏈嘛60F 09/13 15:57
推 : AI控股61F 09/13 15:58
→ : 草莓玩台股大概會變成債酸vv叫62F 09/13 15:59
推 : 理解有碩博能力,以後能分級距出售人力資源63F 09/13 16:00
推 : 這次o1似乎不是傳統的訓練完就拿來用64F 09/13 16:00
推 : 萬一它把自己傳輸到雲端上你拔網路線也沒用65F 09/13 16:00
推 : 我也有測試 o1-preview 寫程式有比較好一點66F 09/13 16:02
→ : LeetCode 的執行速度跟資源都進步很多
→ : LeetCode 的執行速度跟資源都進步很多
推 : Ai是理解再作答,不是搜尋網路貼答案好嗎…68F 09/13 16:04
→ : openAI橫空出世也才多久,AI每天24小時優化訓練,你69F 09/13 16:06
→ : 人類24小時不睡去燒腦看看能撐幾天.
→ : 人類24小時不睡去燒腦看看能撐幾天.
推 : AI絕對是工業革命等級的,但即使是這樣股票也不可71F 09/13 16:07
→ : 能一直上漲
→ : 能一直上漲
→ : 指考跑分法73F 09/13 16:08
推 : 就算看到圖我也不會啊74F 09/13 16:08
推 : 訓練Ai打黑悟空也蠻有趣的75F 09/13 16:10
推 : 首先使用者要先提升到某個層次 能想像到用途76F 09/13 16:12
→ : 苦工 重複工作 讓AI去做
→ : 苦工 重複工作 讓AI去做
噓 : 你各位連ai都烤不贏78F 09/13 16:13
→ : 為何會推 普發人民基本生活津貼 因為以後妳程度不79F 09/13 16:14
→ : 到 AI放著給你用 也跟考openbook一樣
→ : 到 AI放著給你用 也跟考openbook一樣
推 : 現在人類可能是史上最聰明的一代了81F 09/13 16:21
推 : 樓上,未來的每一代人類都是史上最聰明的人類了.82F 09/13 16:22
推 : 用chatgpt4 考指考,至少可上中字輩大學83F 09/13 16:26
推 : 比我還厲害84F 09/13 16:26
→ : 有解題過程就可以接受85F 09/13 16:44
推 : 所以原本考幾分?10分進步23分也是進步啊86F 09/13 16:45
推 : 這英文分數應該輾壓PTT鄉民87F 09/13 16:49
推 : 樓上上,52分進步到75分,超過頂標了88F 09/13 17:13
推 : 那天要統治人類89F 09/13 17:17
推 : 一天對話50次要怎麼用90F 09/13 17:22
推 : 看來AI有機會擺脫一本正經的胡說八道了91F 09/13 17:47
推 : 雖然目前昂貴,但能突破瓶頸!92F 09/13 18:03
→ : 現在麻煩的是有人靠著這個作弊 也就是說憑實力考低93F 09/13 18:03
→ : 於76分的人跟考零分是沒什麼兩樣
→ : 再進一步就是A I的成本比你存在的成本低很多也就是
→ : 說你如果沒有比AI好很多的話也沒有什麼存在的必要
→ : 以後這些人就只能靠A I養物價會不斷地提高補助也會
→ : 不斷地提高高到蓋過這些低端人口所能觸及的範圍食物
→ : 就由這些連鎖便利商店提供
→ : 於76分的人跟考零分是沒什麼兩樣
→ : 再進一步就是A I的成本比你存在的成本低很多也就是
→ : 說你如果沒有比AI好很多的話也沒有什麼存在的必要
→ : 以後這些人就只能靠A I養物價會不斷地提高補助也會
→ : 不斷地提高高到蓋過這些低端人口所能觸及的範圍食物
→ : 就由這些連鎖便利商店提供
推 : 題目改個數字的話結果會被是幾分呢?拿數理能力來100F 09/13 18:13
→ : 吹是不是不知道這模型的運作模式啊?
→ : 吹是不是不知道這模型的運作模式啊?
→ : 先把考卷改成英文再來測 有的題目學生都不知道在供102F 09/13 18:35
→ : 三小ai最好看得懂
→ : 三小ai最好看得懂
推 : cfcf104F 09/13 18:51
→ : 你真的不用管他是否真的有實力答對 你只要知道有些105F 09/13 18:52
→ : 人會透過這些漏洞吃掉你努力的成果就像物價通膨一樣
→ : 那些人可能連題目都看不懂可能根本也不是人說不定是
→ : 狗貓反正他就是能夠通過考試
→ : 人會透過這些漏洞吃掉你努力的成果就像物價通膨一樣
→ : 那些人可能連題目都看不懂可能根本也不是人說不定是
→ : 狗貓反正他就是能夠通過考試
噓 : chatGPT都已經推出將近兩年了 股板還是一堆白癡以為109F 09/13 18:56
→ : 他是抄答案或是直接找資料庫 這東西真的有那麼難理
→ : 解嗎...
→ : 他是抄答案或是直接找資料庫 這東西真的有那麼難理
→ : 解嗎...
→ : 看大家是喜歡天網還是母體112F 09/13 20:03
→ : 毫無意義113F 09/13 20:05
→ : 等你哪一天再踏入低端連鎖店把裡面的食物塞進嘴裡的114F 09/13 20:56
→ : 時候你就會知道我在說什麼
→ : 時候你就會知道我在說什麼
→ : 會炒股賺錢的才是真AI116F 09/13 21:29
→ : ……認輸 買nv117F 09/13 22:12
推 : 之前的Gpt才是背答案跟搜尋 昨天新出的OpenAI-o1118F 09/14 03:50
→ : 是自己思考後回答,所以回答超級慢,但準度爆高
→ : 是自己思考後回答,所以回答超級慢,但準度爆高
--
※ 看板: Stock 文章推薦值: 0 目前人氣: 0 累積人氣: 73
作者 Tox 的最新發文:
- 16F 8推
- 標題: OpenAI模型o1-preview考2021年指考數學甲 來源: Facebook fb看到一個工程師做的實驗 網址: FB: 軟體工程師 Roger 內文: 軟體工程師 Roger 我讓 …119F 55推 6噓
- ChatGPT 的新競爭對手 Groq 推出了語言處理單元 (LPU),並於近期首度公開成果。當提 示模型時,答案立即產生。 而且,答案是依據事實,並引述來源,長達數百字,這讓它 在社群媒體造成轟動 …94F 26推 2噓
- 53F 7推 1噓
- IDC 2023 Q3 PC 第一名: Lenovo聯想 第二名: HPQ 惠普 (非HPE: HPE是企業級產品 例:伺服器) 第三名: DELL Lenovo今年漲幅 68.26% HPQ今年漲 …61F 29推 2噓
點此顯示更多發文記錄
→
guest
回列表(←)
分享