作者 wa007123456 (大笨羊)
標題 [問卦] AI領域中的LLM會讓英語系國家更具優勢?
時間 Thu Jul 11 14:30:32 2024


大型語言模型(LLM)在處理語言的時候

都無法避免要執行分詞的動作

所謂分詞就是把句子中的 主詞 動詞 介係詞 ...等

分離開來。

由於中文的特性,要進行分詞其實是很有挑戰的一件事;

反觀英文可以透過空白來分離單字,實作上真的比較輕鬆。

沒有要崇洋媚外,單純討論@@

PS:

最近使用Python套件來做文字辨識

也發現中文不但辨識又慢又肥,而且辨識正確率也不是很好

請問中文在未來的世界中還具有甚麼優勢嗎?


--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 210.176.154.165 (澳大利亞)
※ 作者: wa007123456 2024-07-11 14:30:32
※ 文章代碼(AID): #1cZtmA_H (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1720679434.A.FD1.html
bill403777: 你的程式用中文寫 辨識中文效率才高1F 42.72.252.222 台灣 07/11 14:31
stlinman: 差在算法問題應該都能優化吧! 反正大力出奇蹟。2F 150.116.129.113 台灣 07/11 14:31
KILLE: 樓上 程式只是邏輯表示 只是代號4F 36.227.163.239 台灣 07/11 14:32
donation12: 優勢就在於高深度語言無法用LLM模擬5F 140.136.117.34 台灣 07/11 14:32
KILLE: 就像 y = a* x**2 寫成 丑 = 甲*子**26F 36.227.163.239 台灣 07/11 14:33
donation12: 多層次指涉、影射、隱喻、類比7F 140.136.117.34 台灣 07/11 14:33
KILLE: 差異度為零
不然用文言文編程也可
https://github.com/wenyan-lang/wenyan8F 36.227.163.239 台灣 07/11 14:33
GitHub - wenyan-lang/wenyan: 文言文編程語言 A programming language for the ancient Chinese.
[圖]
文言文編程語言 A programming language for the ancient Chinese. - wenyan-lang/wenyan ...

 
stlinman: 中英差異比較大是文法問題。英語系邏輯跟時間性比較強烈!11F 150.116.129.113 台灣 07/11 14:34
KILLE: 非母語人士才覺得英語邏輯強
時間性漢語也可做得到 只是要不要這樣用13F 36.227.163.239 台灣 07/11 14:35
bill403777: 原來是這樣 抱歉獻醜了我文組15F 42.72.252.222 台灣 07/11 14:35
donation12: 每句話都詳細說明時間地點人物主被動不要在語境中省略16F 140.136.117.34 台灣 07/11 14:36
KILLE: 英語哪來講地點主被動 漢語被動性才強好嗎18F 36.227.163.239 台灣 07/11 14:37
JuiFu617: 把中文翻成英文再翻成中文19F 1.160.25.5 台灣 07/11 14:37
stlinman: 但是就是這差距,英語素材的訓練AI相比20F 150.116.129.113 台灣 07/11 14:37
KILLE: 台灣人講話喜歡乎(念ㄏㄡ\) 這超強被動性文言文 丟到AI裡 學超快好嗎21F 36.227.163.239 台灣 07/11 14:38
stlinman: 中文就快很多。光是訓練AI學習效率就有差別了。23F 150.116.129.113 台灣 07/11 14:38
KILLE: 今若諸位皆行以文研 人工智能但得習驟
            言25F 36.227.163.239 台灣 07/11 14:39
donation12: The cat chased the mouse.
The mouse was chased by the cat.27F 140.136.117.34 台灣 07/11 14:40

--
作者 wa007123456 的最新發文:
點此顯示更多發文記錄