作者 tsubasawolfy (悠久の翼)
標題 Re: [閒聊] AI翻譯484比機翻順?
時間 Sat Jul 29 19:57:05 2023


: 大意就是顧及語言和文化的差異無法直譯
: 它就直接用另一個語言寫新故事
: 總之AI是會以可讀性為優先 自己再創作或加油添醋的
: 跟機翻那種逐字逐句對照可以方便校閱或學習單字是完全兩種概念

這比較像ChatGPT的翻譯跟上一世代的機器翻譯的世代差異

chatgpt使用的是兩種語言之間的機率相似度去重組,換言之你可以把它看作

它知道兩種語言的...本質? 然後透過本質去轉換後輸出。

直接用這個影片內的圖解釋

https://youtu.be/hph9OeKjg3w?si=rIi1yUkjZfgM_W4j

這部影片是在講能不能用ChatGPT能不能讓我們跟鯨魚對話

裡面有提到上一世代的機器翻譯(已經用了機器學習的翻譯機)

https://i.imgur.com/LNph0hM.png
[圖]

兩種語言的翻譯需要一個編碼器跟解碼器

左邊的編碼器先把This dog is black轉換成對應向量(數值)
https://i.imgur.com/pJVUfyX.png
[圖]

然後再把這些數值經過法語的解碼器轉換成相對應的法語 (逐字逐句翻)

https://i.imgur.com/M2wNu3Y.png
https://i.imgur.com/aJNMJ0c.png
[圖]
 
[圖]

但是這種方法需要你已經了解另一個語言後,才能做出相對應的解碼器

就像羅塞塔石碑那樣,別人已經幫你刻好相對應的語言轉換在上面

如果要拿來翻譯鯨語是不可能的,所以它們才想用ChatGPT的方式


chatgpt一樣是各語言都拆解編碼轉換成數值,依照出現頻率跟相對應機率做出文字雲

https://i.imgur.com/Fs5WjjN.png
https://i.imgur.com/2JgWkBj.png
[圖]
 
[圖]

然後把這些文字雲疊在一起,找出兩種語言高度重疊區域,再進行A語言轉換成B語言

當然轉換輸出的語言也要根據該語言的遊戲規則(對GPT來說是排列組合不同)去輸出

https://i.imgur.com/pByVDWZ.png
https://i.imgur.com/o38Zib7.png
[圖]
 
[圖]

我覺得這種找出語言之間高度相似處轉換,就有點像找出那句話的本質??

例如 桌上有一顆蘋果 代表你說的就是桌子上有一顆蘋果在那邊的這個情境or事實

然後把這個事實用不同語言描述一次,而不是傳統的點對點的逐句機器翻譯

但是這種方式就是需要大量的語言文字去搞出那個 文字銀河系 (不是雲等級)


回到那個影片

所以想要用這種方式去翻譯抹香鯨鯨語是有可能,多虧冷戰已經收集了很多年的海底聲音

但是但是這是各種鯨魚的資料,還要先過濾出各種鯨魚的叫聲才有可能建立


抹香鯨自己的鯨語銀河系去翻譯成人類語言


--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.47.86.152 (臺灣)
※ 作者: tsubasawolfy 2023-07-29 19:57:05
※ 文章代碼(AID): #1anFwJHj (C_Chat)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1690631827.A.46D.html
※ 同主題文章:
Re: [閒聊] AI翻譯484比機翻順?
07-29 19:57 tsubasawolfy
LawLawDer: 好屌…1F 07/29 20:03
Wardyal: 你鯨魚語言的Dataset沒正確的Label怎麼訓練
所以靠出現機率就能得出意思嗎2F 07/29 20:05
reader2714: 好像也有要把dna編碼當作語言去翻譯的研究4F 07/29 20:06
labbat: 無label就unsupervised唄5F 07/29 20:13
smart0eddie: 人跟鯨魚的認知會一樣嗎6F 07/29 20:18
cloki: 就不管認知一不一樣直接用實際存在的頻率數據去練吧
先把那些東西分群然後再進一步訓練去提高準確率7F 07/29 20:36
longlongint: 可以做出能跟鯨魚對話的AI 但人還是不懂
只好把小孩送進去一起從小學鯨魚雨9F 07/29 21:17
smart0eddie: 認知不一樣你兩群就不一樣啊11F 07/29 21:28

--
作者 tsubasawolfy 的最新發文:
點此顯示更多發文記錄