作者 tsubasawolfy (悠久の翼)標題 Re: [閒聊] AI翻譯484比機翻順?時間 Sat Jul 29 19:57:05 2023
: 大意就是顧及語言和文化的差異無法直譯
: 它就直接用另一個語言寫新故事
: 總之AI是會以可讀性為優先 自己再創作或加油添醋的
: 跟機翻那種逐字逐句對照可以方便校閱或學習單字是完全兩種概念
這比較像ChatGPT的翻譯跟上一世代的機器翻譯的世代差異
chatgpt使用的是兩種語言之間的機率相似度去重組,換言之你可以把它看作
它知道兩種語言的...本質? 然後透過本質去轉換後輸出。
直接用這個影片內的圖解釋
https://youtu.be/hph9OeKjg3w?si=rIi1yUkjZfgM_W4j
這部影片是在講能不能用ChatGPT能不能讓我們跟鯨魚對話
裡面有提到上一世代的機器翻譯(已經用了機器學習的翻譯機)
https://i.imgur.com/LNph0hM.png
兩種語言的翻譯需要一個編碼器跟解碼器
左邊的編碼器先把This dog is black轉換成對應向量(數值)
https://i.imgur.com/pJVUfyX.png
然後再把這些數值經過法語的解碼器轉換成相對應的法語 (逐字逐句翻)
https://i.imgur.com/M2wNu3Y.png
https://i.imgur.com/aJNMJ0c.png
但是這種方法需要你已經了解另一個語言後,才能做出相對應的解碼器
就像羅塞塔石碑那樣,別人已經幫你刻好相對應的語言轉換在上面
如果要拿來翻譯鯨語是不可能的,所以它們才想用ChatGPT的方式
chatgpt一樣是各語言都拆解編碼轉換成數值,依照出現頻率跟相對應機率做出文字雲
https://i.imgur.com/Fs5WjjN.png
https://i.imgur.com/2JgWkBj.png
然後把這些文字雲疊在一起,找出兩種語言高度重疊區域,再進行A語言轉換成B語言
當然轉換輸出的語言也要根據該語言的遊戲規則(對GPT來說是排列組合不同)去輸出
https://i.imgur.com/pByVDWZ.png
https://i.imgur.com/o38Zib7.png
我覺得這種找出語言之間高度相似處轉換,就有點像找出那句話的本質??
例如 桌上有一顆蘋果 代表你說的就是桌子上有一顆蘋果在那邊的這個情境or事實
然後把這個事實用不同語言描述一次,而不是傳統的點對點的逐句機器翻譯
但是這種方式就是需要大量的語言文字去搞出那個 文字銀河系 (不是雲等級)
回到那個影片
所以想要用這種方式去翻譯抹香鯨鯨語是有可能,多虧冷戰已經收集了很多年的海底聲音
但是但是這是各種鯨魚的資料,還要先過濾出各種鯨魚的叫聲才有可能建立
抹香鯨自己的鯨語銀河系去翻譯成人類語言
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.47.86.152 (臺灣)
※ 作者: tsubasawolfy 2023-07-29 19:57:05
※ 文章代碼(AID): #1anFwJHj (C_Chat)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1690631827.A.46D.html
※ 同主題文章:
Re: [閒聊] AI翻譯484比機翻順?
07-29 19:57 tsubasawolfy
→ Wardyal: 你鯨魚語言的Dataset沒正確的Label怎麼訓練
所以靠出現機率就能得出意思嗎2F 07/29 20:05
→ labbat: 無label就unsupervised唄5F 07/29 20:13
推 cloki: 就不管認知一不一樣直接用實際存在的頻率數據去練吧
先把那些東西分群然後再進一步訓練去提高準確率7F 07/29 20:36
→ longlongint: 可以做出能跟鯨魚對話的AI 但人還是不懂
只好把小孩送進去一起從小學鯨魚雨9F 07/29 21:17
--