👉 矽谷輕鬆談專屬優惠連結:https://nordvpn.com/jktech
訂閱即額外多送 4 個月|30 天退款保證
#NordVPN
🔒 本集節目由 NordVPN 贊助
AI 工具讓詐騙集團幾十秒內就能生出一個幾可亂真的釣魚網站,以前靠排版、錯字來識破假網站的方法已經失效了。攻擊在自動化,我們的防護也要跟上。
NordVPN 內建「威脅防護」,在網路底層主動幫你攔截釣魚網站、惡意連結和網頁追蹤器,就連在咖啡廳用公用 Wi-Fi 也能全程加密保護,不用靠感覺,交給系統幫你顧。
每個月大概一杯咖啡的錢,就能讓你的網路安全從被動靠感覺,變成主動全自動防禦。有興趣的朋友透過下方矽谷輕鬆談的專屬連結試試看,訂閱額外多送 4 個月,30 天不滿意直接退,完全沒有損失。
如果你喜歡我的內容,歡迎加入會員支持我,讓我更有動力繼續分享更多好內容!
👉 https://www.youtube.com/channel/UCJIPFjZSCWR15_jxBaK2fQQ/join
過去幾年,我們看到 AI 模型的能力一路快速進步,從一開始大家在研究怎麼把 Prompt 寫好,到後來開始加入工具、記憶、工作流、狀態管理,也就是這幾個月很紅的 Harness Engineering 駕馭工程,讓模型不只是回答問題,而是可以更像一個真正能做事的 AI Agent。
所以很自然地,我們會開始想一個問題:如果模型繼續變強,再加上駕馭工程,把 LLM 原本不穩定、沒有狀態、容易幻覺的地方慢慢補起來,那這條路會不會就是通往 AGI 的答案?🤔
這一集我想從這個問題出發,聊聊我最近一直在思考的另一個角度:世界模型。
因為如果大語言模型本質上還是在理解文字、預測下一個 token,那它到底是真的理解這個世界,還是只是從大量資料裡學到「看起來應該怎麼回答」?
世界模型想補上的,正是這個部分。它不是單純讓 AI 生成下一段文字、下一張圖片或下一段影片,而是希望模型能夠理解現實世界背後的運作方式。比如一個杯子被推到桌邊會掉下去,一台車突然切進來你需要煞車,一顆球飛過來你會直覺知道它大概會落在哪裡。
這些對人類來說很自然的物理直覺,其實不只是「看過很多資料」而已,而是我們腦中有一套對世界運作方式的內部模型。世界模型的方向,就是希望 AI 也能建立類似的理解。🌎
這集我會用比較白話的方式,聊聊為什麼光靠 LLM 可能還不夠,駕馭工程到底補了哪些東西,以及為什麼世界模型可能會是 AGI 發展中很重要的一塊拼圖。
我也會提到 Yann LeCun 近年一直推的 JEPA 架構,還有為什麼他認為 Sora 這類生成影片模型,雖然看起來很像理解世界,但其實跟真正的世界模型還是不太一樣。
所以這一集不只是聊「下一個模型會不會更強」,而是想換一個角度來看:如果 AI 真的要變成一個能在現實世界裡行動、判斷、規劃的系統,它到底還缺什麼?
如果你最近也有一種感覺,覺得 AI 明明越來越強,可是用久了又會發現它離真正可靠的智慧還差一段距離,那這集應該會蠻值得聽的。🚀
(00:00) 開頭
(02:46) AI 詐騙時代的自動化防禦
(04:37) 為什麼我們頻道這麼少廣告?
(06:25) Meta 開發者體驗有多坑?
(10:32) 為什麼光靠 LLM 不能達到 AGI?
(12:22) Scaling Law 與 LLM 的天生限制
(13:25) 為什麼需要 Harness Engineering 駕馭工程?
(14:43) 另一條路:世界模型
(15:36) 世界模型到底想解決什麼?
(17:01) Sora 這類影片模型算世界模型嗎?
(18:51) JEPA:預測抽象狀態,而不是像素
(20:04) LeWorldModel 的新突破
(22:01) LLM + 駕馭工程短期仍是主流
(22:50) 未來可能是 Hybrid AI 架構