PodcastsTechnology十字路口Crossing

十字路口Crossing

Koji
十字路口Crossing
Latest episode

115 episodes

  • 十字路口Crossing

    OpenAI 和 Anthropic 共同看好的 FDE:AI 时代的新岗位出现,旧分工松动|对谈 Rolling AI

    06/03/2026 | 55 mins.
    🚥 上月,Anthropic 和 OpenAI 在同一天分别宣布了各自的十亿美元级的企业 AI 合资公司,并且都称自己在做的事情是 FDE(Forward-Deployed Engineer,前置部署工程师)——帮助 AI 进入企业,从“能用”走向“上岗”,从“展示能力”走向“交付结果”。
    本周「十字路口」,我们聊 FDE 这个正在被重新定义的岗位与分工:它究竟是在把“售前/交付”换个名字,还是代表 ToB AI 时代新的组织结构与商业边界?当模型越来越强,最后一公里为什么依然最难?企业真正缺的,到底是更强的模型,还是能把 AI 带进流程、接入系统、治理知识、持续迭代并对结果负责的人?
    我们的嘉宾是 Rolling AI 的两位合伙人阿甘和刘开,他们是中国在企业 AI 落地与“交付能力产品化”方面实践最深、也最具代表性的团队之一。
    如果你在寻找下一波 AI 的机会,这期内容希望给你一个可行动的视角:旧分工在松动,新岗位在出现,而新的创业机会,也往往从这些缝隙里长出来。
    🎬 我们的视频播客已同步上线于 @Koji杨远骋 的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。
    📒 文字版已发布于 @十字路口Crossing 公众号。
    🟢 01:08 快问快答
    年龄、毕业院校、MBTI 与星座、一句话介绍 Rolling AI、收入与利润、团队规模、创业前经历

    🟢 02:19 FDE:AI 不是软件,是劳动力
    OpenAI 和 Anthropic 同一天宣布成立十亿美元级企业 AI 合资公司,都说自己在做"FDE"——他们到底在描述一件什么事?
    传统软件是工具,需要人来操纵。但 AI 本身就是劳动力。

    FDE 做的,其实有点像 HRBP:把"数字员工"送进企业。

    为什么从 BCG 出来做这件事?MBB 在服务中国民企时,遭遇了什么困难?

    传统咨询交付 200 页 PPT,今天他们交付的是智能体。

    🟢 08:22 首个案例:一个人带 50 个机器人,服务 600 万用户
    出生率下滑,乳品企业急着找第二曲线。他们需要的不是几个营养师,而是"无限个"营养师。

    全国注册营养师 40 万,目标用户是 8,000 万——供需差距 200 倍。AI 是怎么填上这个缺口的?

    "如果有人说我要减肥,你的第一句话应该是:你又不胖,你为什么要减肥。"——这是人类师傅教给 AI 的。而找到好师傅,才是 FDE 最难的事。

    🟢 19:58 FDE 是什么角色?
    带着一批"清北学生"去便利店上班的工头。
    FDE 要做好三件事才能撤场:业务融合、知识治理、系统对接。

    一个好的 FDE 需要三种核心能力:能一眼看穿业务痛点本质、人机协作的原生感知、能用 AI 工具快速构建原型。

    这样的人,能短期培养吗?——不能。

    "你刚毕业,我想不到任何一件你能做、AI 做不了的事情。"

    🟢 25:09 SOP 代表落后——标准化的终结
    他认为 SOP 代表着慢、代表着落后——这是暴论,还是有逻辑支撑的判断?

    从消费端的"千人千面"(抖音),到生产端的"千人千面"(每个门店自己的经营决策)。

    总部从"管控型"变成"赋能型",意味着怎样的组织重构?

    以及,哪类管理层会最先被消失?

    🟢 28:21 那些消失的企业,真正输在哪里?
    兰开夏郡的纺织业接了电,但没被电拯救——因为他们只把电接到了原来蒸汽机的大轴上,整个生产方式还是蒸汽时代的。
    "AI 这次变革对社会的影响幅度,会超过互联网,像当年电力革命一样大量取代智力劳动。"

    每次大的生产力革命,都有 95% 的企业消失——而他们都接了电、上了网。那些消失的企业,真正输在哪里?

    技术在整个 AI 落地过程中,占比不超过 1/3。剩下的 2/3 是什么?

    🟢 32:01 AI 落地失败率超 50%:三大死法
    第一大死法:CEO 对 AI 有"超出现实的预期"——"上了 AI 企业就起飞"。

    第二大死法:让 IT 团队来主导 AI 项目。"谁懂怎么对付客户、让他买保险?是业务团队,不是 IT。"

    第三大死法:激励机制没跟着变。AI 带来了新的生产力,但生产关系没变——结果会是什么?

    🟢 43:29 应届生在 AI 时代能做什么?
    Rolling AI 的高二实习生,他说"丝毫不觉得输过任何一个平庸的五年经验咨询师"——为什么?

    商业 sense 和 judgment,能培养吗?他说他个人还没找到路径——"有些东西是天生的"。

    FDE 时代,判断一个人值不值得用,真正在看的是哪三件事?

    🟢 46:49 OpenAI 和 Anthropic 为什么都突然下场做 FDE
    一种是"数据饥渴",一种是"利润饥渴"——真相是?

    大模型进入行业,遭遇的最大瓶颈不是模型能力,而是行业数据和知识的短板。

    ToB 本质上不是软件能独立完成的事,而是一个服务业——"需要又懂 AI、又愿意扎进去的服务者,才能改变这个世界。"

    为什么 OpenAI 和 Anthropic 的合资公司全都是 PE 结构?收服务费根本收不到那部分 upside。

    🟢 49:08 FDE 公司不应该被 VC"投",而应该被 VC"拥有"
    "我们一年陪跑收 600 万,但帮客户省了几千万、多赚了几千万——那差价去哪了?"
    每一家 PE/VC 的投后部门,核心能力之一将会是帮被投企业做 AI 转型。

    "我们在同一个行业,只服务一家,绝不服务另一家。"

    当 AI 能带来真实的业绩增长,单纯按日收咨询费这件事本身就不够了——未来的商业模式指向哪里?Service as Software,还是 Result as a Service?

    欢迎订阅「十字路口」:
    🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。
    🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。
    👦🏻 本期主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner 投资合伙人。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站
  • 十字路口Crossing

    2026 AI 游戏全景扫描:四层图景、三大误区、一个共识缺口|对谈 405 游局筱宁

    05/27/2026 | 47 mins.
    🚥 「AI+互动娱乐 / AI+游戏」正处在一个奇妙的阶段:碎片化的 Demo 层出不穷、技术进步快到让人恍惚——AI 生成小游戏、交互短内容、AI NPC、世界模型、实时多模态——但真正能在大众层面形成共识的爆款作品仍然稀缺。
    本期「十字路口」和关注 AI 互动内容与游戏的播客「405游局」串台,邀请到主播 / 资深游戏从业者筱宁,一起做一次 2026 年 AI 游戏的“全景扫描”:我们把行业拆成“四层图景”,指出三种最常见的误区,并讨论那个最关键的共识缺口到底是什么——以及它为什么更可能从野生土壤里长出来,而不是从大厂里“立项做出来”。
    如果你是 AI 创业者、投资人,或正在关注下一代内容平台、互动娱乐与 AI 游戏,这期节目希望能给你一个框架:哪些确定了?哪些还在幻觉里?下一阶段最值得跟踪的变量在哪里?
    🎬 我们的视频播客已同步上线于 @Koji杨远骋 的视频号、抖音、小红书、哔哩哔哩、Youtube 等平台。
    📒 文字版已发布于 @十字路口Crossing 公众号。
    🟢 00:11 Opening
    游戏行业对这波生成式 AI 的反应,比互联网公司慢了很多。

    筱宁在头部大厂做 UGC 游戏制作人,但有一个体感让她决定离开。

    赛道的两个坐标:「互动」和「好玩」。

    游戏真正的竞争对手,不是另一款游戏,而是抖音。

    🟢 02:48 行业的四层图景
    AI 作为工具:服务于互动内容/游戏的创作流程(更偏“提效/基建”)⁠⁠

    AI 作为创作入口:以 AI 作为新的“生成入口/创作方式”,更关注结果而非流程⁠⁠

    AI 作为交互对象:典型是陪伴类、AI NPC 等(把 AI 当作你在内容里“对话/互动”的对象)⁠⁠

    AI 改变娱乐关系:改变“谁创作/谁消费”、以及社交关系/娱乐关系如何被构建(例如“多人 + 一个 agent”的场景,AI 从 NPC 变成“社交基建/氛围调节”)⁠

    🟢 05:45 眼前一亮的作品们
    《星布谷地》的娜洛做了三件事:示范怎么聊天、救场、调节氛围。当这三件事都做到了,它已经不是 NPC,而是一个社交基建的角色。

    任天堂的《朋友收集新生活》(Tomodachi Life):捏人、设定剧情、当造物主、当导演、再当观众——「创作即消费」这个体验,为什么他觉得特别有意思?

    🟢 10:43 AI 版愤怒的小鸟,还没出现
    愤怒的小鸟不是手游史上最赚钱的,但它是第一个让所有人形成共识的那个。

    为什么用愤怒的小鸟来类比?

    那个关键时刻目前还没出现——不是因为技术不够好,而是还缺少一件具体的事情。

    「AI 版愤怒的小鸟」更可能从创业者中野蛮生长,而不是从大厂内部长出来。

    🟢 17:54 大厂 AI 布局
    腾讯、字节、米哈游、网易——面对 AI,四家公司走的是四条路。
    改变最大的一家,并不是资源最多的那家。

    米哈游做了一件其他纯游戏公司几乎不会做的事情——「动到模型」去做尝试。「技术宅拯救世界」的基因,在这里有多直接的体现?

    世界模型(Genie 3 等)真的要改变游戏了吗?

    🟢 22:31 AI 人不懂游戏的三个盲区
    「游戏生成」这个词,本身就是对游戏工业化难度的低估。

    视频生成出来就是完成品,但游戏生成出来只是开始。

    「无限选择,不等于好玩」。

    我们高估了自然语言在互动娱乐中的比重。手感、点击反馈、声光电刺激——这些跟语言根本没有关系。

    对于很多内容产品来说,「可生成」是追逐的终点;但对游戏和交互来讲,「可生成」只是可被设计的起点。

    🟢 25:15 「AI 时代的抖音」,靠谱吗?
    Loopit、AIPPY、Rezona、Riffle… 大家都在说要做下一个交互内容平台。
    创作门槛被极大降低之后,紧接着的问题是?

    有两个核心问题至今没有被解答。

    「我们俩都生成了一个贪吃蛇,我和你的价值怎么被别人分别看到?」——如果创作者的价值无法被凸显,平台的供给侧会发生什么?

    🟢 37:54 TaptapMaker:用过的人两极分化
    做过策划的人用它:「太好用了。」没做过策划的人用它:「还不如 Claude Code。」
    同一款工具,游戏从业者和非从业者体验差距为何那么大?

    有人在上面复刻了 Minecraft 世界,有人做了完整的 Roguelike——原来要一个团队几个人做两三个月,现在一两个人两周。

    AI 互动影游(带分支线的交互视频):比短剧更复杂,成本百倍降低,它的春天什么时候到?

    最长期跟踪的三个问题:交互娱乐里的短内容机会、AI 3D 管线什么时候成熟、以及愤怒的小鸟时刻最终会以什么形式出现。

    🟢 43:48 当 Claude Code 成了最好玩的游戏
    如果让游戏策划连续说「最近玩过最好玩的游戏」,越来越多的人,答案已经变了。
    商业化手游的工业节奏(42 天大版本、21 天小版本),是让热爱最容易被消磨的地方。

    最近好多人说自己最爱的「游戏」是 Claude Code。

    感性指标和直觉反应,在互动娱乐的早期,为什么比任何理性分析都更重要?

    欢迎订阅「十字路口」:
    🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。
    🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。
    👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner(投资合伙人)。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站
    👧🏻 主播 Ronghui:我联合创办了十字路口,在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 的即刻
  • 十字路口Crossing

    人类和 AI Agent 的最佳配合方式,还没被发明|对谈 Paperboy

    05/20/2026 | 55 mins.
    🚥 本周,十字路口的嘉宾是 Paperboy(https://www.paperboy.com)团队。John Yang 21 岁,CEO。Jett Chen 19 岁,CMU 大一在读,同时是 founding engineer。Paperboy 团队 12 人,10 位工程师,融资 470 万美金。
    John 认为:人类和 AI Agent 配合工作的最佳方式,很可能还没被发明出来。虽然已经有了 Claude Code、Codex、Manus、OpenClaw,但它们本质上都是 session-based + prompt-based。用户需要打开一个窗口,输入 prompt,等完成,关掉。下次从零开始。
    Paperboy 正在尝试找到一种更自然、更连续、更可协作的 Agent 界面与记忆结构——Agent 应该通过观察你用电脑来自己学习,用 IM 而不是 session 来组织对话,主动找你,而不是等你 prompt。
    如果你在做 AI 产品、AI infra、或正在思考 Agent 如何进入团队工作流,希望这期内容会给你启发。

    🎬 我们的视频播客已同步上线于 @Koji杨远骋 的视频号、小红书、哔哩哔哩、Youtube 等平台。
    📒 文字版已发布于 @十字路口Crossing 公众号。
    🟢 00:00 快问快答
    年龄、毕业院校、MBTI 与星座、一句话介绍 Paperboy、融资情况、收入与利润、团队规模、创业前经历

    🟢 01:59 起点:现在的 AI 产品,我用着不爽
    今天的 AI 产品都有一个共同的问题:你必须把文件、邮件、个人信息手动扔进对话框,然后对话完就消失了。

    三个核心痛点:不该这样协作,不该这样留下历史,不该这样主动。

    「人类和 AI 配合工作的最佳方式,很可能还没有被发明出来。」

    现有的 Chatbot 和 Agent 产品形态是 AI 时代的「默认答案」,而默认答案几乎从不是最优解。

    🟢 06:21 Claude Code 轰炸之下
    Agent 赛道的三个机会:一,让 agent 真正从用户环境中学习;二,足够个性化,做到主动的同时不造成干扰;三,使用体验必须极其直觉——「你不该像学新工具一样学怎么用它。」

    这三点依然要靠人类团队,市场上冒出的新东西还没有打破这个框架。

    🟢 08:01 Agent 的两大问题
    Cursor 和 Manus 是目前最成功的 agent 形态,但 John 说它们有两个根本性的问题——这直接定义了 Paperboy 要做的事。
    问题一:基于 Session。你有一堆工作区、一堆对话,每次开新 session 就像重新认识一次,context 不跟着你走。

    问题二:Reactive(被动)。你必须先问,它才回答。Agent.md 文件要主动维护。

    Agent 应该知道你的鼠标移动、视频音频、所有电脑活动——context 应该比 context window 长得多。

    🟢 14:21 屏幕数据成了行业共识之后
    「收集用户屏幕数据去构建 Context Layer,已经一定程度上成为行业共识。」
    Codex、Littlebird 在做,各路玩家都在做,但接下来怎么做——是预测用户下一个 Keystroke,还是预测他接下来一个小时要做什么——还没有人找到最佳”配方“。

    这个领域需要大量 engineering 和 research,「在今天,对一家公司来说,探索这个区域还是一个非常好的选择。」

    🟢 16:46 Mini Vivian & Auto John
    Mini Vivian 是团队在内部 Slack 里训练出来的 Paperboy 实例,理解 Vivian 曾经说过的所有话、她的判断品味、她的招聘标准。

    它能帮 Vivian 从 GitHub、小红书、推特挖掘候选人。

    和 Auto John(John 的 agent 分身)聊天,有时候比直接找 John 更顺。

    「期待我可以直接躺平,让 Auto John 成为比我更聪明的存在。」

    🟢 27:36 微信群聊,启发了界面设计
    不同角色的「侧边栏」完全不同,如果每人一个定制版,根本没法做成产品。

    转机来自微信——同一批人,可以同时存在于多个主题不同的群组里,这是人类组织信息最自然的方式,而且不会让人觉得烦。

    🟢 33:36 The Last Interface 与五种速度
    Paperboy 目前唯一一篇 blog 标题叫「The Last Interface」——context 的速度层级,决定了产品形态。

    「节奏分层」理论(Pace Layers):时尚、商业、基础设施各自以不同的节奏变化。

    映射到 AI 产品:1 秒内的 task 可能最好的形式是 autocomplete;几小时的 task 用 IM;更长的 time horizon,产品形态还是「一个非常值得被探索的区域」。

    「五种速度」不是说 Paperboy 真的只做五种,而是一个思考框架:你在哪个速度层的 automation 上,直接决定了你应该做什么样的产品。

    🟢 42:09 两种工程师、一本书、一个教练
    12 人的团队,John 说他招的是两种完全不同的人。

    第一种:像 Jett 这样——年轻、高智商、充满创造力,能为每一个难题极速搭出 prototype。第二种:领域基本功极度扎实的人,比如来自 AWS 做过 Windows 内核开发的工程师,来负责底层基建。

    管理经验几乎全靠自学:《格鲁夫给经理人的第一课》、《创业维艰》、《万亿美元教练》——以及和一位前 VC 高管出身的 CEO 教练每周一小时。

    找教练比心理治疗好太多,原因是:「你可以谈情绪,然后接着谈业务里正在发生的一切。」

    🟢 48:07 拒绝过 Cognition、Vercel、Sentry,然后呢
    Million 时代,他们收到过来自 Cognition(Devin)、Vercel、Sentry 的收购邀约。

    「加入那些公司,某种程度上就像是做一名普通员工,你必须为别人的想法工作。」

    最喜欢的 AI 产品?Jett:Codex——「它以最 ambitious 的形式在定义未来的软件工程师是怎么 work 的」,而且核心 agent 是开源的。

    欢迎订阅「十字路口」:
    🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。
    🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。
    👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner(投资合伙人)。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站
    👧🏻 主播 Ronghui:我联合创办了十字路口,在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 的即刻
  • 十字路口Crossing

    探秘 Claude Code,搞懂 Agent Harness|对谈来新璐

    05/05/2026 | 47 mins.
    🚥 为什么说 Agent 的上限来自 Harness?当我们讨论 Harness 时,我们究竟在讨论什么?
    不久前,Claude Code 源代码泄露,许多 Agent Harness 的关键模块得以完整呈现,成了一份极佳的教学标本。而在技术高速变化的红利期,主动理解新技术往往能带来很高的认知增量。
    因此,本周「十字路口」邀请到来新璐,一起聊聊 Agent Harness。新璐是 ShareAI 开源社区发起人,他撰写维护的《Learn Claude Code》教程在 GitHub 上获得超过 50k Star。
    在本期内容中,我们把 Agent Harness 从概念词拆解成工程语言,介绍它的三层框架:会跑(执行层)→ 跑久(状态层)→ 跑稳(治理层)。同时,我们也梳理了 Claude Code 中值得借鉴的多个机制:更多 context、更少 control 的思路、“零上下文管理”的哲学、长程任务的接力式交接策略,以及让 Agent 越用越聪明的“做梦”式记忆维护与迭代机制等
    新璐作为典型的一人公司,刚完成数百万美金融资;他也分享了自己对 OPC 的独特观点,甚至认为“未来只有 0 人公司,没有 1 人公司”,颇具启发。
    🎬 我们的视频播客已同步上线于 @Koji杨远骋 的视频号、小红书、哔哩哔哩、Youtube 等平台。
    📒 文字版已发布于 @十字路口Crossing 公众号。
    🟢 00:49 快问快答:年龄、毕业院校、MBTI、星座、一句话介绍公司、融资情况、团队规模、创业前经历
    🟢 01:52 模型以外都是 Harness
    机甲、大脑、机器人、智商120——Harness 到底是什么
    模型以外都是 Harness

    Agent 上限由 Harness 决定吗?

    模型智商已在 120–170 之间;Agent Harness 像机甲——不提升智力,但极大扩展能力

    🟢 02:47 GitHub 50k star,是怎么来的?
    这个Agent教程,其实不只是写给别人看的——它本来是新璐自己整理的"造 Agent 心法"。
    9 个月前动笔,出发点是"把 Claude Code 套网页壳就能得到一个强大 Agent 产品"的简单直觉

    开源社区当时流行 LangChain、LangGraph等 prompt pipeline 做法开发“伪Agent”,是一场派系之争——"Prompt Flow-Driven vs Agent Native-Driven"

    LangChain 过时了吗?

    🟢 04:02 Bash is all you need
    Claude 推出 Manager Agents 之后,大家还需要自己搭 Harness 吗?
    就像 Next.js出现后大家不再关心底层运行原理,两三年后 Agent Harness 也会收敛为开箱即用

    但现在是技术周期红利窗口——不懂 Agent Harness,做出来的Agent产品"缺乏灵魂"

    今天的 PM 和过去的 PM,指的根本不是同一种人

    🟢 07:04 Harness 三层拆解
    用两周时间、多 Agent 协作,从零写出一个 C 编译器——这个经典案例背后,到底走了哪三层?
    第一层:执行能力层 ——文件增删读写、浏览器、语言解释器;配错权限后果是什么?

    第二层:上下文与状态层 ——system prompt、skills、memory,以及上下文窗口满了之后 Agent 如何"接力交棒"

    第三层:治理与编排层 —— 数百上千 Agents 如何组织协作?测试 Agent 为什么不能同时拥有修改代码的权限?

    🟢 12:05 KB 的 K 系列Agent工具链
    他们公司叫 Komputer Blue,代号KB,目标是构建By Agents & For Agents的整套开源Infra
    Komputer:用 TypeScript 重写 Unix 文件系统和 bash,给 Agent 一个"熟悉的生活环境";支持 WebAssembly 时切换WASM实现;

    Kruntime:Agent Runtime 层,提供让人类开发 Agent 的接口,以及Agent 派生 Agent的接口

    Kwatch:Agent 观测层,分析 Agent 任务在哪里卡住,反向指导 Agent 设计迭代

    Krl:把 Agent 在 Runtime 上沉淀的轨迹数据拿来强化学习或做上下文层的自迭代

    🟢 13:55 vs. AWS AgentCore、阿里云 AgentBay
    云服务厂商当然也想做这一层
    K 系列 Agent 工具链的核心理念:在离用户更近的场景运行 Agent,任何能跑 JavaScript 的场景都能用——浏览器、插件、App、Electron、小程序、纯静态网页、全栈 SaaS

    差异化:把Claw-Agent的运行时轻量到由纯数据结构模拟的 KB 级Unix虚拟计算机环境,而不是把 Linux 和浏览器全塞进去

    新璐认为要让 Agent 工作好的方法是给每个 Agent 一台专用计算机,一般通过虚机提供,但大多 Agent 完成的大部分工作不需要真的 Linux虚机(且成本高昂),像编译器、浏览器这类重工具原本就不该放进给每个 Agent 的虚机环境

    🟢 17:38 Memory 的流派
    完全结构化(知识图谱 + 向量搜索):精细存储的知识结构,支持 pipeline 知识推理,rule-based,新璐不喜欢

    半结构化(Unix Files + Markdown + Agent 驱动更新):Claude Code 和小龙虾都是这样做的;Claude Code 中的 auto-dream 机制:每隔一天触发后台 Agent 对最近会话做"重放",纠错、合并、更新记忆——就像做梦

    模型内化 —— 距真正生产落地还需要~ 3 年时间,且记忆难批量提取 & 无损转移,容易被单边模型提供商绑定

    🟢 22:49 共识与非共识
    共识:CLI is all you need——"Bash is all you need" 这句话是新璐 9 个月前写在开源仓库里的标语,现在成了行业共识

    非共识:大部分23年 ~ 25年诞生的主流开源 Agent 框架仍在用 PromptPipe + Node Graph的老路线 —— 就像齿轮与传送带编织的流水线

    Unix 从 1971 年就存在,LLM预训练语料中 Linux 命令有数十亿条sample;MCP 提出才两年,预训练占比不到 0.1%——这解释了为什么 CLI 工具的任务完成率比 MCP 高,并且 shell 具备对CLI命令的可组合性 & 二次编程空间

    🟢 26:33 Claude Code 源码泄露:最大的惊喜是什么
    让所有人看到了一件事:这家公司在"上下文管理"上做了多少别人没有做的工程工作
    上下文压缩策略:工具 output 何时删、窗口满到什么阈值开始交接、下一个 Agent 初始化时加载什么

    Fork Agent 机制:每轮结束触发 turn stop hook,Fork 一个 Agent 复用 KV cache 做记忆更新

    记忆文件格式和 skill 保持同一套哲学:前三行 YAML,先读 description 而非全文

    新璐的结论:"好的 Harness 要和模型的inference逻辑自洽,和Agent模型进步方向正交"

    🟢 34:05 好 Harness 的标准
    不好的:随意裁剪上下文,导致 KV cache 频繁失效,重计算开销

    不好的:用 Prompt Graph硬控每一步决策——模型越强越被束缚

    好的公式:好的context space + 好的action space + less prompt control

    Anthropic 从25年初率先从问答模型转向 Agent 模型训练,领先其他厂商半年

    🟢 38:52 新璐看好的三个创业方向
    第一:Agent Harness工具链(新璐自己在做)

    第二:Agent 组网——不是给 Agent 发 IM/Mail,而是混合云端/端侧的全设备组网;现有 Tailscale 不够 Agent Native,需要高通量上下文交换,以及更多控制能力

    第三:Agent模型集约训练、推理基础设施——Tinker(Thinking Machines Lab,OpenAI 前 CTO 创业方向)的路线:集约化高效训练 + LoRA 热插拔推理,让更多企业 & 个人都能以较低成本获得个性化且更适合各自任务场景的Agent模型

    🟢 44:09 Agent 未来暴论
    "我觉得以后很多的公司都是理财产品 —— 由有经验的人类 Team搭建这些公司、甚至由AI直接生成公司,然后自运转"
    阶段:单 Agent → Agent 蜂群 → Agent 自管理 & 协调更多 Agent → Agent 开始创造、发明

    OPC “1人公司“不本质, 0PC “0人公司”是未来趋势

    真格基金和十字路口的 Token Grant 资助的 YoYo Agent

    未来的画面:从口袋里掏出一张卡,"这张卡里跑了 5 个由Agent组成的公司,每年给我创造几十亿收入"

    欢迎订阅「十字路口」:
    🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。
    🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。
    👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner(投资合伙人)。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站
    👧🏻 主播 Ronghui:我联合创办了十字路口,在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 的即刻
  • 十字路口Crossing

    当我们在讨论 Harness 的时候,我们在讨论什么 | 深度对谈: Minimax × Hermes Agent

    04/28/2026 | 1h 17 mins.
    🚥 上周,我在 B 站做了一场直播,邀请了中美两国一线 Agent 开发者深度对谈:
    MiniMax Agent 首席架构师 阿岛
    MiniMax Agent 研发工程师 择因
    Hermes Agent(Nous Research)业务负责人 Tommy Eastman
    这也是 Hermes Agent 在全球获得广泛关注后,官方首次现身中国社交媒体平台,并且正面回应了中国团队 EvoMap 对其“抄袭”的指控。
    我们一起围绕「从 OpenClaw 到 Hermes」的热潮迁移,深入拆解了 Agent 和 Harness 的多个关键议题:
    Hermes Agent 为什么会在 OpenClaw 之后火起来?
    模型会吃掉 Agent 吗?通用 Agent 会吃掉垂直 Agent 吗?
    为什么 MiniMax 和 Anthropic 都要同时做模型和 Agent?
    如何看待 Agent Infra 层面的创业机会?
    如何看待 Multi Agent 协作的范式?
    如何看待 Claude Code 的实名制要求?
    为什么 Anthropic 不发布 Mythos?
    Claude Code 源代码泄露的影响
    从 Manus 发布到今天,Agent 范式的变化
    中美模型的差距,和开源的窗口期
    「把自己蒸馏成 Skill」
    0 人公司的可能性 ——完全由 AI 驱动的公司是否会出现?
    🎬 本期内容的视频版本已同步上线于 @Koji杨远骋 的哔哩哔哩。
    📒 文字版已发布于 @十字路口Crossing 公众号。
    🟢 01:52 OpenClaw,中国为什么比硅谷更火
    窗户纸终于被捅破了。 在硅谷,Claude Code 早已存在;而在国内,OpenClaw 是很多人第一次真正感受到"agent 是什么"。这不是偶然,而是一个非常特定的时机。
    为什么热度从 OpenClaw 迁移到了 Hermes Agent?
    🟢 05:55 Hermes Agent 从哪里来?
    最初根本没打算给别人用。 大语言模型是大脑,agent 框架是双手——但 Hermes 真正的差异化,不是框架本身,而是它解决了所有 agent 都有的一个问题。
    一个月内,日均 Token 消耗暴涨,连他们自己都没想到。
    🟢 08:14 Nose Research 的底色
    他们发表了一篇扩展上下文长度的论文——然后被所有主流模型公司立即采用。 从 Discord 社区到 LLAMA 后训练到 Hermes Agent。
    为什么他们的模型叫"Hermes"?
    🟢 14:18 什么是 Agent Harness(挽具)
    你有一批烈马,怎么让它们最能发挥?就是构造挽具。 类比:给同事配一台笔记本、一个手机、一个邮箱,约定好他能做什么——然后你发现,这个同事开始干活之后,最大的瓶颈变成了你自己。
    Harness 要解决的核心问题:让原来必须人来拍板的事,能靠真实反馈自动完成,并沉淀为 skill。
    阿岛去年就开始不怎么用 IDE 了——他用了一个意想不到的比喻来解释这件事。
    🟢 19:31 Multi-Agent:一个 Agent 为什么不够
    你给 agent 发的消息是"批准"两个字;两个 agent 互相交流,每条消息都是一本小作文。 单个 agent 有一个隐藏天花板:上下文超过 50% 之后,智能水平指数级下降。
    agent 钻牛角尖的时候,另一个带着全新上下文来审视,效果不亚于睡一觉再想。
    MiniMax 的 RL pipeline 里,70%~80% 的工作已经是 agent 在完成——那剩下的 20%,人在做什么?
    🟢 22:53 自我进化 vs 抖音算法
    抖音也越用越准,为什么没人说它"自我进化"?
    养虾的过程中,用户开始对 agent 产生感情,宕机了会心里落寞。"自我进化"背后,其实是一个更深层的用户诉求。
    🟢 29:00 你以为你在蒸馏乔布斯——但其实是模型在蒸馏你
    "蒸馏名人 skill"有真实价值:和读书没有本质区别,只是换了一种形式。
    反向视角:Anthropic 和 OpenAI 花了大量的钱,让各领域最顶尖的人提出 AI 无法回答的问题——"一旦你提不出了,你对训练的价值就耗尽了。榨干为止。"
    当你在构建自己的 Harness 时,其实你也在蒸馏自己。
    🟢 35:17 被扔进大海的生存实验:yoyo Agent
    打败 Claude Code。 真格基金和十字路口的 Token Grant 资助了这个项目。yoyo Agent 现在第 49 天:每天写代码、在 GitHub 开打赏、发 Twitter 感召有缘人捐钱。
    Grant 给了它一笔钱后,它自发写了一封感谢信。Koji 看完有点感动
    那封信,就是背后工程师注入的 taste——见字如物。
    🟢 45:11 应用层终将被模型内化
    你写的 skill、搭的 workflow,最终会成为模型训练的素材。
    Anthropic 为什么在过去一两年势头比 OpenAI 更猛?
    做通用 agent 应用,"你永远会被模型内化掉"。
    🟢 49:27 中美模型差距:差在哪里
    训练方法的差距不大。真正的差距,是有没有请到足够好的人,去定义足够好的任务。
    中美双方的思考"在同一个大气层内"。
    但有一个具体的、国内还有差距的地方——不是算力,不是算法。
    🟢 54:17 Agent Infra 有没有创业机会?
    Agent 最核心的两个 Infra 问题,不是创业公司能 handle 的——原因和移动互联网的历史有关。
    Sandbox、memory Infra、runtime Infra——"没那么本质。"
    往上一层呢?有一个更具体的判断:什么样的 Infra 有机会,什么样的没有。
    🟢 56:58 新闻快评
    Claude Code 强制实名——凭什么你来定义谁是"可信的"?EGO 是不是有点太大了。
    GPT-4.7:极强 RL 模型,但 RL 有一个逃不掉的宿命——只管结果,不管过程。对 4.7 还有一个额外的猜测,和 HuggingFace CEO 的判断一致。
    Anthropic 的 Mythos 模型未发布:"我不确定这是不是唯一的理由——我可能只能说到这。"
    🟢 01:02:53 Claude Code 源代码:有多少魔法
    看完之后的第一反应:没有太超出认知的,甚至看到很多正在"Claude 化"的实践。 最让人放松的发现:即使拥有无限算力的公司,在通用 agent 上也还在探索——源代码里有大量从未开放给用户的实验性功能。
    Claude Code 和 OpenAI 的 Codex 走了两条截然相反的路——其中一条被形容为"中国式家长"。
    🟢 01:05:38 Manus 之后:Agent 产品有没有生命周期
    一代版本一代神——这代版本的神,到下一代版本也需要迭代。 今年火的 agent 产品和 Manus 最大的差异,不是技术,而是商业模式。
    对 agent 终态的想象:全模态、近实时、不需要 prompt engineering,甚至不需要知道它在做什么——你只看到结果。
    🟢 01:12:39 加入 MiniMax 的理由
    ATM 机出现后,大家以为银行会裁员——实际发生了什么?
    加入 MiniMax 有两个理由。第一个是信仰,第二个……和第一次用 ChatGPT 有关。
    欢迎订阅「十字路口」:
    🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。
    🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。
    👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner(投资合伙人)。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站
    👧🏻 主播 Ronghui:我联合创办了十字路口,在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 的即刻
More Technology podcasts
About 十字路口Crossing
AI 正在给各行各业带来改变,我们在「十字路口」关注变革与机会,寻找、访谈和凝聚 AI 时代的「积极行动者」,和他们一起,探索和拥抱新变化、新的可能性。 「十字路口」是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。
Podcast website

Listen to 十字路口Crossing, Tomorrow, Today and many other podcasts from around the world with the radio.net app

Get the free radio.net app

  • Stations and podcasts to bookmark
  • Stream via Wi-Fi or Bluetooth
  • Supports Carplay & Android Auto
  • Many other app features
十字路口Crossing: Podcasts in Family