PodcastsBusiness晚点聊 LateTalk

晚点聊 LateTalk

晚点 LatePost
晚点聊 LateTalk
Latest episode

150 episodes

  • 晚点聊 LateTalk

    149: 具身模型哪家强?与范浩强、高阳聊具身模型的测评、RoboChallenge,26 年具身展望

    1/25/2026 | 1h 21 mins.
    「用大规模测评驱散 PR 式 demo 的迷雾。」

    虚拟空间的大模型有大量 benchmark,测试非常直观;而在如火如荼的具身领域,怎么衡量模型能力,本身还是需要探索的课题。

    这期,我们邀请了两位具身智能从业者,原力灵机联创范浩强和千寻智能联创与首席科学家高阳,一起聊具身模型的测评。

    范浩强从高三就开始在旷视工作,有丰富的计算机视觉开发和落地经验;高阳回国前在伯克利 BAIR 攻读博士,和 PI 的联创 Sergey Levine 有诸多学术合作。

    去年 10 月,原力灵机和 Hugging Face 联合发起了全球首个具身智能的大规模真机评测平台 RoboChallenge。在前不久释放的最新测评结果中,千寻的 Spirit v1.5 模型登顶榜单,表现超过 π*0.5。

    RoboChallenge 测评平台网站:https://robochallenge.ai/home

    图注:RoboChallenge 测评现场

    在 RoboChallenge 的测评中,机器人不再只活在精挑细选的 Demo 视频里,而是要在多样化的“Table 30”任务中接受真实世界的“毒打”——任务包括碎纸、插花,扫二维码。

    这期我们聊了具身模型测评的难点,RoboChallenge、RoboArena 等目前的大规模测评尝试是怎样的思路?行业里心照不宣的 demo 工程,以及 2026 年,我们可能从哪些路径逼近具身智能的 GPT-3 时刻。

    范浩强和高阳说,组织和参与测评的过程,组织和参与测评的过程,本身增强了他们对具身的信心,,从 π*0 在 Table 30 任务上只有 20% 的成功率到 π*0.5 的翻倍和一些国产模型的超越,具身仍很早期,但进步速度也很惊人。

    本期嘉宾:

    范浩强 原力灵机联合创始人

    高阳 千寻智能联合创始人、清华大学叉院助理教授

    本期主播:

    程曼祺 晚点 LatePost 科技报道负责人

    时间线跳转:

    -发起 RoboChallenge,行业呼唤大规模测评

    03:24 范浩强和高阳的从业经验

    06:53 RoboChallenge 的发起,见证成功率从 π0 的 20% 到 π0.5 的超 40%

    12:40 以往方法的问题:环境不一致、测评不持续、仿真有局限

    21:47 对比 RoboArena 和 RoboChallenge:前者是分布式 Zero-shot 测评;后者是集中 few-shot 测评

    28:33 上线 2 个多月的观察:超预期的 1 万条测试提交,国产模型超越

    33:04 Table 30 任务集的设计,插花、扫二维码等任务的“刁钻”考点

    40:24 提交者自己做 fine-tune(微调),开源权重证明诚信;接下来会更新灵巧手的测评

    -2026 年具身展望

    45:07 学习原理已经收敛,Scaling Data 是 2026 年的行业主题

    48:53 4 种数据类型,各团队的不同数据 bet

    57:20 落地应用,具身的“Coding”任务是什么?“破圈”时刻何时出现?

    01:07:00 大众与从业者之间的认知落差,行业心照不宣的“demo”工程

    01:12:50 具身测评可以被 Hack 吗?如何反制 hack?

    01:14:52 26 年想验证的问题:具身中国追平美国的 DeepSeek 时刻是否到?基模能否上一个台阶?

    01:17:47 连点成线:总结观察具身进展的 3 个维度 & 具身创业团队的不同来源

    附录:本期中出现的一些人物、技术名词、项目、公司

    -Sergey Levine:Sergey Levine,加州大学伯克利分校教授,机器人强化学习与通用学习系统的重要推动者。曾参与 Google / Google Brain 的机器人与强化学习研究,并共同创立具身智能公司 Physical Intelligence(PI)。

    -π 系列模型:PI 提出的通用机器人模型系列,最新版本 π*0.6。

    -CIFAR:一个经典计算机视觉数据集,相比之后出现的 ImageNet,它规模更小、分辨率更低,常用于快速实验和教学。

    -Sunday Robotics:由 Tony Zhao 与 Cheng Chi 在 2024 年联合创立的家庭场景通用机器人公司。

    -Generalist AI:2024 年成立的美国通用机器人 / 具身智能的创业公司。

    本期剪辑:Nick

    小红书@曼祺_火柴Q即刻@曼祺_火柴Q

    ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆

    欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。

    这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。

    请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。

    关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
  • 晚点聊 LateTalk

    148: 访谈它石创始人陈亦伦:具身的三道曙光和第一道关卡

    1/16/2026 | 1h 25 mins.
    「华为前自动驾驶首席科学家投身具身创业。」

    本期嘉宾是它石智航创始人陈亦伦,他曾担任大疆创新机器视觉总工程师和华为自动驾驶部门首席科学家。

    2021 年,智能辅助驾驶的爆发前夕,陈亦伦在华为带团队开始采集大量真实的驾驶数据,用深度学习替代过去自动驾驶的规则方法,3 万行代码做了过去 200 万行代码的事,这是业界第一批探索端到端智能驾驶的尝试。

    陈亦伦说,那一刻,他觉得自己找到了自动驾驶的钥匙,而他还想用这把钥匙去探索一个年少时种下的更大梦想:通用智能机器人,也就是具身智能。

    在回到母校清华,于 AIR(智能产业研究院)担任智能机器人方向首席专家 2 年后,2025 年初,陈亦伦和百度原资深副总裁、百度智能驾驶事业群负责人李震宇一起创立它石智航,在最初 2 轮融资中,筹集了超过 2.4 亿美元。创下中国具身智能领域的首轮融资记录。

    这期节目,陈亦伦讲述了他从自动驾驶到具身智能的多年技术探索和研发实践,他看到的具身智能的 3 道曙光和 3 道关卡,以及怎么先越过其中的第一道:数据。

    本期嘉宾:陈亦伦,它石智航创始人兼 CEO

    本期主播:程曼祺,晚点 LatePost 科技报道负责人

    时间线:

    -从华为、清华到创立它石,看到具身的三道曙光

    02:35 用神经网络做自驾规控(PnC),3 万行替代 200 万行代码

    11:13 三道曙光:强化学习提升运控(locomotion)能力;LLM 处理任务规划;端到端解决极端案例

    17:13 端到端、VLA、世界模型,联系与区别

    20:40 三道关卡:数据、算法、后训练

    24:43 具身还在第一道关卡,数据;最后能经受大量数据的算法结构会很简单;GPT 最伟大的是定义了训练任务是预测下一个 token,而非架构本身

    30:16 定义具身模型的训练任务:建立空间概念、跟世界交互

    -数据解法:真实数据而非仿真和视频数据,手套采集而非遥操

    40:54 具身需要真实数据,不看好仿真和视频数据

    49:42 真实数据只有两个源头,世界与人;真实意味着场景真实、动作真实;为可穿戴设备是唯一解

    55:08 手套+第一视角摄像头采集数据的具体实现

    59:11 具身充满了硬件场景、本体、数据算法间的交替组合和协同优化,中国有供应链和场景优势

    01:05:08 没有选择 VLA,具身会有自己的模型,而不是简单在 LLM 上发展

    具身已经到了 Scaling 的临界点

    01:13:23 看数据增长趋势,具身已经到了 Scaling 的临界点

    01:18:04 它石的落地场景之一是处理柔性材料的线束装配

    01:21:15 能自己定义目标的具身公司就是靠谱的;成为别人,不是好的选择

    01:22:38 连点成线:往期分享

    往期具身智能访谈:

    晚点聊 112 期:与千寻高阳聊具身:一个像机器人的人,怎么做像人的机器人

    晚点聊 96 期:和楼天城聊 Robotaxi:学习人类优秀司机,让我绝望

    晚点聊 86 期:We, Robot-2,清华叉院/星海图许华哲看“Optimus”的门道

    晚点聊 65 期:信仰充值的威力:与逐际动力谌骅聊聊 GTC 和人形机器人新进展

    剪辑制作:甜食

    小红书@曼祺_火柴Q即刻@曼祺_火柴Q

    ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆

    欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。

    这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。

    请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。

    关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
  • 晚点聊 LateTalk

    147: 访谈OiiOii闹闹:“先抖音后剪映” 不再成立,AI 时代的创作工具和内容社区

    1/06/2026 | 1h 41 mins.
    「Agent 的工具可以以终为始。」

    今天这期节目,是晚点的作者祝颖丽对 OiiOii 创始人闹闹的访谈。本次访谈的文字版今天也会发布在《晚点科技》公众号上。

    OiiOii 是一款动画创作 Agent。刚刚在 25 年 11 月开启内测。闹闹自己是一名动画爱好者,2014年,在微信工作 3 年后,她辞职学了半年动画。但当时她发现,做动画太难了,行业环境也很糟。

    时隔10年,在自己创过业,去字节做过剪映,在大模型公司阶跃星辰做过二次元社区产品“狸谱”之后,她找到了用 AI 延续动画梦想的方法。

    这期,闹闹分享了她和团队是如何构思和做出 OiiOii 的,以及她过去的创业和大厂经历。

    图:OiiOii 官网页面。地址:https://www.oiioii.ai/home)

    本期嘉宾:闹闹,OiiOii 创始人

    本期主播:祝颖丽,《晚点 LatePost》 作者

    时间线跳转:

    05:06 先做好工具,再去做内容的社区:因为大家不再能忍受内容的单调了

    11:40 市场现状:现在动画的产能和消费非常不对等

    16:46 OiiOii为什么是这个形态?

    31:04 如果做AI漫剧,商业模式、审美都不一样

    41:30 怎么利用和理解不同的模型

    51:50 现在的团队分工

    53:50 第一次创业做极限运动社区,发现其实喜欢做内容

    01:06:17 第一次创业留下的最宝贵的东西:抗体

    01:18:15 在字节:对剪映和抖音特效最大贡献是…

    01:27:17 去了B站:看到产能被憋着了

    01:28:45 OiiOii 后面大致的节奏:填充垂类内容,去海外,做内容社区

    往期「AI 应用/AI Agent」创始人访谈:

    晚点聊 136:Sora新世界 & Lovart 4个月复盘 | 与陈冕聊怎么做垂类

    晚点聊 125:用AI复刻一个「我」,与心识宇宙陶芳波聊身份模型

    晚点聊 111:Pokee.ai 朱哲清的 Agent 造法:强化学习作后端,语言模型作前端

    《晚点对话明超平:他们不信 AI coding 会是新的创作方式,我很开心》

    剪辑制作:Nick

    ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆

    欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。

    这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。

    请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。

    关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
  • 晚点聊 LateTalk

    146: Gemini 3翻盘背后、Agent需要什么大模型、RL创业机会,与前 Google 创业者、硅谷投资人聊湾区动向

    12/26/2025 | 1h 40 mins.
    「一线开发者看到的前排变化。」

    本期是 137 期 Agentic 工具链节目的嘉宾返场,Henry 和 Naomi,他们近期刚刚和普林斯顿 AI 加速创新中心联席主任,王梦迪教授,一起成立了一家新的早期 VC,MoE capital。

    这次一起的也有两位之前在 Google DeepMind 和 谷歌云 Vertex AI 平台工作 7 年,刚刚创业,成立 Agent 工具层公司 Precur 的戴涵俊和 Bethany。

    我请他们分享了,岁末年初,在硅谷观察到的 AI 水温,OpenAI、Google 等一系列新模型进展背后的故事,和围绕当今 Agent 与 RL 生态的创业机会。

    这是我们本年关于 Agent 的第 8 期节目。

    本期嘉宾:

    Bethany Wang,Precur 联创

    戴涵俊,Precur 联创

    Henry Yin,MoE Capital 创始合伙人

    Naomi Xia,MoE Capital 创始合伙人

    本期主播:

    程曼祺,晚点 LatePost 科技报道负责人

    时间线:

    -基础模型竞争和幕后故事:Google 在旧金山开 Gemini 3 Party 的同一天,OpenAI 发布 GPT-5.2

    06:11 AI 进入实用工作:OpenAI 的 GDPval,Databricks 也发布了 Office QA

    14:25 GDPval 在主流知识工作上表现优秀,但基础模型处理长尾问题的 gap 始终存在

    19:09 Gemini 3 后,OpenAI、Anthropic、Google、各自的进展

    22:15 NotebookLM 和 Nano Banana 策源地——Google Labs,不仅招工程师,也有主编、作家、创作者

    24:54 DeemMind 研究员 Orio:Gemini 3 的秘密?预训练还有很多空间;TPU 对 Google 训练的加持

    26:34 Google 的 3 层协同优化:从 TPU 到 Infra 到模型;模型和应用;数据和硬件 surface(终端)

    30:18 Google TPU 已经更多对外,这对英伟达 GPU 优势的影响

    38:02 回顾组织变化:DeepMind 和 Google Brain 的合并与磨合

    -大厂竞争中,新公司的成长:围绕 RL 与 Agent 的创业机会

    43:31 垂类的机会:弥补基础模型到具体问题的差距;水平的机会:调度层、数据层、工具层都有新公司涌现

    50:17 技术新趋势——自我演化:RL、用 RAG 加长记忆有人尝试,但远不是成熟方案

    53:32「可训练的工具层」背后的技术变化:code 驱动工具,如 Anthropic 的 PTC(Programmatic Tool Calling)

    59:44 RL 创业方向:RL 环境,RL as a Service,RL 应用

    01:08:47 Agent 开发者挑选模型的前置条件:用什么云(比如 Azure 客户用不了 Gemini),再看云厂商折扣

    01:12:20 Anthropic 的 Claude Code 已成为 Agent 核心,刚发布的 Promatic to Call 探索新开发范式

    01:17:13 开源模型使用体验:Qwen 很棒;驶往 NeurIPS 的飞机上,1/3 人在看 DeepSeek-V3.2 技术报告

    01:22:04 选择模型时,关注什么 benchmark & 为什么?

    01:29:34 模型优化方向预测:加入大量 agent trace 的开源模型,更强的多模态,长程任务优化

    01:38:58 连点成线:往期节目推荐

    《晚点聊》今年关于 Agent 的更多节目:

    晚点聊 106 期:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need

    晚点聊 110 期:《与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专》

    晚点聊 111 期:Pokee.ai 朱哲清的 Agent 造法:强化学习作后端,语言模型作前端

    晚点聊 130 期:手机Agent大幕拉开!从刚上线的AutoGLM 2.0聊起,大模型如何改造手机

    晚点聊 136 期:Sora新世界 & Lovart 4个月复盘 | 与陈冕聊怎么做垂类Agent|

    晚点聊 137 期:Agent 是机会,造 Agent 的工具也是|从OpenAI开发者日聊起

    晚点聊 138 期:从你用手机到它更懂你,OPPO的手机AI实践 |与小布负责人万玉龙聊端侧AI

    附录:

    本期中提到的一些 benchmark:

    -GDPVal:OpenAI 今年 10 月发布的、用于评估大模型在复杂推理与决策场景中“价值对齐与结果质量”的验证型 benchmark,强调输出是否符合人类偏好而不只是“做对题”。

    -ARC-AGI-2:ARC Prize 今年 3 月发布的、用于测试模型在少样本条件下的抽象、组合推理能力,被视为接近“通用智能门槛”的挑战集。

    -OfficeQA:Databricks 今年 12 月发布的、围绕办公场景(文档、表格、邮件、日程等)的 benchmark,用来评估模型在真实工作流中的信息检索、理解与执行能力。

    本期中提到的一些产品/服务、公司

    -PTC(Programmatic Tool Calling):Anthropic 今年 11 月底发布的一种新的工具调用方法

    https://www.anthropic.com/engineering/advanced-tool-use

    -Tinker:Thinking Machines Lab 今年 10 月发布的首个对外产品

    https://thinkingmachines.ai/blog/announcing-tinker/

    -Preference Model:一家旧金山初创企业,做强化学习环境

    剪辑制作:甜食、Nick

    小红书@曼祺_火柴Q即刻@曼祺_火柴Q

    ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆

    欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。

    这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。

    请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。

    关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
  • 晚点聊 LateTalk

    145: 对话极壳孙宽:首个「消费级外骨骼」的诞生

    12/17/2025 | 2h 8 mins.
    「创业治好了我的死亡焦虑。」

    极壳是第一家把外骨骼做成消费级产品的公司。21 年成立以来,他们经历过账上只有20万元人民币的危急时刻,也刚在今年融到了 7000 万美元,出货量达到数万台。

    图注:极壳已发布 4 款消费级外骨骼产品。

    这只是个开始,远远不意味着成功。孙宽多次告诉我们,消费级外骨骼还在非常早期的阶段;他享受定义一个新品类的乐趣,也深知跨越鸿沟,走出小众市场的挑战。

    这是一家起步时没有风口的公司;这是一个父母开手机卖场,从小做各种发明,但没有名校光环的创始人。

    孙宽分享了他早年的“折腾”经历,他创立极壳、开发出第一款产品的故事,以及他对未来的更多想象。

    图注:孙宽是一个户外爱好者;极壳的主要目标用户是户外人群,外骨骼可以帮助他们增强运动能力。

    本期嘉宾:孙宽,极壳创始人 & CEO

    本期主播:

    程曼祺,《晚点 LatePost》科技报道负责人

    李梓楠,《晚点 LatePost》科技报道作者

    时间线跳转:

    -水滴字幕、光固化 3D 打印机、3 年轮岗、内部创业

    03:05《攻壳机动队》、90 后的科学幻想、技术是魔法

    13:25 第一份工作:从轮岗 3 年到模块化 PC 的内部创业

    18:27 一次误诊后回到初心:做一件做着做着挂了的事也不会后悔

    -从 1 人公司,到第一款消费级外骨骼

    26:51 1 人公司手搓原型,一度账上只有 20 万元人民币

    40:06 做“真有用”的消费级外骨骼:拉高核心正面效果,尽量降低负面影像

    49:41 推倒第一代方案,用户体验比新架构重要

    01:04:27 正式交付 Hpershell X,有人日行 7 万步,有人重返户外

    -效率的迭代:从 40 个月到 5 个月

    01:09:11 从成立到第一款产品,40 个月;第二代产品,5 个月

    01:05:08 从 1 人公司,到 4 位联创和 200+团队

    01:25:47 对拓竹组织的观察:好的人,希望身边都是好的人

    -跨越鸿沟

    01:32:52 品类跨越鸿沟:营造向往、价格、自研、形态拓展

    01:49:47 组织跑得更快

    -创业之后更踏实了,“活对了的感觉”

    01:56:22 创业治好了我的“死亡恐惧”。

    01:59:53 广义的外骨骼,最终是让我们的身体可编程。

    02:05:40 连点成线:后记 & 往期节目推荐

    往期「消费科技」创始人访谈:

    晚点聊 120 期:科创板后再访Insta360刘靖康:这何尝不是一种极限运动!

    晚点聊 141 期:大疆激光雷达前负责人做了台“电动轮椅”?与 Strutt 洪小平聊创业两年半:不做人形也能通向具身

    往期「AI 硬件」创始人访谈:

    晚点聊 107 期:与Haivivi李勇聊月入千万的AI Jellycat:小众AI硬件×大众消费品的交叉口创业

    晚点聊 118 期:天生卷王郭人杰:从 97 年的扫地机器人总裁到创业做家庭通用机器人

    晚点聊 122 期:10分钟朱啸虎投资,泡泡玛特、米哈游都在试;Fuzozo孙兆治聊AI潮玩

    剪辑制作:甜食

    小红书@曼祺_火柴Q即刻@曼祺_火柴Q

    ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆

    欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。

    这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。

    请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。

    关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:

More Business podcasts

About 晚点聊 LateTalk

《晚点聊 LateTalk》由《晚点 LatePost》出品。 最一手的科技访谈,最真实的从业者思考。
Podcast website

Listen to 晚点聊 LateTalk, The Learning Leader Show With Ryan Hawk and many other podcasts from around the world with the radio.net app

Get the free radio.net app

  • Stations and podcasts to bookmark
  • Stream via Wi-Fi or Bluetooth
  • Supports Carplay & Android Auto
  • Many other app features
Social
v8.3.0 | © 2007-2026 radio.de GmbH
Generated: 1/26/2026 - 6:45:07 AM