“很正确,无比正确。”当我们问起阿里巴巴 Qoder (Agentic Coding 产品)创始人叔同,关于他带领团队冲入全球 AI Coding 这片“红海” 60 天后的感受时,他给出了这样简单而坚定的回答。他的底气,源自一份优秀的成绩单:上线 5 天用户迅速突破 10 万,仅 60 天斩获 50 万开发者用户。AI Coding 可能是今年 AI 领域最热的话题。Cursor 年营收达到 5 亿美元、估值飙升至 100 亿,成为硅谷最炙手可热的独角兽;Anthropic 也凭借其强大的 Claude Code,让收入增长曲线比 OpenAI 更陡峭。在这片卷得炽热的战场,后来者阿里的机会在哪里?本周,我们邀请到了曾多年担任阿里巴巴“双十一”技术负责人、最早在国内推进全行业云原生化的技术领头人,听他独家分享 Qoder 上线 60 天即取得“开门红”的背后,是怎样的产品思考、技术布局和组织能力在支撑。🎉 本期节目特意选在 1024 上线,祝所有用代码改变世界的朋友们节日快乐,发量浓密,代码无 Bug!🟢 03:11 快问快答:年龄、毕业院校、MBTI 与星座、一句话介绍产品、收入与利润、团队规模、Qoder 前的探索经历🟢 03:27 AI Coding 全景图:从 0 到 1 vs 从 1 到 100一个典型的用户路径:先用 AI 生成一个网站雏形,当它开始产生商业价值,再用更专业的工具去维护和迭代。这背后反映了什么? AI 写码赛道的三种主流形态:服务于创作者的“想法落地”型工具、服务于专业开发者的“效率提升”型工具,以及直接替代人力的“数字员工”。 为什么说所有形态的 AI 写码工具,最终都不可避免地会走向“大一统”? “没有自研模型的 AI Coding 工具,只是在帮模型厂商打工”,为什么说 Cursor 这样的公司最终一定会构建自己的模型能力? 大厂做 AI Coding 产品有何天然优势?除了成本,更重要的是能和模型进行端到端的联动优化。🟢 09:48 红海突围:Qoder 的战略选择当所有人都去摘那些“低垂的果实”时,我们选择了直接进攻“价值高地”。 一个关键的战略选择:我们绕过从 0 到 1 生成新项目的“酷炫”场景,直接切入占开发者 95% 工作时间的“真实软件”研发领域。 为什么我们把 Qoder 定义为“智能体编程平台”?因为未来的开发协作模式,将从“人机协同”进化为“AI 自主编程”。 “我不干,智能体干”,这是一种全新的开发范式。 另辟蹊径的原因:作为一个后来者,我们希望通过差异化定位,快速在红海中找到自己的生态位。🟢 16:55 需求文档是最重要的!AI 不但擅长写代码,更擅长写需求文档。 从“提示词工程”到“上下文工程”,我们如何让 AI Agent 能够独立完成更大、更复杂的任务?答案是 Spec-Driven(需求文档驱动)。 一个典型的 Spec-Driven 工作流:用户提出一句话需求 -> “文档 Agent” 自动生成详细设计文档 -> 用户确认后驱动“代码 Agent”长时间执行。 这其实是对现实世界中“老板提需求 -> 产品经理写 PRD -> 工程师开发”这一流程的 AI 化映射。🟢 21:44 产品哲学:从“不打断心流”到“给你掌控感”AI 时代,开发者被迫进行“结对编程”,过去那种完全不被打扰的“心流”已难以维持。 AI 时代的新矛盾:既要提供趁手的工具,又不可避免地会打断用户的心流,如何平衡? 我们的答案:与其徒劳地追求不被打断,不如给用户完全的“掌控感”,让他成为 AI Agent 的管理者。 一个反常识的产品设计:为什么 Qoder 至今不让用户选择模型? 因为“机选优于人选”,也避免了用户成为“模型测试员”而产生的决策疲劳。 我们如何平衡性能、效率、成本这个“不可能三角”?核心在“上下文工程”的精细化运营。🟢 32:26 组织与方法:如何支撑一场闪电战?为什么 Qoder 能够快速起步?因为我们不是从零开始,而是整合了阿里内部多个成熟团队的人才和技术积累。 从服务中国市场的“通义灵码”,到面向全球的“Qoder”,背后发生了怎样的组织和战略演进? 一个关键决策:为了争取全球市场的时间窗口,我们先用全球最好的模型服务开发者,同时“以战养战”,为自研模型的发展赢得时间。 “它就是独立经营的一块业务”,大厂内部创业如何通过组织设计,真正地“甩掉包袱”,实现创业公司级别的敏捷?🟢 40:13 Repo Wiki:攻克“祖传代码”的秘密武器我们学计算机第一课,老师就说要写好文档和注释,但几乎没有团队能真正做到。这是一个如此显性的需求,为什么之前没人做? 开发 Repo Wiki 的第一性原理:“文档是会骗人的,但代码永远是最新的。” 我们如何用 AI 解构“祖传代码”?通过分析代码的当前切片和所有历史提交记录,还原出整个系统的设计思想和业务逻辑。 如何保证这个文档不过时?随着代码库的变更,AI 会实时、增量地更新这份“活文档”。 为什么我们有信心构建壁垒?因为这不是一个原子能力,而是一整套深度定制的模型、Agent 和与 Git 结合的团队协作工作流。🟢 01:03:19 | 1024 寄语:AI 时代,程序员如何进化?程序员可能是最不惧怕学习的群体,这恰恰是我们在 AI 时代最大的优势。 AI 会取代程序员吗?不会,同时“杰文斯悖论”告诉我们,当成本降低,需求会爆炸式增长,程序员的数量可能会变得更多。 未来工程师的核心竞争力是什么?从单一的编码能力,转变为“需求洞察、整体设计、结果验收”等复合能力。 给计算机大一新生的建议:拥抱 AI,但更要学好计算机体系结构,因为你得知道 AI 有没有在“忽悠”你。🟢 01:09:48 | 双十一往事:一个顶级架构师的两次“高考”老板给了一个疯狂的目标:双十一流量翻 50 倍,集团能不能不多花一分钱?我们最终做到了。 “在双十一之前,先创造无数个双十一”,如何通过“全链路压测”这剂猛药,在真实流量下反复演练,驯服上千个系统? 技术人如何永远“跟技术要红利”?从解决稳定性问题,到通过容器化、云原生技术极致地优化成本,这背后是一套完整的方法论。 顶级架构师的成长之路:从解决一个技术难题,到构建一套技术体系,再到将技术能力产品化、商业化,最终寻找更大的舞台。欢迎订阅「十字路口」播客🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻🎄 本播客由「新世相声音森林播客计划」支持。
--------
1:26:53
--------
1:26:53
2025 AI 现场:我们这一年的目击与狂想
本周的十字路口,我们和庄明浩(「屠龙之术」主播)一起,复盘 2025 年的 AI 和科技行业的大事件,以及身处其中的我们的一些记忆与感受。这一年,我们既是目击者,见证着技术的快速迭代、产品以前所未有的方式颠覆日常;同时,我们也被卷入了一场关于未来的集体狂想,在创新的巨浪和无尽的可能性面前,时而兴奋,时而迷茫。我们从明浩提出的年度关键词“拐点”聊起,复盘了从年初的 DeepSeek R1 到最近的 Sora 2 的各种模型大战、Manus 引爆的“Agent 元年”;探讨了开源生态和人才流向;并最终将目光投向资本市场——当我们该如何理解这场关乎未来的集体狂想?欢迎收听本期内容,和我们一起将在 2025 年亲历的观察与感受,沉淀为这段 AI 时代的共同记忆。————本期节目由鸿蒙特别呈现:「“码”上出发,洞见生态的力量」——🟢 02:09 2025:向上还是向下的“拐点之年”“我们不知不觉地走到了很多事情的极限里面,技术也好,产品也好,钱也好。”尝试用一个词概括 2025,为什么说“拐点”一词最妙?向上的拐点:数据中心的建设狂潮预示着 2026 年的爆发。向下的拐点:泡沫何时破裂?我们是否已在不知不觉中触碰到技术和增长的极限?🟢 03:24 大模型战场:中美技术路线的分野与共识DeepSeek r1 如何用百万美金成本,撬动了百亿美金的基建叙事?Sam Altman 重新定义“图灵时刻”:为什么 AGI 可能不会“翻天覆地”,而是“轻轻迈过”?头部模型厂商的生存法则:Anthropic 做深 B 端,xAI 走野路子,微软为何被迫自研模型?在纯 Chatbot 战场,战役已经打完了吗?ChatGPT 8 亿周活的背后,是护城河还是增长极限?中国厂商的共识与武器:为什么“开源”成了对抗美国 AI 趋势的唯一手段?DeepSeek V3.2 的发布意味着什么?为什么我们今年可能等不到 V4 和 R2 了?🟢 23:42 AGI 的另一条路:从 Sora 2 到世界模型“如果视觉模型也是主桌,那它可能用另外一种方式会实现 AGI。”多模态战场为何比语言模型竞争更激烈?美图、营销视频 Agent... 场景和商业化路径无比清晰。OpenAl 的产品心法:为什么是 Sora 2 走入了千家万户,而不是技术同样领先的其他产品?这个世界真的不需要一个“AI 抖音”吗?或许 OpenAl 的目的根本不是做抖音。Google 回来了!世界模型 Genie 会是通向 AGI 的另一条路,甚至是“世界的子宫”吗?🟢 39:04 Agent 元年,然后呢?为什么 Agent 将在 L3 阶段停留很久?因为它第一次将 AI 能力从“语言”延伸到了“行为”。Manus 的历史意义:它让用户第一次知道了 Agent 该长什么样,心智定义价值千金。Agent 创业公司如何活下去?当通用 Agent 成为巨头显学,垂直领域的法律、金融、营销反而异常繁荣注意力经济的挤压效应:当主流赛道挤满人,为什么连“AI 动态漫”这种天花板有限的赛道都能拿到钱?🟢 49:11 手机厂商的端侧 Agent为什么说真正的“手机助理”,Siri 做不到,但今天的端侧 Agent 可以?鸿蒙 HMAF 框架的启示:当 OS 不再自己做一切,而是将意图下发给 APP 的原生 Agent,会为开发者带来什么新机会?🟢 53:00 开源、鸿蒙:中国特色的生态从“头部模型一定是闭源”到“2026 年开源模型会登顶”,Sam Altman 的观点为何发生转变?开源如何商业化?DeepSeek 的 API 照样卖钱,且成本比 OpenAI 低几十倍。开源如何成为一种“武器”?在争夺欧洲、东南亚、中东等中间地带时,开源天然地拥有信任优势。本地部署的需求有多旺盛?一款内存和显存超大的笔记本电脑,因为适合本地部署大模型而被迅速抢购一空。开发者有哪些新的“生态位”可以抢占?鸿蒙开发者凭借数款小应用月入 7 万。🟢 01:08:36 二级市场狂热,一级市场呢?“当年大家认为 AI 是一个技术、一个产业,今天 AI 就是市场本身。”Sam Altman 的“终局思维”:当一家公司试图将未来五年的增长预期全部打包,会发生什么?另一面,中国创投圈“我们太过熟悉的移动互联网增长叙事,在今天不能复制。”投资人如何寻找信心?当 AI 纯软件的故事讲不通时,大家开始集体投向大疆、石头、追觅背景的硬件创始人。与互联网泡沫的终极拷问:光纤可以为未来铺路,但三年就会过时的显卡呢?有趣的信号:除了英伟达,今年标普 500 涨得最好的竟是希捷和西部数据这两家硬盘公司。泡沫警报:当 AI 巨头开始依赖债务融资,令人想起“次贷危机”的幽灵是否正在靠近?欢迎订阅「十字路口」播客🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻🎄 本播客由「新世相声音森林播客计划」支持。
--------
1:31:24
--------
1:31:24
拜托了,AI!帮忙解决「看病难、看病贵」吧|对谈王国鑫:京东健康探索研究院首席科学家
最近,美国多家 AI+医疗明星公司接连传来进展:OpenEvidence(医学知识搜索) 的 ARR 已突破 1000 万美元,每天有上万名医生付费使用;Abridge(临床文档转写) 完成 2.5 亿美元融资;Tempus AI(肿瘤学与精准医疗) 已在纳斯达克上市,市值一度超过 60 亿美元;Hippocratic AI(医疗专属大模型) 估值也已达数十亿美元。这些公司共同展示出一个趋势:AI 正在全球范围内迅速重塑医疗行业。在国内,AI+医疗同样在如火如荼地发生。硅谷知名风险投资机构 a16z 预言:医疗保健将成为从 AI 中受益最多的行业。因此本周,我们邀请到京东健康探索研究院首席科学家王国鑫 Nico,请他分享「京医千询2.0」大模型与「AI 医院」的研发与应用。他不仅谈到在企业战略层面,AI 产品如何通过京东健康的医检诊药生态,来满足用户健康需求,也解析了以 OpenEvidence 为代表的美国初创公司目前在 AI+医疗方向的主要探索与不同侧重。医疗是监管最严、数据最敏感、决策最攸关生死的垂直领域。因此,Nico 今天分享的经验和方法——如何找到真实痛点、如何积累专业数据、如何在产品和战略层面争夺用户心智——**对所有垂直大模型行业都具有启发意义,**相信也能给正在思考 AI 落地的你带来一些参考与帮助。最后,Nico 还带来了他作为科学家的个人健康管理小技巧,简单实用,谁都能用得上。🟢 01:49 「十字路口的」的快问快答:年龄、在京东健康的年限、MBTI 与星座、一句话介绍产品“京医千询”、公司收入与利润,以及大模型业务的核心战略定位。🟢 02:42 AI 的终极拷问:如何解决医疗行业最根本的痛点?“我相信每个人是都想活一辈子… AI 在这个里面扮演的最大的特点就是能不能提升供给水平。” 京东健康每天有 49 万次医疗服务咨询,AI 最初的角色是保证业务“合规”与“降本”。 为什么大模型让所有人眼前一亮?因为它表现出高度的“类人水平”,开始让人思考创造“医生水平”的 AI 的可能性。 AI 能否低成本扩大供给,让我们每个人都有一种均等的高水平服务?这是所有做医疗 AI 的人,最终极的价值创造。 大模型不仅能在身体健康上实现平权,也能在精神健康上实现“情绪平权”,接住每一个人的情绪。🟢 07:57 医疗数据的「痛并快乐着」医疗数据可能是数字化水平最高的行业之一,但为什么它仍然是垂直模型最难啃的骨头? 医疗 AI 从业者的“幸运”:国内医院花了巨大的力气,跑过了信息化时代,数字化水平相对较高。 核心痛点:医生的思考和推理过程是缺失的,模型只能看到提炼后的结果,无法学习“如何思考”。 数据天然在物理上是分散的,确权也存在问题——数据到底属于医院、医生,还是患者? 为什么以前跨医院检查不互认?即便同是 CT,也可能因为设备、技师的原因导致结果无法形成共识,这背后是专业壁垒。🟢 12:10 一个内部申请预算的公式:什么样的行业值得做垂类大模型? 判断是否需要垂类模型,可以从“数据是否低成本可获取”和“商业模式是否显而易见”两个维度来划分。 如果一个行业的知识门槛不高,经验能被新技术轻易替代(如语言教育),那么做垂类模型的机会就比较小。 为什么代码是垂类模型的“天选之子”?因为它的商业模式清晰到让所有通用模型公司都无法拒绝。 垂类模型机会的两大特征:数据拥有独占性和独特性;商业模式足够清晰且价值足够高。🟢 25:29 京医千询 2.0:不止于文本,三大核心进化 进化 1:从真实数据到大量使用“合成数据”,并向行业开放了可模拟真实医患对话的 Agent。 进化 2:从单模态到多模态,一个模型内同时支持 CT、MRI、X 光等影像数据的理解。 进化 3:从简单推理到“循证推理”,模型做出的每个判断,都能追溯到具体的证据来源(如顶刊论文、国家指南)。 如何验证海量合成数据的准确性?通过“三层漏斗”:内部全职医生团队、合作医学院、百人外部专家质控委员会。🟢 34:07 灵魂拷问:垂直模型在哪些具体问题上能秒杀 GPT?“医学最重要的是诊断准确和处置方案有效,专业压过服务体验。” 专业模型的核心是“拟专家能力”:通过简短的核心问题快速做出判断,而不是像通用模型一样为了全面而问遍所有可能。 如果让通用大模型去看一张医疗影像,效率会大打折扣,而垂直模型专门为影像的专业词汇、脏器位置、微小病灶做了优化。 跑分和真实产品体验没有百分之百的关联,我们内部更相信专家的评估指标。 为用户建立专属的、可长期追踪的“家庭健康档案”,这是通用模型很难做到的产品差异化。 做心理医生的难度,远高于做内科医生。如何衡量和优化模型的“共情能力”是目前的技术难点。🟢 55:17 AI 医院:一场争夺「未来健康第一入口」的阳谋 为什么要做“AI 医院”?当你有内科、药师、营养师等多个 Agent 后,需要一个统一的产品心智,去争夺用户的“健康第一入口”。 京东做医疗的底气是什么?我们是一家有实体医疗机构、有药品供应链、能实现 30 分钟送药上门的公司。 未来的竞争,将是 Chatbot 的能力,再叠加后端服务能力的通盘竞争。 对于通用大模型公司,我们更多地将其当做“合作伙伴”,而非“竞争对手”。🟢 01:11:57 给普通人的建议:如何利用 AI 更好地生活? 一个很反人性的洞察:健康的“需求”是无限的,但只有在“失去”健康时,这个需求才变得真实。 一个普通人能立刻执行的健康建议:每年强制拿出一笔钱投入到健康上,用经济手段“逼”自己调整认知,这在中期看是省钱的。 要相信一句话:很多疾病在早期发现,以今天的科技水平都是有解法的;一旦错过,就只剩下缓解的方法。🟢 01:15:34 投资人视角:如何判断一个垂直大模型公司? 这个行业的知识深度和数据壁垒真的存在吗?这是一个 0 和 1 的问题。 它的商业机会不能那么大,否则大公司一旦注意到,你就没戏了。 这家公司的商业落地预期是什么?是 API 付费、产品付费,还是销售驱动?创始团队的背景和能力是否匹配?欢迎订阅「十字路口」播客🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻🎄 本播客由「新世相声音森林播客计划」支持。
--------
1:18:52
--------
1:18:52
在双减“废墟”上,用 AI 重启人生 | 对谈连续创业者刘夜:从作业盒子到 Talkit
本周「十字路口」的嘉宾在职业生涯像是坐了一趟过山车——他就是前作业盒子创始人,现任 VisionFlow 创始人刘夜。刘夜曾将作业盒子打造为覆盖上亿师生、服务十万所学校的教育独角兽,但双减突然发生,业务遭遇重创。而刘夜在经历了这场巨变后,决定在双减”废墟”上重新起航,开启新的 AI + 教育创业。VisionFlow 获得约 1000 万美元的种子轮融资,出资方包括知名企业家李想、阿里巴巴合伙人曾鸣及语嫣等,是 AI 语言学习赛道种子轮融资最多的公司。刘夜认为 AI 彻底解锁了语言学习中一直无法突破的口语难题,过去几十年的「不可能之事」,现在成了可能。基于此,VisionFlow 推出首款产品 Talkit,一个完全为口语练习打造的 AI x 3D 虚拟世界。本期内容中,我们会聊产品、聊 AI,我们也会听刘夜分享他从作业盒子到 Talkit 的这段特殊旅程——这其中有关于创业的思考,有面对突然崩塌时的心态调整,以及如何重整旗鼓、再次起航的经验。我们每个人在一生中都可能面临「人生重启」的关键时刻,希望刘夜的经历,可以给大家带来启发和勇气。🟢 03:11 快问快答:年龄、毕业院校、MBTI 与星座、一句话介绍公司产品、融资情况、收入与利润、团队规模、本次创业前的探索经历🟢 05:14 AI + 教育 AI 来了,为什么我们学英语的方式还停留在上个世纪? “多邻国是一家专注于‘手’的公司,而我们是一家专注于‘嘴’的公司。” 一个诞生于 1980 年的语言学习理论(TBLT),为什么直到 AI 大模型出现才真正迎来春天?🟢 09:12 Talkit:为语言学习打造一个友好的虚拟世界 你以为移民到美国那样的真实环境就能学好英语?不,那个世界对学习者并不友好。 为了创造一个完美的学习环境,他们自研了一整套“世界生成引擎 (Gen World Engine)”。 当 Roblox 还在靠用户创造世界,他们已经能让一个实习生一个月生成 1000 个 3D 虚拟人。 AI 如何做到既能陪你聊天,又能像个顶级私教一样,精准控制教学内容的难度?🟢 14:40 伟大的对手:多邻国一个让很多人抱怨“学不会”的产品,为何能成为市值百亿美金的巨头?它真正的护城河到底是什么? “解决刚需的生意不算伟大,‘刚需’是农业社会陈旧和腐朽的词汇。” 多邻国的核心产品哲学:“轻松第一,有效第二”。你永远教不会一个不出勤的学生。 绝大多数人使用多邻国,就像去健身房打卡,学习只是一个令人愉悦的“副产品”。 多邻国流失的那 8.5 亿用户,都去了哪里?他们都在寻找真正能开口说的方法。🟢 29:07 双减时刻:从行业清零到内心解脱一场几乎清零了整个行业的灾难,为何对身处风暴中心的人来说,反而是一种“解脱”? 双减靴子落地,他和联创通电话,两个人的感受居然都是:“挺好的”。 如何判断你的事业是否违背初心?问自己一个问题:“如果我有小孩,会让他用我的产品吗?” 他曾手握近 10 万个比特币,却为了一份自己认可的教育事业,放弃了成为交易所巨头的机会。 如何消化一次创业失败带来的巨大遗憾?答案只有一个:做成一个更伟大的公司。🟢 36:41 迷茫的三年:一个顶级创业者的“空窗期”生存法则 创业中断后,他没有报复性创业,反而陷入了“极度渴望被需要”的状态。 一个他调研半年、投资人追着投钱的连锁咖啡项目,为什么在最后关头被他亲手叫停? “价值不是由功能决定的,而是由独特性决定的。你到底是一个套利的商人还是一个企业家?” 为什么说创业是反人性的?因为你要去做一些“如果你不做,就没人做”的、足够难的事。🟢 52:09 用 12 个「我是...」来造句 我是高山滑雪全国亚军 我是国家二级游泳运动员 我是积水潭医院骨伤科常年会员 我是全球医生社区会员 ……剩下的 8 个更精彩,请收听播客🟢 59:52 一直游到海水变蓝:给新一代 AI 创业者的三个建议 创业心法“苦海不苦”:当你能清晰看见远方的蓝海,当下的苦海也就不再痛苦。 给 AI 创业者的建议:警惕“假机会”焦虑,真正的机会其实很少,要敢于花时间寻找。 拥抱孤独,不要害怕做的事情只有你一个人看到了,因为孤独往往意味着稀缺和正确。 “只有犯错,才会有机会和自己相处”,才能真正知道什么是对的。欢迎订阅「十字路口」播客🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻🎄 本播客由「新世相声音森林播客计划」支持。
--------
1:04:00
--------
1:04:00
“语言模型撞墙了,3D大模型刚开始”|和VAST创始人宋亚宸聊3D大模型创业“狂飙”的两年
在文生图、文生视频的浪潮之外,下一个引爆我们想象力的 AI 技术奇点在哪里?答案可能是 AI + 3D。本周,我们邀请 3D 大模型公司 VAST 的创始人和 CEO 宋亚宸(Simon),和我们聊聊 VAST 最新 3D 生成大模型 Tripo 3.0 背后的故事。这位 97 年的创业者短期内连续融资三轮、每轮数千万美金,积攒了足够的子弹,在闷头苦干一年后,Simon 今年首次上播客,和我们探讨了几个关键的战略问题: 他认为大语言模型已经“撞墙”,进化放缓,这才给了应用和 Agent 繁荣发展的空间。而 3D 大模型则完全不同,它才刚刚起步,仍是一片蓝海。 在资源有限的初创阶段,为什么 VAST 「既要又要」?既要研发大模型,又要自己下场开发应用 Tripo Studio? 为什么科技的终极形态,是一场“解压缩”?他认为人类的媒介史(文字->图片->视频->3D)不是升维,而是因为技术所限,被迫对3D“源文件”世界进行的一次次降维和压缩。技术的进步,就是“解压缩”回世界本貌的过程。 以及,在一个机器人能代劳一切的未来,人的价值将如何被重新定义?从小学时吸引同学们用辣条“充值”自己创造的纸上 RPG 世界,到 all in AI 创业打造一个坚信人人都会创造 3D 的“无限世界”梦想 ——欢迎收听 Simon 在创业路上的观察和思考,也欢迎你在评论区里说说你对 AI + 3D 的想法。🟢 01:27 快问快答:**年龄、毕业院校、MBTI 和星座、一句话介绍现在的公司和产品、融资情况、收入和利润、团队规模、创业前经历🟢 02:47 用 10 个「我是 xxx」来造句 我是宋亚宸,也是 Simon 我是 VAST 创始人兼 CEO 我是一个上瘾的游戏玩家(Addictive Gamer) ……剩下的 6 个更精彩,请收听播客🟢 08:43 Part 1: 万物起源:从小学时收费的RPG,到一个无限世界的梦想 3D 大模型创业者的童年:手动创造 RPG 世界,同学们用辣条和豆腐干来“充值” 核心驱动力:物理世界是有限制的,更大的世界来自于人的大脑、想象和创意的部分,那是一个无限的世界 最初的“钉子”:想做一个 UGC 的 3D 内容生态,但发现世界缺少一个大众级别的创作工具——就像文字缺少了输入法,视频缺少了手机摄像头。🟢 26:14 Part 2: 模型 vs. 工作台:为什么我们既要造发动机,也要造F1赛车? 一个关键的战略判断:当一个大模型还在以每 3-5 个月一次的速度飞速迭代时,纯做应用层的公司几乎没有生存意义,因为“它给你起了个新墙,你很难受” 做模型也做做应用(Triple Studio):因为知道下一版模型的迭代方向,知道哪些旧墙应该糊,哪些不用 做大模型公司和做产品的本质区别:前者是拿着锤子找钉子,VAST 认为自己从第一天就不是🟢 28:44 Part 3: AI 2.0 时代的生存法则:语言模型撞墙了,但 3D 没有 一个颠覆性观点:为什么现在涌现了大量 Agent 和应用?“我认为是 AI 1.0 时代死了,所以我在做 AI 1.0 的事情。” AI 1.0 vs AI 2.0:前者是用天才科学家的手工调参训练无数小模型解决长尾问题;后者是用数据驱动训练一个通用大模型去泛化地解决所有问题 为什么 3D 领域几乎没有纯应用公司?“因为语言模型撞墙了,但 3D 还没🟢 57:26 Part 4: 科技的终极形态,是一场“解压缩” 我们以为互联网是升维(文字->图片->视频),但其实是降维和抽象——因为科技不够发达,我们被迫“压缩”了 3D 世界本来的样子 科技越来越发达,其实是允许它越来越解压缩。当它解压缩到极致,就是源文件 为什么人人都会做 3D?现在对我们而言很自然的拍视频、发照片,其实也不超过十年 3D UGC 平台的市场规模,应该是 Twitter、微博、小红书、抖音、TikTok 等平台加在一起的 2-3 倍🟢 01:12:21 Part 5: 欢迎来到第四产业:当价值的唯一衡量标准是“体验” 终极愿景:未来物理世界大部分的事情机器人都可以为人代劳,人的价值在于创意和内容 如何衡量价值——“所有的人在所有的时间中,在我们的世界里停留的总量” 未来的“货币”是算力。你的世界越吸引人,你获得的“钱”就越多,你的推荐算法就越好,你就能创造更好的体验 一个来自《上传人生》的隐喻:现实中充的钱越多,虚拟世界就越流畅。未来也是这样,这就是算力欢迎订阅「十字路口」播客🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻🎄 本播客由「新世相声音森林播客计划」支持。