Powered by RND
PodcastsBusiness张小珺Jùn|商业访谈录

张小珺Jùn|商业访谈录

张小珺
张小珺Jùn|商业访谈录
Latest episode

Available Episodes

5 of 120
  • 117. 开源一段论文探索之旅:模型范式、Infra和数据、语言、多模态的完整变迁史
    今天的嘉宾是谢青池,他是美团光年之外的产品负责人。一个月前,青池找到我,说他用了一年多的时间一篇一篇地啃完了200多篇AI论文,从开始全然不得要领,到后来逐渐地入门——而他希望将他的论文探索之旅开源给大家。就这样,我们有了今天这集特别的节目。他从200多篇论文中精选了36篇经典,4小时讲解,带你穿越AI变迁史。他说,读论文是“给你打开一扇门”,让你能直接“与这个世界最聪明的头脑对话”。2025年,期待我们和AI共同进步!01:30 探索的缘起07:25 怎么读论文?(用AI学AI)10:20 辅助小工具和路书论文讲解的主干:19:35 Part 1:模型的范式变迁故事要从1999年的第一颗GPU开始讲起Brook: 用GPU进行计算 (2004.08)AlexNet: 深度学习的开端(2012.10)对序列建模:seq2seq和Attention的引入(2014.09)蒸馏:模型能被学习吗?(2015.03)ResNet: 比深更深(2015.12)Transformer来了!拉开一个时代的序幕(2017.06)AlphaGo Zero: 强化学习的突破(2017.10)现代MoE的开端(2017.01)CoT: Prompt Engineering的奠基之作(2022.01)LoRA: 那个我们每天都在用的东西(2021.06)ReAct: Agent从理论到落地(2022.10)The Bitter Lesson: 过去70年的教训(2018.08)01:52:58 Part 2:Infra与数据的变迁ZeRO: 大规模的GPU并行计算(2019.10)Scaling Law & Chinchilla: 上帝的指挥棒(2020.01 2022.03)LAION-5B: 开源社区的英雄主义(2022.10)The RefinedWeb: 互联网的数据也很够用(2023.06)MegaScale: 万卡GPU集群的训练(2024.02)02:21:29 Part 3:语言模型的发展Word2Vec: 用机器学习将单词向量化(2013.01)Google Translate: 神经网络的大规模线上部署(2016.09)GPT-1,它来了(2018.06)BERT: 曾经的王(2018.10)GPT-2: 是时候告别微调了(2019.02)GPT-3: ChatGPT来临前夜(2020.05)InstructGPT: 给LLM以文明(2022.03)Tulu 3: 后训练的开源(2024.11)03:08:08 Part 4:多模态模型的发展DeepVideo: 深度学习进入视频领域,Andrej 初出茅庐(2014.06)双流网络: Karén和学术重镇牛津登场(2014.06)图像生成的序章: GAN来了(2014.06)Diffusion: 在GAN的阴影下,悄然成长(2015.03)DDPM: Diffusion重回图像舞台的中央(2020.06)ViT: 当图像遇到Transformer(2020.10)CLIP: 文生图的奠基石(2021.03)Stable Diffusion,它来了(2021.12)DiT: 人们期待一个融合的未来(2022.12)03:56:38 最后的聊天架构抱住了硬件的大腿今天技术的边界到达了哪?给“站在AI世界门外张望的人”和“已经在体系中工作多年的人”的建议【技术之美】系列:逐句讲解DeepSeek-R1、Kimi K1.5、OpenAI o1技术报告——“最优美的算法最干净”逐篇讲解DeepSeek关键9篇论文及创新点——“勇敢者的游戏”逐篇讲解DeepSeek、Kimi、MiniMax注意力机制新论文——“硬件上的暴力美学”逐篇讲解机器人基座模型和VLA经典论文——“人就是最智能的VLA”逐段讲解Kimi K2报告并对照ChatGPT Agent、Qwen3-Coder等:“系统工程的力量”【更多信息】本集的投屏视频版已经同步发布于Bilibili(张小珺商业访谈录):https://www.bilibili.com/video/BV1pkyqBxEdB/?spm_id_from=333.1365.list.card_archive.click&vd_source=aa7c66a3d015be4b5bfcd520784f279050页完整PPT开源地址(所有论文链接附在PPT上):https://w7py8ou4dk.feishu.cn/wiki/KacewdlmSiSGC9kUOKDch9gwnKf?from=from_copylink
    --------  
    4:22:37
  • 116. 吴明辉口述19年史:漫长的沉浮、痛苦急转、企业级Agentic Model、现实世界的数值游戏、IPO
    今天的嘉宾吴明辉是明略科技的创始人、CEO兼CTO,明略科技于2025年8月29日获境外发行上市备案通知书,不久后将于香港上市。这是一次上市前的访谈,吴明辉口述一家To B公司漫长的19年故事,其间经历了好多次的分分合合、沉浮与急转。你能在这里面找到许多我们节目嘉宾的身影——肖弘、李广密、杨植麟。我们也聊了聊面向全新的AI时代,企业服务级AI与Agentic Model的前景。但这个故事的最开始,要从他与峰瑞资本创始合伙人李丰的公司合并聊起。2025年,我们和AI共同进步!02:11 Part 1:第一段创业开始的快问快答和我们嘉宾广密、Red的渊源创业的开始:祝伟投资吴明辉和李丰合并后的公司最开始罗永浩、李笑来是我们的股东第一版商业计划书就是推荐系统,为什么没做今日头条?奥林匹克竞技训练的心理调适秒针系统的成功眼睁睁看着今日头条的流量哗啦啦起来56:08 Part 2:第二段创业“老板上完商学院,团队遭殃”同时创立明略科技、云迹机器人学习美国一家数据分析公司Palantir,但从To G转向To B收购Red的决策,我希望他做我的CEO successor2020-2021年:战场开得太宽、走过的弯路2022年:痛苦的急转,人生最suffer的一年有AI以后,预计企业级服务会出现并购潮01:45:01 Part 3:企业服务级AI基于公开数据训基础模型、以卖Token为商业模式的公司会很卷,卷成电费有私有Data的公司能产生差异化价值现实世界的数值游戏新产品“DeepMiner”的由来Agent或Tool Use在企业服务领域产生了新的链接Agent是一种交互技术,对To C和To B互联网都会产生革命性变化那些不提供供给侧能力、只提供链接网络,而这个网络又不是根结点的公司,会很危险将来企业只有两类人?老板和合伙人(合伙人不是公司员工)一个幸福的老板,个人使命、家庭使命和公司使命高度相关
    --------  
    3:47:45
  • 115. 对OpenAI姚顺雨3小时访谈:6年Agent研究、人与系统、吞噬的边界、既单极又多元的世界
    今天的嘉宾,我们很开心邀请了OpenAI研究员姚顺雨。2025年4月,姚顺雨发布了一篇有名的博文《The Second Half》,宣告AI主线程的游戏已进入下半场。这之后,我们与他进行了一场播客对谈。姚顺雨毕业于清华和普林斯顿大学,开始智能体的研究非常早。在博士期间他意识到语言可能是人类发明的最接近本质的工具,于是转向语言智能体研究,至今已6年。他有许多有代表性的工作。我们的谈话从个体出发,共同探索由人、组织、AI、人与机器的交互,所抵达的这个世界智能的边界以及人类与机器的全景。前不久,我刚刚创立了一家新的内容工作室「语言即世界工作室」,顺雨很意外地从另一个角度帮我回答了,我们工作室创立的初心。为什么我们相信语言是这个世界的本质奥秘?他的表达是:“语言是人为了实现泛化而发明出来的工具,这一点比其他东西更本质。”(本次访谈发生在2025年5月,访谈为个人观点,与所供职公司无关。)02:58 第一部分:人 感觉我前28年的人生,非常的乖 我一直有这个非共识:我想要去做Agent 第一年最大收获是,要用GPT,不要用BERT;第二个learning是任务或环境非常重要 我的研究有两个核心:一是怎么去做一些有价值、和现实世界更相关的任务和环境;二是怎么去做一些简单、但又通用的方法17:50 第二部分:系统 Agent是一个非常古老的概念,任何能进行自我决策、与环境交互,并试图优化奖励的系统,都可以被称为Agent Agent演变的三波兴衰:大家可能更多注意到方法线,容易忽视任务线,但这两条线是相辅相成的 Agent发展最关键的两个方向:一个是让它拥有自己的reward(奖励),能自己探索;另一个是Multi-Agent(多智能体),让它们之间能形成组织结构 Code有点像人的手,它是AI最重要的affordance(环境给予行动者的可能性) 任务的设定 泛化的工具 奖励的机制48:38 第三部分:吞噬的边界 创业公司最大机会是:能设计不同的interface(交互方式) 可能模型的能力会产生beyond ChatGPT(超越 ChatGPT)的交互方式,变成Super App 拥有一个Super App对于公司是双刃剑,当你有像ChatGPT这样的Super App,很自然你的研究就会围绕这个Super App Assistant、Her,或者像人一样的交互方式,显然是最重要的交互方式之一;不显然的是,我能不能基于不像人的交互方式? 这世界是个相互抄的关系,而不是一个单向抄的关系 OpenAI可能会成为一个类似Google的公司,成为新世界里非常重要的一环,但这并不代表,这个世界就会被这样一个单极系统垄断 最终的智能边界,是由不同的交互方式决定的,而不是由一个single model(单一模型)决定 前年冬天,我读到冯诺依曼临终前写的一本书:The Computer and the Brain 环境永远是记忆层级中最外层的部分,这很哲学 模型公司的Chatbot系统会演化成一个很自然的Agent系统01:05:01 第四部分:人类的全局 人与系统:Agent要不要像人?“是一个效用问题” OpenAI是一个bottom-up(自下而上)的公司 如果你没有一个different bet(不同的下注方向),很难超越前面的霸主 我导师是GPT‑1第二作者,他在OpenAI待了一年,他对这件事是有点怀疑的 如果你成为了伯克希尔的CEO,未来要拿出500亿美金allocate(分配)到AGI行业,你会怎么allocate这笔钱? 真正的危险,不是一个类似微信的东西打败了微信,而是一个不一样的东西打败了微信 恰好这个时代,做上限更高的事更好【更多信息】文字版同步上线文字版请前往公众号:语言即世界language is world
    --------  
    2:31:32
  • 114. 与殷一、欧迪聊聊萨洛蒙:中国意外的增长阀门、小众越野跑与少女故事
    今天的嘉宾是萨洛蒙中国区总经理殷一和小红书商业服饰潮流行业负责人欧迪。我们一起来聊聊,这两年比较火的一个户外品牌,萨洛蒙。萨洛蒙和始祖鸟都属于亚玛芬集团,2019年亚玛芬被安踏收购;2021年以后,萨洛蒙这个70多岁的法国品牌,意外在中国开启了增长之路。这个最早从滑雪品类起步,逐步扩展到越野跑鞋的小众品牌,在中国的传统消费群体以男性以及专业滑雪、越野跑爱好者为主;但近几年,他们通过在小红书的一系列品牌行为,成功吸引女性消费群体和新户外人群,扩圈增长,而这又进一步反向刺激了男性消费者以及核心运动人群的增长。希望这些新鲜的品牌知识,也能给你带来新的启发:)02:00 两位嘉宾的自我介绍03:06 萨洛蒙1947年诞生于法国,雪是DNA里最深的那道烙印04:39 我们曾经被阿迪达斯收购,阿迪达斯帮我们做了sports style06:04 越野跑核心人群,十年前只有10万人,今年也是10万人,区别是什么?11:52 品牌应该从小众走向大众,还是从大众走向小众?16:22 2019年母公司亚玛芬被安踏收购后,萨洛蒙发生了什么?18:07 中国女性占比最高接近七成,现在是六成不到20:45 女性对男性的拉新高于男性对女性的拉新23:21 2021年以后,越来越多海外户外品牌主动地集中进入中国27:31 小红书帮萨洛蒙拓展人群:“尖货尝新档”和“色彩敏感控”34:55 以人为主体的品牌策略:找到“超级用户代表”43:26 10年前我们做品牌会更注重the winning moments,现在更注重成长的过程和细节45:37 萨门少女背后的消费者洞察:女性不再追求仪式感的堆叠,更追求内心的松弛48:36 结合小红书和安福路萨洛蒙门店,线上和线下循环流量55:24 萨洛蒙拉新女性消费者,又反哺了男性消费者的增长58:16 如果一个非常男性化的品牌想要女性化,应该怎么做?01:00:43 潮流化会不会削弱专业户外基因?01:01:33 年轻人消费新变化01:08:05 当做AI品牌也像做消费品品牌,从品牌角度给AI创始人一些建议分享一下漂亮的录制现场:
    --------  
    1:18:27
  • 113. 和杨植麟时隔1年的对话:K2、Agentic LLM、缸中之脑和“站在无限的开端”
    今天的嘉宾是月之暗面创始人兼CEO杨植麟,距离他上一次来我们的节目(《商业访谈录》59集)已经过去1年半。就在刚刚过去的7月,Kimi K2模型发布,引发了比较广泛的关注。K2是一个基于MoE架构的开源编程和Agentic大语言模型。形象来说,模型借助编程能力走出封闭的“缸中之脑”,长出了“手”,开始操控外部数字世界。今天这集节目我和杨植麟聊了聊K2的研发和他当下的技术认知、技术判断。以及,在过去一年的舆论风暴与创业起伏中,作为创始人,他的心情与思考。01:49 一座无限的山这有点像我最近在看的一本书:The Beginning of Infinity(无穷的开始)也许有一天会发现,这座雪山没有尽头,我希望它一直没有尽头但它还是一个“缸中之脑”:想象一个鱼缸,你把一个脑子放在里面,跟外界没有联系不管是基于长思考的强化学习,还是Agent的强化学习,都指向同一个东西:test-time scaling(测试时扩展)还有一个很有意思的趋势是,现在有更多模型公司去做“一方的Agent产品”L1到L5不一定是串行关系,Claude就bet这一点:它在Reasoning上做得不是特别多,但在Agent上做得非常好只有当模型参与到开发过程,才能解锁真正的Innovator(L4)阶段24:58 K2是乔戈里峰K2的重点有几个:一,我们希望它是一个非常好的基础模型我们希望能最大化使用每一份数据,就是所谓token efficiency——喂一样多的数据,“脑子”长得更多我们会对数据做很多Rephrase(改写)操作我们很关注Muon优化器,它对token efficiency提升很大二,我们希望K2有好的Agentic能力,对于Agentic模型来讲,最大挑战是模型的泛化它可能是一个从“缸中之脑”变成可以跟世界交互,因为所谓Agent最重要的特征是,可以多轮地使用工具人是所谓的universal constructor(万能构造器)有一种潜在思路,需要用更AI native(原生人工智能)的方式去训练AIMuon你去训的时候,它会炸54:08 既简单又复杂的系统为什么Kimi从闭源转向开源?模型训练完成,产品也基本完成了,做交互上的改进当然有价值,但那是锦上添花的一步多模态不损伤“脑子”已经很好了你可能学出来的多模态是个“傻的多模态”,我们希望它是个“聪明的多模态”Scaling Law遇到数据墙了,这是客观事实数据飞轮很依赖外部环境的feedback(反馈),我们不希望feedback有很多噪声,但现在没有把这个问题解决得非常好现在看起来,基于FLOPs的scaling是更有效路径,但这个平衡什么时候会发生变化?很多Long Context架构会影响“智商”纯粹的Linear Attention(线性注意力机制)可能影响智商,因为这个架构会有一些bias(偏差)基座模型公司和做Agent产品的应用公司,长期看边界在哪?今天怎么思考商业模式?API是好生意吗?Kimi能赚钱吗?01:25:05 在自己的故事里面Tim(周昕宇)天天跟我讲——要用RL的方式去管理,而不是用SFT用RL管理团队最大问题是,你容易被hack很多复杂性都是人为强行加上去的,实际并没有那么复杂只能说是在自己的这个故事里面——你不断地感受自己到底是什么样的一个人,你为什么要做这个事情这个问题我也问过Kimi,他说,AI是“人类文明的放大器”这也是Kimi跟我讲的——任何中间状态都有可能成为被批评的对象肯定有恐惧,更多要关注你当前这一步,能做什么?——想这个问题更重要2024年对杨植麟的访谈:《和杨植麟聊大模型创业这一年:人类理想的增量、有概率的非共识和Sora》【更多信息】文字和视频版同步上线文字版请前往公众号:语言即世界language is world视频版请前往Bilibili:张小珺商业访谈录
    --------  
    1:41:13

More Business podcasts

About 张小珺Jùn|商业访谈录

努力做中国最优质的科技、商业访谈。 张小珺:财经作者,写作中国商业深度报道,范围包括AI、科技巨头、风险投资和知名人物,也是播客《张小珺Jùn | 商业访谈录》制作人。 如果我的访谈能陪你走一段孤独的未知的路,也许有一天可以离目的地更近一点,我就很温暖:)
Podcast website

Listen to 张小珺Jùn|商业访谈录, The Code To Winning and many other podcasts from around the world with the radio.net app

Get the free radio.net app

  • Stations and podcasts to bookmark
  • Stream via Wi-Fi or Bluetooth
  • Supports Carplay & Android Auto
  • Many other app features
Social
v7.23.10 | © 2007-2025 radio.de GmbH
Generated: 10/28/2025 - 5:20:43 PM