NotebookLM Source Pack v2:Long Podcast(厚 source / 强 storyline / 轻 prompt)

0) 目标

这版不是“3 篇新 paper 解说”,而是一个可支撑 35-50 分钟中文长播客 的 source pack:

  • 以前沿 A/B/C 为入口:2603.060012603.058682603.06480
  • 追加 8 篇来自 reference graph 的 older/foundational anchors
  • 补入 3 条 books 概念节选(source note 风格)
  • 给 NotebookLM 只提供高层叙事方向,不做过细束缚

1) Frontier 入口(必选)

  1. A: 2603.06001 IGAR
  2. C: 2603.05868 AnyCamVLA
  3. B: 2603.06480 History-conditioned Token Pruning
  4. C Storyline v2 Longform
  5. C Deep Read Brief

2) Older / Foundational 补强(来自 reference graph)

这 8 篇用于把节目从“今日三篇”拉长为“近三年 VLA 部署可靠性演化史”。

A/C shared anchors(同代基座,共同被引用)

  1. RT-1 (2212.06817) — https://arxiv.org/abs/2212.06817
  2. Octo (2405.12213) — https://arxiv.org/abs/2405.12213
  3. pi0 (2410.24164) — https://arxiv.org/abs/2410.24164
  4. Fine-tuning VLA (2502.19645) — https://arxiv.org/abs/2502.19645
  5. GR00T N1 (2503.14734) — https://arxiv.org/abs/2503.14734
  6. LIBERO-Plus (2510.13626) — https://arxiv.org/abs/2510.13626

B efficiency/navigation 支线 anchors

  1. VL-Nav (2502.00931) — https://arxiv.org/abs/2502.00931
  2. Unified VLA (2506.19850) — https://arxiv.org/abs/2506.19850

来源:C Citation SubgraphReference Archaeology UpdateReference Graph


3) Books 节选式 source notes(避免生硬堆砌)

仅选“能直接增强播客解释力”的概念,不做大段教科书复述。

Book Note 1 — Manipulator Jacobian & Singularities(机器人学)

  • Source: A Mathematical Introduction to Robotic Manipulation,Chapter 3.4(Manipulator Jacobian)+ 3.4.3(Singularities)
  • Recap(可口播):
    • Jacobian 把“关节速度”映射到“末端速度”,是控制器理解“动作是否可达/可控”的局部几何尺子。
    • 当系统接近奇异位形时,微小观测误差会被放大成大动作偏差。
    • 这正解释了为什么 C(AnyCamVLA)的“视角域对齐”很关键:它降低了观测偏差被控制链条放大的风险。

Book Note 2 — Lyapunov Stability & Tracking(机器人动力学与控制)

  • Source: 同书 Chapter 4.4(Lyapunov Stability)+ 4.5(Position Control and Trajectory Tracking)
  • Recap(可口播):
    • 再聪明的策略,如果闭环稳定性不成立,实际机器人也会在噪声/延迟下漂移。
    • Lyapunov 视角强调“系统是否收敛”,而不仅是单步预测是否正确。
    • 这给 B(token pruning)的评价标准定了调:不能只看速度提升,还要看闭环稳定和轨迹恢复能力是否保住。

Book Note 3 — Planning/Learning Tradeoff under Wrong Models(RL)

  • Source: Reinforcement Learning: An Introduction,Chapter 8.1-8.3(Models and Planning;Integrating Planning, Acting, and Learning;When the Model Is Wrong)
  • Recap(可口播):
    • RL 经典问题不是“要不要模型”,而是“模型错了时怎么优雅退化”。
    • 这与 A(IGAR)和 C(AnyCamVLA)的 test-time patch 精神一致:先在线修偏、再决定是否重训。
    • 也解释了为什么当前阶段应该偏好“可回滚补丁”而非大规模重训练。

4) 推荐节目主线(长播客版)

Act 0(2-3 min)

开场冲突:机器人不是“不会做任务”,而是“在真实世界里经常做错任务”。

Act 1(8-10 min)

第一道门:看见同一个世界(C)

  • 从 camera shift 失效切入
  • 引出观测域对齐为什么是“部署首门槛”

Act 2(10-12 min)

第二道门:听懂同一条指令(A)

  • 语言失活/视觉捷径问题
  • IGAR 的 test-time attention recalibration 作为语义回路修复

Act 3(8-10 min)

第三道门:在同一预算里持续做对(B)

  • 长时程任务为何被 token/时延拖垮
  • pruning 的价值与边界:效率提升不能破坏闭环稳定

Act 4(8-12 min)

历史纵深与路线图(foundational + books)

  • 用 RT-1/Octo/pi0 等 anchors 回答“为什么 A/C 会同时出现”
  • 用 VL-Nav/Unified VLA 解释 B 的独立支线定位
  • 用机器人控制与 RL 教科书概念把“可部署性”讲成系统问题而非论文点子

5) 给 NotebookLM 的高层引导(轻 prompt)

请基于上述全部 sources,生成一个 35-50 分钟中文双人播客脚本大纲

只遵循以下高层要求:

  1. 采用“问题—转折—整合”叙事,不按论文逐篇平铺;
  2. A/B/C 必须作为同一部署链路的三道门(C→A→B)来组织;
  3. 必须自然穿插 foundational anchors(至少 5 篇)与 books 概念(至少 2 条);
  4. 结尾输出可执行的下一步阅读/实验路线(而非空泛总结);
  5. 保持讨论张力与分歧感,避免教科书式单调复述。

不要过度模板化;允许主持人根据 source 自由展开。


6) Host 录制备忘(极简)

  • 不把 B 讲成 A/C 的“同因果后续”,它是效率维度支线。
  • 不把 foundational 变成 citation 点名,应回答“它们如何塑造今天的修补策略”。
  • 不追求术语密度,优先机制直觉 + 系统可执行结论。