NotebookLM Source Pack v2:Long Podcast(厚 source / 强 storyline / 轻 prompt)
0) 目标
这版不是“3 篇新 paper 解说”,而是一个可支撑 35-50 分钟中文长播客 的 source pack:
- 以前沿 A/B/C 为入口:
2603.06001、2603.05868、2603.06480 - 追加 8 篇来自 reference graph 的 older/foundational anchors
- 补入 3 条 books 概念节选(source note 风格)
- 给 NotebookLM 只提供高层叙事方向,不做过细束缚
1) Frontier 入口(必选)
- A: 2603.06001 IGAR
- C: 2603.05868 AnyCamVLA
- B: 2603.06480 History-conditioned Token Pruning
- C Storyline v2 Longform
- C Deep Read Brief
2) Older / Foundational 补强(来自 reference graph)
这 8 篇用于把节目从“今日三篇”拉长为“近三年 VLA 部署可靠性演化史”。
A/C shared anchors(同代基座,共同被引用)
- RT-1 (
2212.06817) — https://arxiv.org/abs/2212.06817 - Octo (
2405.12213) — https://arxiv.org/abs/2405.12213 - pi0 (
2410.24164) — https://arxiv.org/abs/2410.24164 - Fine-tuning VLA (
2502.19645) — https://arxiv.org/abs/2502.19645 - GR00T N1 (
2503.14734) — https://arxiv.org/abs/2503.14734 - LIBERO-Plus (
2510.13626) — https://arxiv.org/abs/2510.13626
B efficiency/navigation 支线 anchors
- VL-Nav (
2502.00931) — https://arxiv.org/abs/2502.00931 - Unified VLA (
2506.19850) — https://arxiv.org/abs/2506.19850
来源:C Citation Subgraph、Reference Archaeology Update、Reference Graph
3) Books 节选式 source notes(避免生硬堆砌)
仅选“能直接增强播客解释力”的概念,不做大段教科书复述。
Book Note 1 — Manipulator Jacobian & Singularities(机器人学)
- Source: A Mathematical Introduction to Robotic Manipulation,Chapter 3.4(Manipulator Jacobian)+ 3.4.3(Singularities)
- Recap(可口播):
- Jacobian 把“关节速度”映射到“末端速度”,是控制器理解“动作是否可达/可控”的局部几何尺子。
- 当系统接近奇异位形时,微小观测误差会被放大成大动作偏差。
- 这正解释了为什么 C(AnyCamVLA)的“视角域对齐”很关键:它降低了观测偏差被控制链条放大的风险。
Book Note 2 — Lyapunov Stability & Tracking(机器人动力学与控制)
- Source: 同书 Chapter 4.4(Lyapunov Stability)+ 4.5(Position Control and Trajectory Tracking)
- Recap(可口播):
- 再聪明的策略,如果闭环稳定性不成立,实际机器人也会在噪声/延迟下漂移。
- Lyapunov 视角强调“系统是否收敛”,而不仅是单步预测是否正确。
- 这给 B(token pruning)的评价标准定了调:不能只看速度提升,还要看闭环稳定和轨迹恢复能力是否保住。
Book Note 3 — Planning/Learning Tradeoff under Wrong Models(RL)
- Source: Reinforcement Learning: An Introduction,Chapter 8.1-8.3(Models and Planning;Integrating Planning, Acting, and Learning;When the Model Is Wrong)
- Recap(可口播):
- RL 经典问题不是“要不要模型”,而是“模型错了时怎么优雅退化”。
- 这与 A(IGAR)和 C(AnyCamVLA)的 test-time patch 精神一致:先在线修偏、再决定是否重训。
- 也解释了为什么当前阶段应该偏好“可回滚补丁”而非大规模重训练。
4) 推荐节目主线(长播客版)
Act 0(2-3 min)
开场冲突:机器人不是“不会做任务”,而是“在真实世界里经常做错任务”。
Act 1(8-10 min)
第一道门:看见同一个世界(C)
- 从 camera shift 失效切入
- 引出观测域对齐为什么是“部署首门槛”
Act 2(10-12 min)
第二道门:听懂同一条指令(A)
- 语言失活/视觉捷径问题
- IGAR 的 test-time attention recalibration 作为语义回路修复
Act 3(8-10 min)
第三道门:在同一预算里持续做对(B)
- 长时程任务为何被 token/时延拖垮
- pruning 的价值与边界:效率提升不能破坏闭环稳定
Act 4(8-12 min)
历史纵深与路线图(foundational + books)
- 用 RT-1/Octo/pi0 等 anchors 回答“为什么 A/C 会同时出现”
- 用 VL-Nav/Unified VLA 解释 B 的独立支线定位
- 用机器人控制与 RL 教科书概念把“可部署性”讲成系统问题而非论文点子
5) 给 NotebookLM 的高层引导(轻 prompt)
请基于上述全部 sources,生成一个 35-50 分钟中文双人播客脚本大纲。
只遵循以下高层要求:
- 采用“问题—转折—整合”叙事,不按论文逐篇平铺;
- A/B/C 必须作为同一部署链路的三道门(C→A→B)来组织;
- 必须自然穿插 foundational anchors(至少 5 篇)与 books 概念(至少 2 条);
- 结尾输出可执行的下一步阅读/实验路线(而非空泛总结);
- 保持讨论张力与分歧感,避免教科书式单调复述。
不要过度模板化;允许主持人根据 source 自由展开。
6) Host 录制备忘(极简)
- 不把 B 讲成 A/C 的“同因果后续”,它是效率维度支线。
- 不把 foundational 变成 citation 点名,应回答“它们如何塑造今天的修补策略”。
- 不追求术语密度,优先机制直觉 + 系统可执行结论。