本周对周报的栏目做了更为细致的划分,感谢读者G提出的建议!
产品动态
- NVIDIA发布Jetson AGX Thor套件,可提供高达2070 FP4 TFLOPS的AI计算能力和128 GB的内存(产品介绍页 ; 技术博客)
- 动易科技发布首款全身摆线关节人形机器人(演示地址: https://www.bilibili.com/video/BV1Jqh9z1Eb2)
- 灵宝CASBOT发布五指灵巧手CASBOT Handle-L1,展示易损物体、高负载物体、高刚性不规则物体等抓取能力(演示地址: https://www.bilibili.com/video/BV1L3ekz1Euz)
- Boston Dynamics为四足机器人SPOT亮相美国达人秀造势,演示侧空翻能力与训练场景(博文地址: https://bostondynamics.com/blog/spot-takes-the-stage/ ;演示视频: https://www.youtube.com/watch?v=LMPxtcEgtds)
- 镜识科技发布首款模块化工业四足机器人Apollo,配备模块化硬件并可扩展多种部件,单人可在10秒内完成电池更换(演示地址: https://www.bilibili.com/video/BV1WXeXz4ESo ;备注: 该机器人迭代自浙大团队开发的白犀机器人)
- 深圳科创学院孵化项目MakerMods即将上线产品,该初创致力于打造一款USB-C模块化机器人(官网地址: https://makermods.ai/)
投资情况
- 上海氦豚机器人宣布旗下COFE+咖啡机器人完成第五轮VC融资,本轮融资后公司将同步启动B轮融资(官网地址: http://www.cofeplus.com/)
- 工业机器人公司梅卡曼德机器人宣布完成近5亿元新一轮融资,本轮由雄安基金、大洋电机、华创资本等投资(官网地址: https://www.mech-mind.com.cn/)
- 深圳特种机器人公司玄创机器人完成数千万元Pre-A轮融资,本轮融资由东方富海独家投资,云悦资本担任财务顾问(备注: 公司核心团队主要来自哈尔滨工业大学,创始人及CEO为傅喆)
- 核聚变初创公司Commonwealth Fusion Systems (CFS) 获最新一轮8.63亿美元融资,领投方包括NVentures与Alphabet(新闻报道; 备注: 其他聚变领域值得关注的公司 - Helion, TAE Technologies, X-energy)
学术前沿
- 南京大学团队发布具身智能相关综述文章,回顾了具身人工智能系统、物理模拟器、世界模型等内容(文章地址: https://arxiv.org/abs/2507.00917 ;仓库地址)
- 智元机器人罗剑岚与PI创始人Sergey Levine的Human-in-the-loop RL工作,基于RLPD与SAC方法,在短时间真实训练下完成精确装配、动态操控和双臂协调任务(项目地址: https://hil-serl.github.io/ ; 文章地址)
- CMU团队发布三维触觉SLAM系统GelSlAM,可实时追踪物体运动,并且能够以亚毫米级精度重建物体形状(项目地址: https://joehjhuang.github.io/gelslam/)
- ETH Zurich团队提出一种注意力机制驱动的地图编码方法,实现具有泛化能力的足式机器人动态行走,并同时保持基于学习控制器的鲁棒性(演示视频: https://www.bilibili.com/video/BV1X1eSzeEUx ;文章地址: https://arxiv.org/abs/2506.09588)
- UC Berkeley团队发布分层框架HITTER,结合基于模型的球轨迹预测和球拍目标规划器与基于PPO的全身控制器,与人类乒乓球对手完成了多达 106 次连续击球(文章地址: https://arxiv.org/abs/2508.21043 ;演示视频: https://www.youtube.com/watch?v=tOfPKW6D3gE)
- 上海AI Lab团队提出世界模型建模范式PEWM,利用视频模型中的时空视觉先验和VLM的语义感知能力,弥合了细粒度物理交互与高级推理之间的差距(文章地址: https://arxiv.org/abs/2508.20840)
- 清华大学许华哲团队提出用于移动双臂灵巧操控的人机学习框架HERMES,通过构建统一的RL方法将异构人手动作无缝转化为机器人动作,并在各种室外场景中成功执行了多个移动双臂灵巧操作任务(项目地址: https://gemcollector.github.io/HERMES/ ;文章地址: https://arxiv.org/abs/2508.20085)
- 斯坦福大学团队更新了开源小型人形机器人ToddlerBot 2.0,更新优化了相关设计与功能(项目地址: https://toddlerbot.github.io/ ;备注: 最早在2月份的一期周报中就介绍了该机器人的早期版本)
- CMU团队提出自动化积木结构设计搭建框架Prompt-to-Product,通过自然语言提示设计积木结构,并由两台安川机械臂完成搭建(文章地址: https://arxiv.org/abs/2508.21063)
- 庆应大学团队提出机器人自平衡底座Koboshi,通过内置电机驱动内部配重实现半球表面的平衡,同时支持姿态测量与多机通信(文章地址: https://arxiv.org/abs/2508.13509 ;演示视频: https://www.youtube.com/watch?v=u_7nt4eQ1ns)
开源项目
- 一个可部署在本地的通用型物联网AI助手NagaAgent,基于多智能体与多MCP兼容架构(项目地址: https://github.com/Xxiii8322766509/NagaAgent ;演示视频: https://www.bilibili.com/video/BV1G8etzKE8j)
- 一个用于RViz的地图编辑插件map_edit,支持地图编辑功能(项目地址: https://github.com/Tony-tpc/map_edit)
- 一个基于树莓派的开源自动割草机器人OpenMower(项目地址: https://openmower.de/)
- 一个整合了上百种AI工具的资源库AI Engineering Toolkit,按照向量数据库、智能体框架、模型训练等进行了分类(项目地址: https://github.com/Sumanth077/ai-engineering-toolkit)
思维拓展
- 逐际动力创始人张巍关于机器人小脑和技术路线的访谈(文章地址: https://www.qbitai.com/2025/08/326780.html)
- Andrew Ng关于并行Agent相关内容的介绍(博文地址: https://www.deeplearning.ai/the-batch/agents-running-in-parallel-get-there-faster/)
- Google关于大模型调用能耗的技术报告(文章地址: https://cloud.google.com/blog/products/infrastructure/measuring-the-environmental-impact-of-ai-inference/)
- 关于具身智能小团队困境与解决方案的圆桌会议(视频地址: https://www.shenlanxueyuan.com/open/course/292)
- 上海交大ScaleLab设计的AI基础与具身智能入门指南(项目地址: https://scalelab-sjtu.github.io/start.html)