Spatial Intelligence

Spatial intelligence is the ability to understand, reason with, and manipulate visual and spatial information, involving perceiving the world in 3D, visualizing objects from different angles, and understanding relationships between shapes, lines, and space, crucial for tasks like navigation, design (architecture, engineering), and even everyday activities like parking.

Posts

Jul 8, 2026
Lift3D-VLA：让机器人"看懂"三维空间的视觉-语言-动作模型
Jul 7, 2026
MV-Forcing：用 4D 几何桥接突破长时序多视角视频生成
Jul 6, 2026
从太空"抓住"GPS干扰机：准直接定位（QDG）算法详解
Jul 4, 2026
用 ADK 构建 Google Earth Engine 智能遥感分析 Agent
Jul 2, 2026
5G/6G 一体化感知通信（ISAC）：Rician 信道下的波束成形性能极限
Jul 1, 2026
PointSplat：面向直播流的紧凑人体 3D 高斯表示
Jun 30, 2026
GaussDet：让 2D 开放词汇检测器为 3D 高斯做语义定位
Jun 29, 2026
具身多智能体协作：让 LLM 智能体从失败中学习合作规律
Jun 29, 2026
遥感图像变化描述：用大模型后训练理解"地球的变化"
Jun 27, 2026
Error-Conditioned Neural Solvers：让神经网络"读懂"自己的错误
Jun 17, 2026
FR3D: 让自动驾驶"看见"未来的3D世界模型
Jun 16, 2026
多机器人分布式 SLAM：用场景图匹配降低 90% 通信开销
Jun 13, 2026
AFDM：用"啁啾"子载波征服双选择性信道
Jun 12, 2026
从单目视频到动态 4D 场景：Flex4DHuman 技术深度解析
Jun 12, 2026
异构 LiDAR 融合与智能重排序：让机器人在葡萄园里不迷路
Jun 11, 2026
VLGA：用密集点图监督让自动驾驶大模型真正理解3D空间
Jun 10, 2026
用复值 VAE 检测海杂波中的雷达目标
Jun 10, 2026
多 UGV 分布式协作探索：LiDAR 描述子、回环感知与层次化规划
Jun 8, 2026
超越 mAP：用 DnD 集合运算直接比较目标检测模型
Jun 7, 2026
CBS：让扩散模型"按需分配"算力的时间切分策略
Jun 6, 2026
无 GPS 机器人全局定位：Meridian 跨视角语义几何原语匹配
May 30, 2026
GAVIS：用球谐函数量化 3DGS 可见性，实现实时不确定性建图
May 26, 2026
AnyScene：从 BEV 布局到可控驾驶场景生成的完整框架
May 25, 2026
PGT：用程序化几何图元治好多模态大模型的"空间失明症"
May 24, 2026
SegCompass：用稀疏自编码器打开推理分割的"黑盒子"
May 23, 2026
用 AlphaEarth 地理空间嵌入做作物识别：卫星遥感语义分割实战
May 21, 2026
卫星图像变化归因：嵌入向量的比较方式决定了你能看见什么
May 20, 2026
TrajTok：GPS 轨迹的自适应六边形 Tokenization 与迁移学习
May 19, 2026
WorldString：物体状态流形的可动作化世界表示
May 16, 2026
用图谱特征去噪：让事件相机真正"看清楚"
May 13, 2026
VECA：用弹性核心注意力打破 Vision Transformer 的二次复杂度瓶颈
May 12, 2026
地理空间 3D 数据实战：Shapefile 解析、坐标变换与地理参考模型构建
May 10, 2026
LiVeAction：边缘设备的非对称神经编解码器，让传感器数据压缩不再两难
May 9, 2026
联合目标数量与波达方向估计：将信息论准则融入正交最小二乘
May 6, 2026
RD-ViT：用循环深度 Transformer 打破医学分割的数据瓶颈
May 5, 2026
DynoSLAM：用图神经网络让机器人在人群中安全导航
May 4, 2026
注视估计新范式：GMGaze 如何用语义原型、早期融合与稀疏 MoE 突破三大瓶颈
May 3, 2026
PhyCo：让视频生成模型真正"懂"物理——可控物理先验的生成运动
May 3, 2026
LiDAR 传感器遮挡预测：交互式动态贝叶斯网络的工程实践
May 2, 2026
用 Fréchet 距离训练生成模型：FD-loss 原理与实现
May 1, 2026
无约束图像稀疏视角 3D 重建：GenWildSplat 深度解析
May 1, 2026
HERMES++：统一 3D 场景理解与未来几何预测的自动驾驶世界模型
Apr 30, 2026
单张贴纸图像个性化生成：SEAL 如何同时克服背景污染与结构僵化
Apr 29, 2026
MIMO 雷达 Doppler 鲁棒波形设计：SQNGD 框架详解
Apr 27, 2026
稀疏影像的 3D 重建：MegaDepth-X 如何突破互联网长尾场景
Apr 27, 2026
从遮挡单视图检索 3D 形状：PASR 的分析-合成框架
Apr 26, 2026
AI 图像生成与真伪鉴别的协同进化：UniGenDet 统一框架详解
Apr 25, 2026
Vista4D：用4D点云实现动态视频的新视角重拍
Apr 25, 2026
地理信号如何驱动车险风险建模：从 OpenStreetMap 到视觉 Transformer
Apr 23, 2026
用 Sentinel-1 SAR 时序数据监测全球海上风电：从雷达信号到生命周期识别
Apr 22, 2026
AnyRecon：从任意稀疏视角重建大规模 3D 场景
Apr 17, 2026
LLM 的推理泛化极限：最短路径问题的系统性研究
Apr 16, 2026
UAV微小目标检测：DroneScan-YOLO如何解决三大系统性失效
Apr 16, 2026
流式 3D 重建的几何上下文 Transformer：让实时建图真正可用
Apr 15, 2026
RMGS-SLAM：多传感器高斯泼溅实时建图的工程之道
Apr 15, 2026
城市热岛逆问题：用扩散模型生成多样化降温植被方案
Apr 14, 2026
GenTac：用扩散模型生成足球战术轨迹
Apr 14, 2026
非鲁棒教师也能教出鲁棒性：测试时对抗适应新范式
Apr 12, 2026
Scal3R：大规模场景3D重建的测试时训练方案
Apr 12, 2026
ETCH-X：从着装人体点云到 SMPL-X 的鲁棒拟合
Apr 11, 2026
GaussiAnimate：用 Skelebones 系统为 4D 高斯角色绑定可控骨架
Apr 9, 2026
Fast Spatial Memory：用弹性测试时训练实现可扩展 4D 重建
Apr 7, 2026
ZeD-MAP：用 Bundle Adjustment 引导零样本深度扩散模型实现实时无人机三维重建
Apr 7, 2026
大模型少输出反而更快：多智能体推理框架的反直觉洞见
Apr 6, 2026
无人机热成像地理定位：跨模态视觉导航的工程实践
Mar 31, 2026
MRI 到 CT 图像合成：Drifting Model 的一步推理原理与实践
Mar 30, 2026
用 Google Earth Engine 监测野火：从卫星光谱到火烧频率图
Mar 28, 2026
欠定盲源分离：量子深度图像先验解锁多光谱解混
Mar 25, 2026
Light-UNETR：医学3D图像分割的轻量化Transformer设计
Mar 22, 2026
基于 Rectified Flow Matching 的雷达目标检测：D-RFM 方法详解
Mar 22, 2026
用城市 5G 基站网络测降雨：分布式机会雷达的信号处理原理
Mar 20, 2026
单目铰接体三维重建：MonoArt 的渐进式结构推理
Mar 18, 2026
MessyKitchens：接触感知的多目标三维场景重建
Mar 18, 2026
永冻土融化预测：从3D点云到2D预测图的垂直结构保留
Mar 10, 2026
HiAR：层次化降噪解决长视频自回归生成的误差积累
Mar 10, 2026
SEER：让医学 3D 影像分割读懂多变的临床语言
Mar 8, 2026
统计最优性不唯一：四种不相容的预测推断可容许性几何
Mar 7, 2026
分布式多目标跟踪中的标签劫持：当传感器网络的身份机制被欺骗
Feb 27, 2026
物理启发的粘性价值表示：攻克离线目标条件强化学习
Feb 27, 2026
镜面反射不再是敌人：用高光线索提升目标分割精度
Feb 27, 2026
VGG-T³：线性时间复杂度的大规模 3D 重建
Feb 25, 2026
冷冻电镜膜结构分析：从 ROI 分割到曲率量化的完整 Pipeline
Feb 25, 2026
无人机林业中的逐枝深度优化：DEFOM-Stereo 与 SAM3 联合分析
Feb 24, 2026
OFDM 雷达突破距离限制：从"信号干扰"到"干扰清洗"
Feb 24, 2026
深度增强的铁路道床检测：YOLO-SAM2 如何从"看得见"到"看得准"
Feb 24, 2026
DefenseSplat：让 3D 高斯泼溅对抗攻击防不胜防
Feb 23, 2026
自主扩散模型的几何奥秘：为什么不需要噪声条件
Feb 23, 2026
SARAH：空间感知的实时对话虚拟人
Feb 22, 2026
OpenEarthAgent：用 AI Agent 做遥感影像分析
Feb 20, 2026
接触锚点里程计：让四足机器人不靠视觉也能精准定位
Feb 18, 2026
雷达图像地形变化检测：物理先验与异常检测的融合
Feb 17, 2026
无 GNSS 导航：基于深度卷积网络的 UAV 地标实时提取
Feb 16, 2026
FlexAM：外观-运动解耦的视频生成控制
Feb 16, 2026
LongStream：千帧级序列的流式 3D 重建
Feb 14, 2026
3DGSNav：用 3D 高斯泼溅让 VLM "看懂"环境的物体导航
Feb 13, 2026
EO-VAE：统一多传感器的地球观测数据编码器
Feb 13, 2026
从少量 2D MRI 切片重建时序 3D 主动脉：可微网格优化的实践指南
Feb 13, 2026
6G 赋能未来机器人：从通信到协作的技术演进
Feb 2, 2026
自动驾驶轨迹规划：用扩散模型实现安全自适应决策
Jan 26, 2026
自监督视觉几何定位：GPA-VGGT大规模场景位姿估计详解
Jan 23, 2026
SE2(3)李群扩展卡尔曼滤波器：高精度导航系统的自治性改进实战
Jan 6, 2026
Yukthi Opus：多链混合元启发式算法详解与实现
Jan 6, 2026
分布式深度学习的统一框架：从放置语义理解并行策略