全球27.5亿栋建筑
慕尼黑工业大学发布的“GlobalBuildingAtlas”(GBA)数据集估算地球上约有 27.5 亿栋建筑,这个数字远低于联合国估计的 40 亿。该数据集整合了谷歌、OpenStreetMap (OSM)、微软等多个来源的数据,并利用深度学习模型分析卫星图像进行了补充。尽管 GBA 在某些区域的建筑轮廓识别上展现了更高的准确性,但其数据缺乏时效性,无法反映快速建设或拆除的最新情况,这是它的一个关键局限。
全球建筑的新估算
慕尼黑工业大学的研究人员发布了一个名为“GlobalBuildingAtlas” (GBA) 的新数据集,对全球建筑数量提出了新的看法。
- GBA 估算: 全球约有 27.5 亿栋建筑。
- 联合国估算: 此前认为全球约有 40 亿栋建筑。
- 对比 Overture Maps: GBA 的建筑数量比 Overture 2025 年 8 月发布的版本多出约 2.08 亿栋。
该数据集主要由两部分构成:一个是包含建筑轮廓和高度信息的 LoD1 数据集,另一个是体积更为庞大的高度图栅格数据集。
数据从何而来?
GBA 的建筑数据融合了多个现有的大型数据集,并加入了研究团队自己的成果。
- Google (2023): 约 16.2 亿栋,是最大的数据来源。
- OpenStreetMap (OSM, 2025): 约 4.9 亿栋。
- Microsoft (2024): 约 4.3 亿栋。
- ours2: 约 1.36 亿栋,由研究团队利用深度学习模型分析 Planet Labs 卫星影像生成。
- 3dglobfp: 约 6900 万栋,来自一个早期相关的研究。
将研究团队自己的 “ours2” 和 “3dglobfp” 数据源相加,总数约为 2.04 亿栋,这与 GBA 比 Overture 多出的建筑数量(2.08 亿)大致相当。
准确性:进步与不足
在数据准确性方面,GBA 表现出了优劣并存的特点。在北京的一些社区,GBA 的数据在建筑轮廓的精确度上相比旧有数据有了显著提升。然而,在另一些区域,其识别的建筑轮廓仍然存在错误。
对于地图绘制者来说,这意味着需要采取一种“挑拣混合”的方式来清理和使用这些数据。尽管 GBA 可能不是最终的完美方案,但它无疑可以加速地图数据的修正过程。
时效性:一个关键短板
数据集的一个主要问题是缺乏时间戳,导致其无法反映最新的地表变化。
一个典型的例子是中国正在建设的某大型军事指挥中心。必应和 Yandex 的卫星图仍显示该地区几年前的村庄样貌,而 GBA 数据集在此处标记的建筑是陈旧的 OSM 数据,并未反映出该村庄已被拆除、新建筑正在施工的现状。
由于 GBA 没有明确的定期更新计划,在处理建筑活动频繁的区域时,应优先考虑使用更新更及时的 OSM 或 Overture 数据。
各国建筑数量一览
GBA 数据集在划分国界方面表现良好,即使是边境城镇的建筑也能被准确地归属到其所在国家。以下是数据集中建筑数量排名前列的部分国家(四舍五入到百万):
- 印度: 4.67 亿
- 中国: 1.65 亿
- 美国: 1.51 亿
- 巴西: 1.39 亿
- 印度尼西亚: 1.15 亿
- 墨西哥: 8400 万
- 俄罗斯: 7400 万
- 尼日利亚: 6700 万
值得注意的是,美国拥有 1.51 亿栋建筑的数据令人有些意外,因为去年橡树岭国家实验室 (ORNL) 的数据集显示这个数字为 1.31 亿。