Satellite Embedding V1

GOOGLE/SATELLITE_EMBEDDING/V1/ANNUAL
数据集可用时间
2017-01-01T00:00:00Z–2024-01-01T00:00:00Z
数据集提供方
Earth Engine 片段
ee.ImageCollection("GOOGLE/SATELLITE_EMBEDDING/V1/ANNUAL")
标签
annual global google landsat-derived satellite-imagery sentinel1-derived sentinel2-derived

说明

Google Satellite Embedding 数据集是一个全球性的、可用于分析的地理空间嵌入学习集合。此数据集中的每个 10 米像素都是一个 64 维表示形式,或“嵌入向量”,用于编码单个日历年内各种地球观测仪器和数据集在相应像素及其周围测量的地表条件的时间轨迹。与波段对应于物理测量的传统光谱输入和指数不同,嵌入是特征向量,以不太直观但更强大的方式总结多源、多模态观测结果之间的关系。 查看用法示例和更详细的说明

该数据集涵盖陆地表面和浅水区,包括潮间带和珊瑚礁带、内陆水道和沿海水道。极地地区的覆盖范围受卫星轨道和仪器覆盖范围的限制。

该数据集包含的图片覆盖了大约 163,840 米 x 163,840 米的区域,每张图片有 64 个波段 {A00, A01, …, A63},对应于 64 维嵌入空间的每个轴。所有频段都应用于下游分析,因为它们共同表示嵌入空间中的 64 维坐标,无法单独解释。

所有图片均以其本地通用横轴墨卡托投影生成(如 UTM_ZONE 属性所示),并且具有 system:time_startsystem:time_end 属性,这些属性反映了嵌入所汇总的日历年;例如,2021 年的嵌入图片将具有等于 ee.Date('2021-01-01 00:00:00')system:start_time 和等于 ee.Date('2022-01-01 00:00:00')system:end_time

嵌入向量的长度为单位长度,这意味着它们的模为 1,不需要任何额外的归一化处理,并且分布在单位球体上,因此非常适合与聚类算法和基于树的分类器搭配使用。嵌入空间在不同年份之间也保持一致,并且可以通过考虑两个嵌入向量之间的点积或角度,将不同年份的嵌入用于条件变化检测。此外,这些嵌入还具有线性可组合性,也就是说,它们可以聚合以生成空间分辨率较低的嵌入,也可以通过向量算术进行转换,但仍会保留其语义含义和距离关系。

卫星嵌入数据集由 AlphaEarth Foundations 生成,这是一个地理空间嵌入模型,可同化多个数据流,包括光学、雷达、LiDAR 和其他来源(Brown、Kazmierski、Pasquarella 等人,正在审核中;预印版可在此处获取)。

由于表示形式是通过多个传感器和图像学习的,因此嵌入表示形式通常可以克服云、扫描线、传感器伪影或数据缺失等常见问题,从而提供可直接用于分类、回归和变化检测分析的无缝分析就绪型特征,以替代其他地球观测图像源。

此图片集中的嵌入是使用 AlphaEarth Foundations 模型(版本 2.1)生成的,与 AlphaEarth Foundations 论文中评估的 2.0 版模型相比,该模型在多个方面有所改进。具体而言,重新生成了训练数据集,以纳入之前因传感器覆盖范围有限而被舍弃的大量南极洲样本,从而将训练视频序列的数量从 840 多万个有效增加到 1,010 多万个序列;在训练期间,将美国农业部 NASS Cropland Data Layer 纳入为额外的目标;将 NLCD 和 CDL 的损失权重从 0.50 降低到 0.25;并实施了其他几项细微更改,以更好地缓解与输入传感器条带、平铺和多分辨率像素目标相关联的视觉伪影。这些更改并未显著影响模型在评估指标方面的性能,但总体上提高了所得嵌入的质量。

虽然仍存在一些大规模条带和数据可用性伪影,但这些伪影通常表示较小的矢量偏移,一般不会对下游处理或结果产生显著影响。

频段

Pixel Size
10 米

波段

名称 单位 最小值 最大值 像素尺寸 说明
A00 无量纲 -1 1

嵌入向量的第 0 个轴。

A01 无量纲 -1 1

嵌入向量的第 1 个轴。

A02 无量纲 -1 1

嵌入向量的第 2 个轴。

A03 无量纲 -1 1

嵌入向量的第 3 个轴。

A04 无量纲 -1 1

嵌入向量的第 4 个轴。

A05 无量纲 -1 1

嵌入向量的第 5 个轴。

A06 无量纲 -1 1

嵌入向量的第 6 个轴。

A07 无量纲 -1 1

嵌入向量的第 7 个轴。

A08 无量纲 -1 1

嵌入向量的第 8 个轴。

A09 无量纲 -1 1

嵌入向量的第 9 个轴。

A10 无量纲 -1 1

嵌入向量的第 10 个轴。

A11 无量纲 -1 1

嵌入向量的第 11 个轴。

A12 无量纲 -1 1

嵌入向量的第 12 个轴。

A13 无量纲 -1 1

嵌入向量的第 13 个轴。

A14 无量纲 -1 1

嵌入向量的第 14 个轴。

A15 无量纲 -1 1

嵌入向量的第 15 个轴。

A16 无量纲 -1 1

嵌入向量的第 16 个轴。

A17 无量纲 -1 1

嵌入向量的第 17 个轴。

A18 无量纲 -1 1

嵌入向量的第 18 个轴。

A19 无量纲 -1 1

嵌入向量的第 19 个轴。

A20 无量纲 -1 1

嵌入向量的第 20 个轴。

A21 无量纲 -1 1

嵌入向量的第 21 个轴。

A22 无量纲 -1 1

嵌入向量的第 22 个轴。

A23 无量纲 -1 1

嵌入向量的第 23 个轴。

A24 无量纲 -1 1

嵌入向量的第 24 个轴。

A25 无量纲 -1 1

嵌入向量的第 25 个轴。

A26 无量纲 -1 1

嵌入向量的第 26 个轴。

A27 无量纲 -1 1

嵌入向量的第 27 个轴。

A28 无量纲 -1 1

嵌入向量的第 28 个轴。

A29 无量纲 -1 1

嵌入向量的第 29 个轴。

A30 无量纲 -1 1

嵌入向量的第 30 个轴。

A31 无量纲 -1 1

嵌入向量的第 31 个轴。

A32 无量纲 -1 1

嵌入向量的第 32 个轴。

A33 无量纲 -1 1

嵌入向量的第 33 个轴。

A34 无量纲 -1 1

嵌入向量的第 34 个轴。

A35 无量纲 -1 1

嵌入向量的第 35 个轴。

A36 无量纲 -1 1

嵌入向量的第 36 个轴。

A37 无量纲 -1 1

嵌入向量的第 37 个轴。

A38 无量纲 -1 1

嵌入向量的第 38 个轴。

A39 无量纲 -1 1

嵌入向量的第 39 个轴。

A40 无量纲 -1 1

嵌入向量的第 40 个轴。

A41 无量纲 -1 1

嵌入向量的第 41 个轴。

A42 无量纲 -1 1

嵌入向量的第 42 个轴。

A43 无量纲 -1 1

嵌入向量的第 43 个轴。

A44 无量纲 -1 1

嵌入向量的第 44 个轴。

A45 无量纲 -1 1

嵌入向量的第 45 个轴。

A46 无量纲 -1 1

嵌入向量的第 46 个轴。

A47 无量纲 -1 1

嵌入向量的第 47 个轴。

A48 无量纲 -1 1

嵌入向量的第 48 个轴。

A49 无量纲 -1 1

嵌入向量的第 49 个轴。

A50 无量纲 -1 1

嵌入向量的第 50 个轴。

A51 无量纲 -1 1

嵌入向量的第 51 个轴。

A52 无量纲 -1 1

嵌入向量的第 52 个轴。

A53 无量纲 -1 1

嵌入向量的第 53 个轴。

A54 无量纲 -1 1

嵌入向量的第 54 个轴。

A55 无量纲 -1 1

嵌入向量的第 55 个轴。

A56 无量纲 -1 1

嵌入向量的第 56 个轴。

A57 无量纲 -1 1

嵌入向量的第 57 个轴。

A58 无量纲 -1 1

嵌入向量的第 58 个轴。

A59 无量纲 -1 1

嵌入向量的第 59 个轴。

A60 无量纲 -1 1

嵌入向量的第 60 个轴。

A61 无量纲 -1 1

嵌入向量的第 61 个轴。

A62 无量纲 -1 1

嵌入向量的第 62 个轴。

A63 无量纲 -1 1

嵌入向量的第 63 个轴。

图片属性

图像属性

名称 类型 说明
MODEL_VERSION STRING

唯一标识用于生成图片的模型版本的版本字符串。

PROCESSING_SOFTWARE_VERSION STRING

用于唯一标识用于生成映像的模型数据处理软件的版本字符串。

UTM_ZONE STRING

用于生成图片的坐标参考系的 UTM 带。

DATASET_VERSION STRING

数据集版本。

使用条款

使用条款

此数据集已获得 CC-BY 4.0 许可,并要求提供以下提供方信息:“AlphaEarth Foundations 卫星嵌入数据集由 Google 和 Google DeepMind 制作。”

引用

引用:
  • Brown, C. F.、Kazmierski, M. R., Pasquarella, V J.、Rucklidge, W. J., Samsikova, M.、Zhang, C.、Shelhamer, E.、Lahera, E.、Wiles, O.、 Ilyushchenko, S.、Gorelick, N.、Zhang, L. L., Alj, S.、Schechter, E., Askay, S.、Guinan, O.、Moore, R.、Boukouvalas, A.,& Kohli, P.(2025). AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data. arXiv preprint arXiv.2507.22291. doi:10.48550/arXiv.2507.22291

通过 Earth Engine 探索

代码编辑器 (JavaScript)

// Load collection.
var dataset = ee.ImageCollection('GOOGLE/SATELLITE_EMBEDDING/V1/ANNUAL');

// Point of interest.
var point = ee.Geometry.Point(-121.8036, 39.0372);

// Get embedding images for two years.
var image1 = dataset
      .filterDate('2023-01-01', '2024-01-01')
      .filterBounds(point)
      .first();

var image2 = dataset
      .filterDate('2024-01-01', '2025-01-01')
      .filterBounds(point)
      .first();

// Visualize three axes of the embedding space as an RGB.
var visParams = {min: -0.3, max: 0.3, bands: ['A01', 'A16', 'A09']};

Map.addLayer(image1, visParams, '2023 embeddings');
Map.addLayer(image2, visParams, '2024 embeddings');

// Calculate dot product as a measure of similarity between embedding vectors.
// Note for vectors with a magnitude of 1, this simplifies to the cosine of the
// angle between embedding vectors.
var dotProd = image1
    .multiply(image2)
    .reduce(ee.Reducer.sum());

// Add dot product to the map.
Map.addLayer(
  dotProd,
  {min: 0, max: 1, palette: ['white', 'black']},
  'Similarity between years (brighter = less similar)'
);

Map.centerObject(point, 12);
Map.setOptions('SATELLITE');
在代码编辑器中打开