瞭解 iOS 上的使用者環境's 環境

瞭解如何在自己的應用程式中使用 Scene Semantics API

Scene Semantics API 提供以機器學習模型為基礎的即時語意資訊,可讓開發人員瞭解使用者周遭環境。針對戶外場景的圖片,API 會為一系列實用的語意類別 (例如天空、建築物、樹木、道路、人行道、車輛、人形等) 傳回每個像素的標籤。除了像素標籤以外,Scee Semantics API 還提供每個像素標籤的可信度值,以及方便在戶外場景中查詢特定標籤使用率的簡易方法。

從左到右為輸入圖片範例、像素標籤的語意圖片,以及對應的可信度圖片:

輸入圖片、語意圖片和語意可信度圖片範例。

必要條件

請務必瞭解基本 AR 概念 以及如何在繼續操作前設定 ARCore 工作階段

啟用場景語意

新的 ARCore 工作階段中,檢查使用者的裝置是否支援 Scene Semantics API。基於處理電力限制,並非所有與 ARCore 相容的裝置都支援 Scene Semantics API。

為節省資源,ARCore 預設會停用場景語意。啟用語意模式,讓應用程式使用 Scene Semantics API。

GARSessionConfiguration *configuration = [[GARSessionConfiguration alloc] init];
if ([self.garSession isSemanticModeSupported:GARSemanticModeEnabled]) {
    configuration.semanticMode = GARSemanticModeEnabled;
}

NSError *error;
[self.garSession setConfiguration:configuration error:&error];

取得語意圖片

啟用場景語意後,即可擷取語意圖片。語意圖片是 kCVPixelFormatType_OneComponent8 圖片,每個像素都會對應至 GARSemanticLabel 定義的語意標籤。

使用 GARFrame.semanticImage 取得語意圖片:

CVPixelBuffer semanticImage = garFrame.semanticImage;
if (semanticImage) {
    // Use the semantic image here
} else {
    // Semantic images are not available.
    // The output image may be missing for the first couple frames before the model has had a
    // chance to run yet.
}

視裝置而定,在工作階段開始大約需要 1 到 3 個影格後,則應提供輸出語意圖片。

「取得信心」圖片

除了為每個像素提供標籤的語意圖片外,API 還提供對應像素信賴值的可信度圖片。信心圖片是 kCVPixelFormatType_OneComponent8 圖片,每個像素都會對應到 [0, 255] 範圍內的值,對應至與每個像素語意標籤相關的機率。

使用 GARFrame.semanticConfidenceImage 取得語意可信度圖片:

CVPixelBuffer confidenceImage = garFrame.semanticConfidenceImage;
if (confidenceImage) {
    // Use the semantic image here
} else {
    // Semantic images are not available.
    // The output image may be missing for the first couple frames before the model has had a
    // chance to run yet.
}

視裝置而定,應在工作階段開始時大約需要 1 到 3 個影格的時間,才能提供輸出可信度圖片。

查詢語意標籤的像素比例

您也可以查詢目前頁框中屬於特定類別 (例如天空) 的像素比例。這項查詢比傳回語意圖片及執行特定標籤搜尋特定標籤會更有效率。傳回的分數是 [0.0, 1.0] 範圍內的浮點值。

使用 fractionForSemanticLabel: 取得特定標籤的分數:

// Ensure that semantic data is present for the GARFrame.
if (garFrame.semanticImage) {
    float fraction = [garFrame fractionForSemanticLabel:GARSemanticLabelSky];
}