iOS'te kullanıcının ortamını anlama

Scene Semantics API'yi kendi uygulamalarınızda nasıl kullanacağınızı öğrenin.

Scene Semantics API, geliştiricilerin ML modeline dayalı, gerçek zamanlı anlamsal bilgiler sağlayarak kullanıcıyı çevreleyen sahneyi anlamalarına olanak tanır. API, açık hava sahnesinin bir resmi verildiğinde gökyüzü, bina, ağaç, yol, kaldırım, araç, kişi ve daha fazlası gibi yararlı bir dizi anlamsal sınıfta her piksel için bir etiket döndürür. Scene Semantics API, piksel etiketlerine ek olarak her piksel etiketi için güven değerleri ve belirli bir etiketin açık hava sahnesindeki yaygınlığını sorgulamanın kolay bir yolunu da sunar.

Soldan sağa doğru giriş resmi örnekleri, piksel etiketlerinin anlamsal resmi ve ilgili güven resmi:

Giriş resmi, semantik resim ve semantik güven resmi örneği.

Ön koşullar

Devam etmeden önce temel AR kavramlarını ve ARCore oturumunu nasıl yapılandıracağınızı anladığınızdan emin olun.

Sahne semantiğini etkinleştirme

Yeni bir ARCore oturumunda, kullanıcının cihazının Scene Semantics API'yi destekleyip desteklemediğini kontrol edin. ARCore uyumlu cihazların tümü, işlem gücü kısıtlamaları nedeniyle Scene Semantics API'yi desteklemez.

Kaynak tasarrufu sağlamak için ARCore'da sahne semantikleri varsayılan olarak devre dışıdır. Uygulamanızın Scene Semantics API'yi kullanması için anlamsal modu etkinleştirin.

GARSessionConfiguration *configuration = [[GARSessionConfiguration alloc] init];
if ([self.garSession isSemanticModeSupported:GARSemanticModeEnabled]) {
    configuration.semanticMode = GARSemanticModeEnabled;
}

NSError *error;
[self.garSession setConfiguration:configuration error:&error];

Semantik resmi alma

Sahne semantikleri etkinleştirildikten sonra semantik resim alınabilir. Anlamsal görüntü, her pikselin GARSemanticLabel tarafından tanımlanan bir anlamsal etikete karşılık geldiği bir kCVPixelFormatType_OneComponent8 görüntüdür.

Semantik resmi almak için GARFrame.semanticImage öğesini kullanın:

CVPixelBuffer semanticImage = garFrame.semanticImage;
if (semanticImage) {
    // Use the semantic image here
} else {
    // Semantic images are not available.
    // The output image may be missing for the first couple frames before the model has had a
    // chance to run yet.
}

Çıkışta anlamsal görüntüler, cihaza bağlı olarak oturumun başlangıcından yaklaşık 1-3 kare sonra kullanılabilir.

Güven resmini alma

API, her piksel için etiket sağlayan semantik görüntüye ek olarak, ilgili piksel güven değerlerinin güven görüntüsünü de sağlar. Güvenilirlik resmi, her pikselin [0, 255] aralığındaki bir değere karşılık geldiği bir kCVPixelFormatType_OneComponent8 görüntüsüdür. Bu değer, her pikselin semantik etiketiyle ilişkili olasılığa karşılık gelir.

Semantik güven resmini almak için GARFrame.semanticConfidenceImage öğesini kullanın:

CVPixelBuffer confidenceImage = garFrame.semanticConfidenceImage;
if (confidenceImage) {
    // Use the semantic image here
} else {
    // Semantic images are not available.
    // The output image may be missing for the first couple frames before the model has had a
    // chance to run yet.
}

Çıkış güvenilirlik resimleri, cihaza bağlı olarak oturumun başlangıcından yaklaşık 1-3 kare sonra kullanılabilir.

Semantik etiket için piksellerin oranını sorgulayın

Mevcut karedeki belirli bir sınıfa (ör. gökyüzü) ait piksellerin oranını da sorgulayabilirsiniz. Bu sorgu, semantik resmi döndürüp belirli bir etiket için piksel bazında arama yapmaktan daha verimlidir. Döndürülen kesirli sayı, [0.0, 1.0] aralığındaki bir kayan noktalı değerdir.

Belirli bir etiketin kesirli kısmını almak için fractionForSemanticLabel: değerini kullanın:

// Ensure that semantic data is present for the GARFrame.
if (garFrame.semanticImage) {
    float fraction = [garFrame fractionForSemanticLabel:GARSemanticLabelSky];
}