SSML (Dialogflow)

Google Asistan'a yanıt verirken Yanıtlarınızda Konuşma Sentezi Biçimlendirme Dili (SSML) kullanılır. Ölçüt SSML kullanarak konuşmanızın yanıtlarının daha doğal görünmesini tıklayın. Aşağıda, bir SSML işaretlemesi örneği ve bu işaretlemenin Google Asistan

SSML
ziyaret edin.
function saySSML(conv) {
  const ssml = '<speak>' +
    'Here are <say-as interpret-as="characters">SSML</say-as> samples. ' +
    'I can pause <break time="3" />. ' +
    'I can play a sound <audio src="https://www.example.com/MY_WAVE_FILE.wav">your wave file</audio>. ' +
    'I can speak in cardinals. Your position is <say-as interpret-as="cardinal">10</say-as> in line. ' +
    'Or I can speak in ordinals. You are <say-as interpret-as="ordinal">10</say-as> in line. ' +
    'Or I can even speak in digits. Your position in line is <say-as interpret-as="digits">10</say-as>. ' +
    'I can also substitute phrases, like the <sub alias="World Wide Web Consortium">W3C</sub>. ' +
    'Finally, I can speak a paragraph with two sentences. ' +
    '<p><s>This is sentence one.</s><s>This is sentence two.</s></p>' +
    '</speak>';
  conv.ask(ssml);
}
JSON
{
  "expectUserResponse": true,
  "expectedInputs": [
    {
      "possibleIntents": [
        {
          "intent": "actions.intent.TEXT"
        }
      ],
      "inputPrompt": {
        "richInitialPrompt": {
          "items": [
            {
              "simpleResponse": {
                "textToSpeech": "<speak>Here are <say-as interpret-as=\"characters\">SSML</say-as> samples. I can pause <break time=\"3\" />. I can play a sound <audio src=\"https://www.example.com/MY_WAVE_FILE.wav\">your wave file</audio>. I can speak in cardinals. Your position is <say-as interpret-as=\"cardinal\">10</say-as> in line. Or I can speak in ordinals. You are <say-as interpret-as=\"ordinal\">10</say-as> in line. Or I can even speak in digits. Your position in line is <say-as interpret-as=\"digits\">10</say-as>. I can also substitute phrases, like the <sub alias=\"World Wide Web Consortium\">W3C</sub>. Finally, I can speak a paragraph with two sentences. <p><s>This is sentence one.</s><s>This is sentence two.</s></p></speak>"
              }
            }
          ]
        }
      }
    }
  ]
}

Ses

SSML, İşlemler simülatöründe desteklenir ancak Dialogflow'da desteklenmez simülatörüdür.

SSML'deki URL'ler

Yalnızca bir URL içeren bir SSML yanıtı tanımlarken, bu URL'de "ve" (&) işareti bulunur XML biçimlendirmesinden kaynaklanan sorunlara neden olabilir. URL'nin doğru bir şekilde başvurulan, & örneklerini &amp; ile değiştirin.

SSML yanıtınız yalnızca bir URL içerse bile, Actions on Google yanıt için görünen metin. Çünkü <audio> etiketinin içindeki metin bir metin veya açıklama ekleyebilirsiniz. Örneğin, Bu koşulu karşılamak için <audio> etiketi kullanın. <audio> etiketinin içindeki metin ve Google'ın Action'ıyla tanıştığında Asistan'ın konuştuğu herkes (SSML'nizin görüntülü metin sürümü için)

Sorunlu bir SSML yanıtı örneğini burada bulabilirsiniz:

<speak>
  <audio src="https://firebasestorage.googleapis.com/v0/b/project-name.appspot.com/o/audio-file-name.ogg?alt=media&token=XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX">
  </audio>
</speak>

Yukarıdaki örnekte, uygun XML biçimlendirmesi için & kod dışına çıkmıyor.

Aynı SSML yanıtının sabit bir sürümü şu şekilde görünür:

<speak>
  <audio src="https://firebasestorage.googleapis.com/v0/b/project-name.appspot.com/o/audio-file-name.ogg?alt=media&amp;token=XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX">
  text
  </audio>
</speak>

SSML öğeleri için destek

Aşağıdaki bölümlerde, İşlemlerinizde kullanılabilecek SSML öğeleri ve seçenekleri açıklanmaktadır.

<speak>

SSML yanıtının kök öğesi.

speak öğesi hakkında daha fazla bilgi edinmek için W3 spesifikasyonuna bakın.

Örnek

<speak>
  my SSML content
</speak>
ziyaret edin.

<break>

Kelimeler arasında duraklatmayı veya başka prosodik sınırları kontrol eden boş bir öğe. Herhangi bir jeton çifti arasında <break> kullanmak isteğe bağlıdır. Kelimeler arasında bu öğe mevcut değilse ara, dilin bağlamına göre otomatik olarak belirlenir.

break öğesi hakkında daha fazla bilgi edinmek için W3 spesifikasyonuna bakın.

Özellikler

Özellik Açıklama
time

Aranın uzunluğunu saniye veya milisaniye cinsinden ayarlar (ör. "3 sn" veya "250 ms").

strength

Çıkışın proozotik aranın gücünü göreceli terimlere göre ayarlar. Geçerli değerler şunlardır: "x-zayıf", zayıf", "orta", "güçlü" ve "x-strong". "none" değeri prosodik ara sınırı çıkmaması gerektiğini belirtir. Bu sınır, işlemcinin aksi halde oluşturacağı prosodik bir arayı önlemek için kullanılabilir. Diğer değerler, jetonlar arasındaki monoton olarak azalan olmayan (kavramsal olarak artan) kırılma gücünü gösterir. Daha güçlü sınırlara genellikle duraklamalar eşlik eder.

Örnek

Aşağıdaki örnekte, adımlar arasında duraklamak için <break> öğesinin nasıl kullanılacağı gösterilmektedir:

<speak>
  Step 1, take a deep breath. <break time="200ms"/>
  Step 2, exhale.
  Step 3, take a deep breath again. <break strength="weak"/>
  Step 4, exhale.
</speak>

<say‑as>

Bu öğe, öğenin içinde bulunan metin yapısının türüyle ilgili bilgileri belirtmenizi sağlar. Ayrıca, içerdiği metni oluşturmak için gereken ayrıntı düzeyinin belirlenmesine de yardımcı olur.

<say‑as> öğesi, değerin nasıl söylendiğini belirleyen gerekli interpret-as özelliğine sahiptir. Belirli interpret-as değerine bağlı olarak isteğe bağlı format ve detail özellikleri kullanılabilir.

Örnekler

interpret-as özelliği aşağıdaki değerleri destekler:

  • currency

    Aşağıdaki örnekte "kırk iki dolar ve bir sent" olarak konuşulmaktadır. Dil özelliği atlanırsa geçerli yerel ayar kullanılır.

    <speak>
      <say-as interpret-as='currency' language='en-US'>$42.01</say-as>
    </speak>
        
  • telephone

    W3C SSML 1.0 özellik değerleri olarak söyle WG notundaki interpret-as='telephone' açıklamasına bakın.

    Aşağıdaki örnekte "bir sekiz sıfır sıfır iki sıfır iki bir iki bir iki" olarak söz konusudur. "google:style" özelliği atlandığında, O harfiyle sıfır olarak yazılır.

    "google:style='zero-as-zero'" özelliği şu anda yalnızca İngilizce dilinde kullanılabilir.

          <speak>
            <say-as interpret-as='telephone' google:style='zero-as-zero'>1800-202-1212</say-as>
          </speak>
        
  • verbatim veya spell-out

    Aşağıdaki örnek harf harf olarak yazılmıştır:

    <speak>
      <say-as interpret-as="verbatim">abcdefg</say-as>
    </speak>
        
    ziyaret edin.
  • date

    format özelliği, tarih alanı karakter kodlarından oluşan bir dizidir. format özelliğinde desteklenen alan karakter kodları sırasıyla yıl, ay ve gün (ayın) için {y, m, d} şeklindedir. Alan kodu yıl, ay ve gün için bir kez görünüyorsa beklenen basamak sayısı sırasıyla 4, 2 ve 2 olur. Alan kodu tekrarlanırsa beklenen basamak sayısı, kodun tekrarlanma sayısına eşittir. Tarih metnindeki alanlar noktalama işaretleri ve/veya boşluklarla ayrılabilir.

    detail özelliği, tarihin sözlü biçimini kontrol eder. detail='1' için yalnızca gün alanları ve ay veya yıl alanları gereklidir, ancak her ikisi de sağlanabilir. Üçten az alan sağlandığında varsayılan olarak bu ayar kullanılır. Sözlü biçim "The {ordinal day} of {month}, {year}".

    Aşağıdaki örnekte "On Eylül'ün onsu, on dokuz altmış" olarak söylenir:

    <speak>
      <say-as interpret-as="date" format="yyyymmdd" detail="1">
        1960-09-10
      </say-as>
    </speak>
        
    ziyaret edin.

    Aşağıdaki örnekte "On Eylül" olarak söylenir:

    <speak>
      <say-as interpret-as="date" format="dm">10-9</say-as>
    </speak>
        
    ziyaret edin.

    detail='2' için gün, ay ve yıl alanları zorunludur ve üç alan da doldurulduğunda bu varsayılan değerdir. Sesli biçim "{month} {ordinal day}, {year}" şeklindedir.

    Aşağıdaki örnekte "Onuncu Eylül, on dokuz altmış" olarak söylenir:

    <speak>
      <say-as interpret-as="date" format="dmy" detail="2">
        10-9-1960
      </say-as>
    </speak>
        
    ziyaret edin.
  • characters

    Aşağıdaki örnek "C A N" olarak okunur:

    <speak>
      <say-as interpret-as="characters">can</say-as>
    </speak>
        
    ziyaret edin.
  • cardinal

    Aşağıdaki örnekte "On iki bin üç yüz kırk beş" olarak söylenir (ABD İngilizcesi için) veya "On iki bin üç yüz kırk beş (Birleşik Krallık İngilizcesi için)":

    <speak>
      <say-as interpret-as="cardinal">12345</say-as>
    </speak>
        
    ziyaret edin.
  • ordinal

    Aşağıdaki örnek "First" olarak söylenir:

    <speak>
      <say-as interpret-as="ordinal">1</say-as>
    </speak>
        
    ziyaret edin.
  • fraction

    Aşağıdaki örnekte "beş buçuk" olarak söylenir:

    <speak>
      <say-as interpret-as="fraction">5+1/2</say-as>
    </speak>
        
    ziyaret edin.
  • expletive veya bleep

    Aşağıdaki örnek, sansürlenmiş gibi bir bip sesi olarak çıkar:

    <speak>
      <say-as interpret-as="expletive">censor this</say-as>
    </speak>
        
    ziyaret edin.
  • unit

    Sayıya bağlı olarak birimleri tekil veya çoğuna dönüştürür. Aşağıdaki örnek "10 fit" olarak söylenir:

    <speak>
      <say-as interpret-as="unit">10 foot</say-as>
    </speak>
        
    ziyaret edin.
  • time

    Aşağıdaki örnekte "İki buçuk:" olarak söylenir:

    <speak>
      <say-as interpret-as="time" format="hms12">2:30pm</say-as>
    </speak>
        
    ziyaret edin.

    format özelliği, zaman alanı karakter kodlarından oluşan bir dizidir. format ürününde desteklenen alan karakter kodları sırasıyla saat,dakika, dakika, saniye, saat dilimi, 12 saatlik saat ve 24 saatlik saat için {h, m, s, Z, 12, 24} şeklindedir. Alan kodu saat, dakika veya saniye için bir kez görünüyorsa beklenen basamak sayısı sırasıyla 1, 2 ve 2 olur. Alan kodu tekrarlanırsa beklenen basamak sayısı, kodun tekrarlanma sayısına eşittir. Zaman metnindeki alanlar noktalama işaretleri ve/veya boşluklarla ayrılabilir. Saat, dakika veya saniye biçiminde belirtilmemişse veya eşleşen basamak yoksa alan sıfır değeri olarak kabul edilir. Varsayılan format "hms12"dir.

    detail özelliği, söylenen saat biçiminin 12 saatlik mi, yoksa 24 saatlik mi olduğunu kontrol eder. detail='1' veya detail atlanırsa ve saat biçimi 24 saatlik zamansa sözlü form 24 saat biçimindedir. detail='2' veya detail atlanırsa ve saat biçimi 12 saatlik zamansa sözlü form 12 saattir.

say-as öğesi hakkında daha fazla bilgi edinmek için W3 spesifikasyonuna bakın.

<audio>

Kaydedilen ses dosyalarının ve sentezlenmiş konuşma çıkışıyla birlikte diğer ses biçimlerinin eklenmesini destekler.

Özellikler

Özellik Zorunlu Varsayılan Değerler
src evet Yok Sesli medya kaynağına işaret eden bir URI. https protokolü desteklenmektedir.
clipBegin hayır 0 Ses kaynağının oynatmanın başlangıcından itibaren olan ofseti belirten TimeDesignation. Bu değer, ses kaynağının gerçek süresinden büyükse veya bu süreye eşitse ses eklenmez.
clipEnd hayır sonsuz Ses kaynağının oynatmanın başlangıcından bitişine kadar olan ofseti belirten bir TimeDesignation. Ses kaynağının gerçek süresi bu değerden kısaysa oynatma bu değerden azsa sonlandırılır. clipBegin, clipEnd değerinden büyük veya ona eşitse ses eklenmez.
speed hayır %100 Normal giriş hızına göre çıkış oynatma hızı oranıdır ve yüzde olarak ifade edilir. Biçim, pozitif bir gerçek sayı ve ardından % karakteridir. Şu anda desteklenen aralık [%50 (yavaş - yarı hız), %200 (hızlı - çift hız)] şeklindedir. Bu aralığın dışındaki değerler, sınırların içinde olacak şekilde ayarlanabilir (veya olmayabilir).
repeatCount hayır 1, repeatDur ayarlanmışsa 10 Sesin kaç kez ekleneceğini belirten (varsa, clipBegin ve/veya clipEnd ile kırpıldıktan sonra) Gerçek Sayı. Kesirli tekrarlar desteklenmediğinden değer en yakın tam sayıya yuvarlanır. Sıfır geçerli bir değer değildir ve bu nedenle belirtilmemiş olarak kabul edilir ve bu durumda varsayılan değere sahiptir.
repeatDur hayır sonsuz Kaynak clipBegin, clipEnd, repeatCount ve speed özellikleri (normal oynatma süresi yerine) için işlendikten sonra eklenen sesin süresi sınırı olan TimeDesignation. İşlenen sesin süresi bu değerden azsa oynatma bu değerden azsa sonlandırılır.
soundLevel hayır +0dB Ses seviyesini soundLeveldesibel ile ayarlayın. Maksimum aralık +/-40 dB'dir ancak gerçek aralık etkin olarak daha az olabilir ve çıkış kalitesi, aralığın tamamında iyi sonuçlar vermeyebilir.

Şu anda ses için desteklenen ayarlar şunlardır:

  • Biçim: MP3 (MPEG v2)
    • Saniyede 24 bin örnek
    • Saniyede 24K ~ 96K bit, sabit hız
  • Biçim: Ogg dilinde Opus
    • Saniyede 24 bin örnek (süper geniş bant)
    • Saniyede 24K - 96K bit, sabit hız
  • Biçim (desteği sonlandırılmış): WAV (RIFF)
    • PCM 16 bit imzalı, küçük endian
    • Saniyede 24 bin örnek
  • Tüm biçimler için:
    • Tek kanal tercih edilir ancak stereo kabul edilir.
    • Maksimum süre 240 saniyedir. Daha uzun süreli ses çalmak istiyorsanız medya yanıtı uygulamayı düşünebilirsiniz.
    • 5 megabayt dosya boyutu sınırı.
    • Kaynak URL'de HTTPS protokolü kullanılmalıdır.
    • Sesi getirirken kullanılan Kullanıcı Aracımız "Google-Speech-Actions"dır.

<audio> öğesinin içeriği isteğe bağlıdır ve ses dosyası çalınamıyorsa veya çıkış cihazı sesi desteklemiyorsa kullanılır. İçerikler bir <desc> öğesi içerebilir. Bu durumda, söz konusu öğenin metin içerikleri görüntüleme için kullanılır. Daha fazla bilgi için Yanıtlar Kontrol Listesi'ndeki Kaydedilen Ses bölümüne bakın.

src URL'si ayrıca bir https URL'si olmalıdır (Google Cloud Storage, ses dosyalarınızı bir https URL'sinde barındırabilir).

Medya yanıtları hakkında daha fazla bilgi edinmek için Yanıtlar kılavuzundaki medya yanıtı bölümüne bakın.

audio öğesi hakkında daha fazla bilgi edinmek için W3 spesifikasyonuna bakın.

Örnek

<speak>
  <audio src="cat_purr_close.ogg">
    <desc>a cat purring</desc>
    PURR (sound didn't load)
  </audio>
</speak>
ziyaret edin.

<p>,<s>

Cümle ve paragraf öğeleri.

p ve s öğeleri hakkında daha fazla bilgi edinmek için W3 spesifikasyonuna bakın.

Örnek

<p><s>This is sentence one.</s><s>This is sentence two.</s></p>
ziyaret edin.

En iyi uygulamalar

  • <s>...</s> etiketini kullan etiketleri, özellikle de uzlaşma biçimini değiştiren SSML öğeleri (yani <audio>, <break>, <emphasis>, <par>, <prosody>, <say-as>, <seq> ve <sub>) içeriyorsa tam cümleleri sarmalamalarını sağlar.
  • Konuşmadaki aranın, duyabileceğiniz uzunlukta olması amaçlanıyorsa <s>...</s> komutunu kullanın. ve bu aralığı cümleler arasına koyabilirsiniz.

<sub>

Takma ad özellik değerindeki metnin, telaffuz için içerdiği metnin yerini aldığını belirtin.

Okunması zor bir kelimenin telaffuzunu sadeleştirmek için sub öğesini de kullanabilirsiniz. Aşağıdaki son örnekte bu kullanım alanı Japonca gösterilmektedir.

sub öğesi hakkında daha fazla bilgi edinmek için W3 spesifikasyonuna bakın.

Örnekler

<sub alias="World Wide Web Consortium">W3C</sub>
ziyaret edin.
<sub alias="にっぽんばし">日本橋</sub>
ziyaret edin.

<mark>

Metne veya etiket sırasına bir işaretçi yerleştiren boş öğe. Aynı zamanda belirli bir konuma veya çıkış yayınına bir işaretçi yerleştirmeye kullanabilirsiniz.

'nı inceleyin. ziyaret edin.

mark öğesi hakkında daha fazla bilgi edinmek için W3 spesifikasyonuna bakın.

Örnek


<prosody>

Öğenin içerdiği metinlerin ses tonunu, konuşma hızını ve ses düzeyini özelleştirmek için kullanılır. Şu anda rate, pitch ve volume özellikleri desteklenmektedir.

rate ve volume özellikleri W3 spesifikasyonlarına göre ayarlanabilir. pitch özelliğinin değerini ayarlamak için üç seçenek vardır:

<speak>
Go from <mark name="here"/> here, to <mark name="there"/> there!
</speak>
Özellik Açıklama
name

Her işaretin dize kimliği.

Option Açıklama
Akraba Burada "orta" olan göreli bir değer belirtin (ör. "düşük", "orta", "yüksek" vb.) varsayılan ses perdesidir.
Nokta Tonları Ses perdesini "N" kadar artır veya azalt "+Nst" kullanılan yarım tonlar veya "-Nst" tıklayın. "+/-" ve "st" gereklidir.
Yüzde Ses perdesini "N" kadar artır veya azalt "+%N" kullanarak yüzde veya "-%N" tıklayın. "%" değerine dikkat edin gereklidir ancak "+/-" isteğe bağlıdır.

prosody öğesi hakkında daha fazla bilgi edinmek için W3 spesifikasyonuna bakın.

Örnek

Aşağıdaki örnekte normalden 2 yarım ses altında yavaş konuşmak için <prosody> öğesi kullanılmaktadır:

<prosody rate="slow" pitch="-2st">Can you hear me now?</prosody>
ziyaret edin.

<emphasis>

Öğenin içerdiği metne vurgu eklemek veya vurguyu kaldırmak için kullanılır. <emphasis> öğesi, konuşma özelliklerini <prosody> ile benzer şekilde değiştirir ancak ayrı konuşma özellikleri ayarlamaya gerek yoktur.

Bu öğe, isteğe bağlı bir "level" öğesini destekler özelliğinin değerlerini şu geçerli değerlerle değiştirin:

  • strong
  • moderate
  • none
  • reduced

emphasis öğesi hakkında daha fazla bilgi edinmek için W3 spesifikasyonuna bakın.

Örnek

Aşağıdaki örnekte duyuru yapmak için <emphasis> öğesi kullanılmaktadır:

<emphasis level="moderate">This is an important announcement</emphasis>
ziyaret edin.

<par>

Aynı anda birden fazla medya öğesini oynatmanıza olanak tanıyan paralel bir medya kapsayıcısıdır. İzin verilen tek içerik, bir veya daha fazla <par>, <seq> ve <media> öğesinden oluşan bir gruptur. <media> öğelerinin sırası önemli değil.

Bir alt öğe farklı bir başlangıç zamanı belirtmediği sürece, öğenin örtülü başlangıç zamanı <par> kapsayıcısının saatiyle aynıdır. Bir alt öğenin begin veya end özelliği için belirli uzaklıkta oluşturulmuş bir değeri varsa öğenin ofseti, <par> kapsayıcısının başlangıç zamanına göre olur. Kök <par> öğesi için start özelliği yoksayılır ve başlangıç zamanı, SSML konuşma sentezi işlemi kök <par> öğesi için çıkış oluşturmaya başladığında başlar (yani "sıfır" olarak etkin bir şekilde zamanlanır).

Örnek

<speak>
  <par>
    <media xml:id="question" begin="0.5s">
      <speak>Who invented the Internet?</speak>
    </media>
    <media xml:id="answer" begin="question.end+2.0s">
      <speak>The Internet was invented by cats.</speak>
    </media>
    <media begin="answer.end-0.2s" soundLevel="-6dB">
      <audio
        src="https://actions.google.com/.../cartoon_boing.ogg"/>
    </media>
    <media repeatCount="3" soundLevel="+2.28dB"
      fadeInDur="2s" fadeOutDur="0.2s">
      <audio
        src="https://actions.google.com/.../cat_purr_close.ogg"/>
    </media>
  </par>
</speak>
ziyaret edin.

<seq>

Medya öğelerini art arda oynatmanıza olanak tanıyan sıralı medya kapsayıcısı. İzin verilen tek içerik, bir veya daha fazla <seq>, <par> ve <media> öğesinden oluşan bir gruptur. Medya öğelerinin sırası, oluşturuldukları sıradır.

Alt öğelerin begin ve end özellikleri, ofset değerleri olarak ayarlanabilir (aşağıdaki Zaman Spesifikasyonu bölümüne bakın). Bu alt öğelerin ofset değerleri, dizide bir önceki öğenin sonuna göre veya dizideki ilk öğe söz konusu olduğunda <seq> kapsayıcısının başlangıcına göre değişir.

Örnek

<speak>
  <seq>
    <media begin="0.5s">
      <speak>Who invented the Internet?</speak>
    </media>
    <media begin="2.0s">
      <speak>The Internet was invented by cats.</speak>
    </media>
    <media soundLevel="-6dB">
      <audio
        src="https://actions.google.com/.../cartoon_boing.ogg"/>
    </media>
    <media repeatCount="3" soundLevel="+2.28dB"
      fadeInDur="2s" fadeOutDur="0.2s">
      <audio
        src="https://actions.google.com/.../cat_purr_close.ogg"/>
    </media>
  </seq>
</speak>
ziyaret edin.

<media>

<par> veya <seq> öğesi içindeki bir medya katmanını temsil eder. Bir <media> öğesinin izin verilen içeriği, SSML <speak> veya <audio> öğesidir. Aşağıdaki tabloda, bir <media> öğesinin geçerli özellikleri açıklanmaktadır.

Özellikler

Özellik Zorunlu Varsayılan Değerler
xml:id hayır değer yok Bu öğe için benzersiz bir XML tanımlayıcısı. Kodlanmış varlıklar desteklenmez. İzin verilen tanımlayıcı değerleri, "([-_#]|\p{L}|\p{D})+" normal ifadesiyle eşleşir. Daha fazla bilgi için XML-ID konusuna bakın.
başla hayır 0 Bu medya kapsayıcısının başlangıç zamanı. Bu, kök medya kapsayıcı öğesiyse yoksayılır ("0" varsayılanı ile aynı şekilde işlenir). Geçerli dize değerleri için aşağıdaki Zaman spesifikasyonu bölümüne bakın.
son hayır değer yok Bu medya kapsayıcısının bitiş zamanıyla ilgili spesifikasyon. Geçerli dize değerleri için aşağıdaki Zaman spesifikasyonu bölümüne bakın.
repeatCount hayır 1 Medyanın kaç kez ekleneceğini belirten Gerçek Sayı. Kesirli tekrarlar desteklenmediğinden değer en yakın tam sayıya yuvarlanır. Sıfır geçerli bir değer değildir ve bu nedenle belirtilmemiş olarak kabul edilir ve bu durumda varsayılan değere sahiptir.
repeatDur hayır değer yok Eklenen medyanın süresiyle ilgili bir sınır olan TimeDesignation. Medya süresi bu değerden azsa oynatma o anda sona erer.
soundLevel hayır +0dB Ses seviyesini soundLevel desibel ile ayarlayın. Maksimum aralık +/-40 dB'dir ancak gerçek aralık etkin olarak daha az olabilir ve çıkış kalitesi, aralığın tamamında iyi sonuçlar vermeyebilir.
fadeInDur hayır 0 sn. Medyanın sessiz moddan isteğe bağlı olarak belirtilen soundLevel öğesine geçeceği bir TimeDesignation. Medyanın süresi bu değerden azsa kararma sesi oynatmanın sonunda durur ve ses düzeyi, belirtilen ses seviyesine ulaşmaz.
fadeOutDur hayır 0 sn. Medyanın, isteğe bağlı olarak belirtilen soundLevel cihazından sessize gelinceye kadar kaybolacağı bir TimeDesignation. Medyanın süresi bu değerden azsa ses düzeyi, oynatmanın sonunda sessizliğe ulaşılmasını sağlamak için daha düşük bir değere ayarlanır.

Zaman spesifikasyonu

<media> öğelerinin ve medya kapsayıcılarının (<par> ve <seq> öğeleri) "begin" ve "end" özelliklerinin değeri için kullanılan zaman spesifikasyonu, bir ofset değeri (ör. +2.5s) veya bir senkronizasyonbase değeridir (örneğin foo_id.end-250ms).

  • Ofset değeri: Zaman farkı değeri, normal ifadeyle eşleşen değerlere izin veren bir SMIL zaman sayımı değeridir: "\s\*(+|-)?\s\*(\d+)(\.\d+)?(h|min|s|ms)?\s\*"

    İlk basamak dizesi ondalık sayının tam kısmıdır, ikinci basamak dizesi ise ondalık kesir bölümüdür. Varsayılan işaret (yani "(+|-)?") "+"dır. Birim değerleri, sırasıyla saat, dakika, saniye ve milisaniyeye karşılık gelir. Birimler için varsayılan değer "s"dir (saniye).

  • Syncbase değeri - Syncbase değeri, normal ifadeyle eşleşen değerlere izin veren bir SMIL senkronizasyon tabanı değeridir: "([-_#]|\p{L}|\p{D})+\.(begin|end)\s\*(+|-)\s\*(\d+)(\.\d+)?(h|min|s|ms)?\s\*"

    Rakamlar ve birimler, ofset değeriyle aynı şekilde yorumlanır.

TTS simülatörü

Actions konsolu, SSML'yi test etmek için kullanabileceğiniz bir TTS simülasyon aracı içerir yukarıdaki öğelerin herhangi birini kullanın. TTS simülatörünü konsolda bulabilirsiniz Simülatör > Ses. Simülatörde metninizi ve SSML'nizi yazın ve TTS çıkışını dinlemek için Güncelle ve Dinle'yi seçin.

TTS'nizin .mp3 dosyasını kaydetmek için indir düğmesini de tıklayabilirsiniz çıktı.