Google Asistan'a yanıt verirken Yanıtlarınızda Konuşma Sentezi Biçimlendirme Dili (SSML) kullanılır. Ölçüt SSML kullanarak konuşmanızın yanıtlarının daha doğal görünmesini tıklayın. Aşağıda, bir SSML işaretlemesi örneği ve bu işaretlemenin Google Asistan
function saySSML(conv) { const ssml = '<speak>' + 'Here are <say-as interpret-as="characters">SSML</say-as> samples. ' + 'I can pause <break time="3" />. ' + 'I can play a sound <audio src="https://www.example.com/MY_WAVE_FILE.wav">your wave file</audio>. ' + 'I can speak in cardinals. Your position is <say-as interpret-as="cardinal">10</say-as> in line. ' + 'Or I can speak in ordinals. You are <say-as interpret-as="ordinal">10</say-as> in line. ' + 'Or I can even speak in digits. Your position in line is <say-as interpret-as="digits">10</say-as>. ' + 'I can also substitute phrases, like the <sub alias="World Wide Web Consortium">W3C</sub>. ' + 'Finally, I can speak a paragraph with two sentences. ' + '<p><s>This is sentence one.</s><s>This is sentence two.</s></p>' + '</speak>'; conv.ask(ssml); }
{ "expectUserResponse": true, "expectedInputs": [ { "possibleIntents": [ { "intent": "actions.intent.TEXT" } ], "inputPrompt": { "richInitialPrompt": { "items": [ { "simpleResponse": { "textToSpeech": "<speak>Here are <say-as interpret-as=\"characters\">SSML</say-as> samples. I can pause <break time=\"3\" />. I can play a sound <audio src=\"https://www.example.com/MY_WAVE_FILE.wav\">your wave file</audio>. I can speak in cardinals. Your position is <say-as interpret-as=\"cardinal\">10</say-as> in line. Or I can speak in ordinals. You are <say-as interpret-as=\"ordinal\">10</say-as> in line. Or I can even speak in digits. Your position in line is <say-as interpret-as=\"digits\">10</say-as>. I can also substitute phrases, like the <sub alias=\"World Wide Web Consortium\">W3C</sub>. Finally, I can speak a paragraph with two sentences. <p><s>This is sentence one.</s><s>This is sentence two.</s></p></speak>" } } ] } } } ] }
Ses
SSML, İşlemler simülatöründe desteklenir ancak Dialogflow'da desteklenmez simülatörüdür.
SSML'deki URL'ler
Yalnızca bir URL içeren bir SSML yanıtı tanımlarken, bu URL'de "ve" (&) işareti bulunur
XML biçimlendirmesinden kaynaklanan sorunlara neden olabilir. URL'nin doğru bir şekilde
başvurulan, &
örneklerini &
ile değiştirin.
SSML yanıtınız yalnızca bir URL içerse bile, Actions on Google
yanıt için görünen metin. Çünkü <audio>
etiketinin içindeki metin
bir metin veya açıklama ekleyebilirsiniz. Örneğin,
Bu koşulu karşılamak için <audio>
etiketi kullanın. <audio>
etiketinin içindeki metin
ve Google'ın Action'ıyla tanıştığında Asistan'ın konuştuğu herkes
(SSML'nizin görüntülü metin sürümü için)
Sorunlu bir SSML yanıtı örneğini burada bulabilirsiniz:
<speak>
<audio src="https://firebasestorage.googleapis.com/v0/b/project-name.appspot.com/o/audio-file-name.ogg?alt=media&token=XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX">
</audio>
</speak>
Yukarıdaki örnekte, uygun XML biçimlendirmesi için &
kod dışına çıkmıyor.
Aynı SSML yanıtının sabit bir sürümü şu şekilde görünür:
<speak>
<audio src="https://firebasestorage.googleapis.com/v0/b/project-name.appspot.com/o/audio-file-name.ogg?alt=media&token=XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX">
text
</audio>
</speak>
SSML öğeleri için destek
Aşağıdaki bölümlerde, İşlemlerinizde kullanılabilecek SSML öğeleri ve seçenekleri açıklanmaktadır.
<speak>
SSML yanıtının kök öğesi.
speak
öğesi hakkında daha fazla bilgi edinmek için W3 spesifikasyonuna bakın.
Örnek
<speak> my SSML content </speak>ziyaret edin.
<break>
Kelimeler arasında duraklatmayı veya başka prosodik sınırları kontrol eden boş bir öğe. Herhangi bir jeton çifti arasında <break>
kullanmak isteğe bağlıdır. Kelimeler arasında bu öğe mevcut değilse ara, dilin bağlamına göre otomatik olarak belirlenir.
break
öğesi hakkında daha fazla bilgi edinmek için W3 spesifikasyonuna bakın.
Özellikler
Özellik | Açıklama |
---|---|
time |
Aranın uzunluğunu saniye veya milisaniye cinsinden ayarlar (ör. "3 sn" veya "250 ms"). |
strength |
Çıkışın proozotik aranın gücünü göreceli terimlere göre ayarlar. Geçerli değerler şunlardır: "x-zayıf", zayıf", "orta", "güçlü" ve "x-strong". "none" değeri prosodik ara sınırı çıkmaması gerektiğini belirtir. Bu sınır, işlemcinin aksi halde oluşturacağı prosodik bir arayı önlemek için kullanılabilir. Diğer değerler, jetonlar arasındaki monoton olarak azalan olmayan (kavramsal olarak artan) kırılma gücünü gösterir. Daha güçlü sınırlara genellikle duraklamalar eşlik eder. |
Örnek
Aşağıdaki örnekte, adımlar arasında duraklamak için <break>
öğesinin nasıl kullanılacağı gösterilmektedir:
<speak> Step 1, take a deep breath. <break time="200ms"/> Step 2, exhale. Step 3, take a deep breath again. <break strength="weak"/> Step 4, exhale. </speak>
<say‑as>
Bu öğe, öğenin içinde bulunan metin yapısının türüyle ilgili bilgileri belirtmenizi sağlar. Ayrıca, içerdiği metni oluşturmak için gereken ayrıntı düzeyinin belirlenmesine de yardımcı olur.
<say‑as>
öğesi, değerin nasıl söylendiğini belirleyen gerekli interpret-as
özelliğine sahiptir. Belirli interpret-as
değerine bağlı olarak isteğe bağlı format
ve detail
özellikleri kullanılabilir.
Örnekler
interpret-as
özelliği aşağıdaki değerleri destekler:
-
currency
Aşağıdaki örnekte "kırk iki dolar ve bir sent" olarak konuşulmaktadır. Dil özelliği atlanırsa geçerli yerel ayar kullanılır.
<speak> <say-as interpret-as='currency' language='en-US'>$42.01</say-as> </speak>
-
telephone
W3C SSML 1.0 özellik değerleri olarak söyle WG notundaki
interpret-as='telephone'
açıklamasına bakın.Aşağıdaki örnekte "bir sekiz sıfır sıfır iki sıfır iki bir iki bir iki" olarak söz konusudur. "google:style" özelliği atlandığında, O harfiyle sıfır olarak yazılır.
"google:style='zero-as-zero'" özelliği şu anda yalnızca İngilizce dilinde kullanılabilir.
<speak> <say-as interpret-as='telephone' google:style='zero-as-zero'>1800-202-1212</say-as> </speak>
-
verbatim
veyaspell-out
Aşağıdaki örnek harf harf olarak yazılmıştır:
<speak> <say-as interpret-as="verbatim">abcdefg</say-as> </speak>
ziyaret edin. -
date
format
özelliği, tarih alanı karakter kodlarından oluşan bir dizidir.format
özelliğinde desteklenen alan karakter kodları sırasıyla yıl, ay ve gün (ayın) için {y
,m
,d
} şeklindedir. Alan kodu yıl, ay ve gün için bir kez görünüyorsa beklenen basamak sayısı sırasıyla 4, 2 ve 2 olur. Alan kodu tekrarlanırsa beklenen basamak sayısı, kodun tekrarlanma sayısına eşittir. Tarih metnindeki alanlar noktalama işaretleri ve/veya boşluklarla ayrılabilir.detail
özelliği, tarihin sözlü biçimini kontrol eder.detail='1'
için yalnızca gün alanları ve ay veya yıl alanları gereklidir, ancak her ikisi de sağlanabilir. Üçten az alan sağlandığında varsayılan olarak bu ayar kullanılır. Sözlü biçim "The {ordinal day} of {month}, {year}".Aşağıdaki örnekte "On Eylül'ün onsu, on dokuz altmış" olarak söylenir:
<speak> <say-as interpret-as="date" format="yyyymmdd" detail="1"> 1960-09-10 </say-as> </speak>
ziyaret edin.Aşağıdaki örnekte "On Eylül" olarak söylenir:
<speak> <say-as interpret-as="date" format="dm">10-9</say-as> </speak>
ziyaret edin.detail='2'
için gün, ay ve yıl alanları zorunludur ve üç alan da doldurulduğunda bu varsayılan değerdir. Sesli biçim "{month} {ordinal day}, {year}" şeklindedir.Aşağıdaki örnekte "Onuncu Eylül, on dokuz altmış" olarak söylenir:
<speak> <say-as interpret-as="date" format="dmy" detail="2"> 10-9-1960 </say-as> </speak>
ziyaret edin. -
characters
Aşağıdaki örnek "C A N" olarak okunur:
<speak> <say-as interpret-as="characters">can</say-as> </speak>
ziyaret edin. -
cardinal
Aşağıdaki örnekte "On iki bin üç yüz kırk beş" olarak söylenir (ABD İngilizcesi için) veya "On iki bin üç yüz kırk beş (Birleşik Krallık İngilizcesi için)":
<speak> <say-as interpret-as="cardinal">12345</say-as> </speak>
ziyaret edin. -
ordinal
Aşağıdaki örnek "First" olarak söylenir:
<speak> <say-as interpret-as="ordinal">1</say-as> </speak>
ziyaret edin. -
fraction
Aşağıdaki örnekte "beş buçuk" olarak söylenir:
<speak> <say-as interpret-as="fraction">5+1/2</say-as> </speak>
ziyaret edin. -
expletive
veyableep
Aşağıdaki örnek, sansürlenmiş gibi bir bip sesi olarak çıkar:
<speak> <say-as interpret-as="expletive">censor this</say-as> </speak>
ziyaret edin. -
unit
Sayıya bağlı olarak birimleri tekil veya çoğuna dönüştürür. Aşağıdaki örnek "10 fit" olarak söylenir:
<speak> <say-as interpret-as="unit">10 foot</say-as> </speak>
ziyaret edin. -
time
Aşağıdaki örnekte "İki buçuk:" olarak söylenir:
<speak> <say-as interpret-as="time" format="hms12">2:30pm</say-as> </speak>
ziyaret edin.format
özelliği, zaman alanı karakter kodlarından oluşan bir dizidir.format
ürününde desteklenen alan karakter kodları sırasıyla saat,dakika, dakika, saniye, saat dilimi, 12 saatlik saat ve 24 saatlik saat için {h
,m
,s
,Z
,12
,24
} şeklindedir. Alan kodu saat, dakika veya saniye için bir kez görünüyorsa beklenen basamak sayısı sırasıyla 1, 2 ve 2 olur. Alan kodu tekrarlanırsa beklenen basamak sayısı, kodun tekrarlanma sayısına eşittir. Zaman metnindeki alanlar noktalama işaretleri ve/veya boşluklarla ayrılabilir. Saat, dakika veya saniye biçiminde belirtilmemişse veya eşleşen basamak yoksa alan sıfır değeri olarak kabul edilir. Varsayılanformat
"hms12"dir.detail
özelliği, söylenen saat biçiminin 12 saatlik mi, yoksa 24 saatlik mi olduğunu kontrol eder.detail='1'
veyadetail
atlanırsa ve saat biçimi 24 saatlik zamansa sözlü form 24 saat biçimindedir.detail='2'
veyadetail
atlanırsa ve saat biçimi 12 saatlik zamansa sözlü form 12 saattir.
say-as
öğesi hakkında daha fazla bilgi edinmek için W3 spesifikasyonuna bakın.
<audio>
Kaydedilen ses dosyalarının ve sentezlenmiş konuşma çıkışıyla birlikte diğer ses biçimlerinin eklenmesini destekler.
Özellikler
Özellik | Zorunlu | Varsayılan | Değerler |
---|---|---|---|
src |
evet | Yok | Sesli medya kaynağına işaret eden bir URI. https protokolü desteklenmektedir. |
clipBegin |
hayır | 0 | Ses kaynağının oynatmanın başlangıcından itibaren olan ofseti belirten TimeDesignation. Bu değer, ses kaynağının gerçek süresinden büyükse veya bu süreye eşitse ses eklenmez. |
clipEnd |
hayır | sonsuz | Ses kaynağının oynatmanın başlangıcından bitişine kadar olan ofseti belirten bir TimeDesignation. Ses kaynağının gerçek süresi bu değerden kısaysa oynatma bu değerden azsa sonlandırılır. clipBegin , clipEnd değerinden büyük veya ona eşitse ses eklenmez. |
speed |
hayır | %100 | Normal giriş hızına göre çıkış oynatma hızı oranıdır ve yüzde olarak ifade edilir. Biçim, pozitif bir gerçek sayı ve ardından % karakteridir. Şu anda desteklenen aralık [%50 (yavaş - yarı hız), %200 (hızlı - çift hız)] şeklindedir. Bu aralığın dışındaki değerler, sınırların içinde olacak şekilde ayarlanabilir (veya olmayabilir). |
repeatCount |
hayır | 1, repeatDur ayarlanmışsa 10 |
Sesin kaç kez ekleneceğini belirten (varsa, clipBegin ve/veya clipEnd ile kırpıldıktan sonra) Gerçek Sayı. Kesirli tekrarlar desteklenmediğinden değer en yakın tam sayıya yuvarlanır. Sıfır geçerli bir değer değildir ve bu nedenle belirtilmemiş olarak kabul edilir ve bu durumda varsayılan değere sahiptir. |
repeatDur |
hayır | sonsuz | Kaynak clipBegin , clipEnd , repeatCount ve speed özellikleri (normal oynatma süresi yerine) için işlendikten sonra eklenen sesin süresi sınırı olan TimeDesignation. İşlenen sesin süresi bu değerden azsa oynatma bu değerden azsa sonlandırılır. |
soundLevel |
hayır | +0dB | Ses seviyesini soundLevel desibel ile ayarlayın. Maksimum aralık +/-40 dB'dir ancak gerçek aralık etkin olarak daha az olabilir ve çıkış kalitesi, aralığın tamamında iyi sonuçlar vermeyebilir. |
Şu anda ses için desteklenen ayarlar şunlardır:
- Biçim: MP3 (MPEG v2)
- Saniyede 24 bin örnek
- Saniyede 24K ~ 96K bit, sabit hız
- Biçim: Ogg dilinde Opus
- Saniyede 24 bin örnek (süper geniş bant)
- Saniyede 24K - 96K bit, sabit hız
- Biçim (desteği sonlandırılmış): WAV (RIFF)
- PCM 16 bit imzalı, küçük endian
- Saniyede 24 bin örnek
- Tüm biçimler için:
- Tek kanal tercih edilir ancak stereo kabul edilir.
- Maksimum süre 240 saniyedir. Daha uzun süreli ses çalmak istiyorsanız medya yanıtı uygulamayı düşünebilirsiniz.
- 5 megabayt dosya boyutu sınırı.
- Kaynak URL'de HTTPS protokolü kullanılmalıdır.
- Sesi getirirken kullanılan Kullanıcı Aracımız "Google-Speech-Actions"dır.
<audio>
öğesinin içeriği isteğe bağlıdır ve ses dosyası çalınamıyorsa veya çıkış cihazı sesi desteklemiyorsa kullanılır. İçerikler bir <desc>
öğesi içerebilir. Bu durumda, söz konusu öğenin metin içerikleri görüntüleme için kullanılır. Daha fazla bilgi için Yanıtlar Kontrol Listesi'ndeki Kaydedilen Ses bölümüne bakın.
src
URL'si ayrıca bir https URL'si olmalıdır (Google Cloud Storage, ses dosyalarınızı bir https URL'sinde barındırabilir).
Medya yanıtları hakkında daha fazla bilgi edinmek için Yanıtlar kılavuzundaki medya yanıtı bölümüne bakın.
audio
öğesi hakkında daha fazla bilgi edinmek için W3 spesifikasyonuna bakın.
Örnek
<speak> <audio src="cat_purr_close.ogg"> <desc>a cat purring</desc> PURR (sound didn't load) </audio> </speak>ziyaret edin.
<p>,<s>
Cümle ve paragraf öğeleri.
p
ve s
öğeleri hakkında daha fazla bilgi edinmek için W3 spesifikasyonuna bakın.
Örnek
<p><s>This is sentence one.</s><s>This is sentence two.</s></p>ziyaret edin.
En iyi uygulamalar
- <s>...</s> etiketini kullan etiketleri, özellikle de uzlaşma biçimini değiştiren SSML öğeleri (yani <audio>, <break>, <emphasis>, <par>, <prosody>, <say-as>, <seq> ve <sub>) içeriyorsa tam cümleleri sarmalamalarını sağlar.
- Konuşmadaki aranın, duyabileceğiniz uzunlukta olması amaçlanıyorsa <s>...</s> komutunu kullanın. ve bu aralığı cümleler arasına koyabilirsiniz.
<sub>
Takma ad özellik değerindeki metnin, telaffuz için içerdiği metnin yerini aldığını belirtin.
Okunması zor bir kelimenin telaffuzunu sadeleştirmek için sub
öğesini de kullanabilirsiniz. Aşağıdaki son örnekte bu kullanım alanı Japonca gösterilmektedir.
sub
öğesi hakkında daha fazla bilgi edinmek için W3 spesifikasyonuna bakın.
Örnekler
<sub alias="World Wide Web Consortium">W3C</sub>ziyaret edin.
<sub alias="にっぽんばし">日本橋</sub>ziyaret edin.
<mark>
Metne veya etiket sırasına bir işaretçi yerleştiren boş öğe. Aynı zamanda belirli bir konuma veya çıkış yayınına bir işaretçi yerleştirmeye kullanabilirsiniz.
'nı inceleyin. ziyaret edin.mark
öğesi hakkında daha fazla bilgi edinmek için W3 spesifikasyonuna bakın.
Örnek
<prosody>
Öğenin içerdiği metinlerin ses tonunu, konuşma hızını ve ses düzeyini özelleştirmek için kullanılır. Şu anda rate
, pitch
ve volume
özellikleri desteklenmektedir.
rate
ve volume
özellikleri W3 spesifikasyonlarına göre ayarlanabilir. pitch
özelliğinin değerini ayarlamak için üç seçenek vardır:
Özellik | Açıklama |
---|---|
name |
Her işaretin dize kimliği. |
Option | Açıklama |
---|---|
Akraba | Burada "orta" olan göreli bir değer belirtin (ör. "düşük", "orta", "yüksek" vb.) varsayılan ses perdesidir. |
Nokta Tonları | Ses perdesini "N" kadar artır veya azalt "+Nst" kullanılan yarım tonlar veya "-Nst" tıklayın. "+/-" ve "st" gereklidir. |
Yüzde | Ses perdesini "N" kadar artır veya azalt "+%N" kullanarak yüzde veya "-%N" tıklayın. "%" değerine dikkat edin gereklidir ancak "+/-" isteğe bağlıdır. |
prosody
öğesi hakkında daha fazla bilgi edinmek için W3 spesifikasyonuna bakın.
Örnek
Aşağıdaki örnekte normalden 2 yarım ses altında yavaş konuşmak için <prosody>
öğesi kullanılmaktadır:
<prosody rate="slow" pitch="-2st">Can you hear me now?</prosody>ziyaret edin.
<emphasis>
Öğenin içerdiği metne vurgu eklemek veya vurguyu kaldırmak için kullanılır. <emphasis>
öğesi, konuşma özelliklerini <prosody>
ile benzer şekilde değiştirir ancak ayrı konuşma özellikleri ayarlamaya gerek yoktur.
Bu öğe, isteğe bağlı bir "level" öğesini destekler özelliğinin değerlerini şu geçerli değerlerle değiştirin:
strong
moderate
none
reduced
emphasis
öğesi hakkında daha fazla bilgi edinmek için W3 spesifikasyonuna bakın.
Örnek
Aşağıdaki örnekte duyuru yapmak için <emphasis>
öğesi kullanılmaktadır:
<emphasis level="moderate">This is an important announcement</emphasis>ziyaret edin.
<par>
Aynı anda birden fazla medya öğesini oynatmanıza olanak tanıyan paralel bir medya kapsayıcısıdır. İzin verilen tek içerik, bir veya daha fazla <par>
, <seq>
ve <media>
öğesinden oluşan bir gruptur. <media>
öğelerinin sırası önemli değil.
Bir alt öğe farklı bir başlangıç zamanı belirtmediği sürece, öğenin örtülü başlangıç zamanı <par>
kapsayıcısının saatiyle aynıdır. Bir alt öğenin begin veya end özelliği için belirli uzaklıkta oluşturulmuş bir değeri varsa öğenin ofseti, <par>
kapsayıcısının başlangıç zamanına göre olur. Kök <par>
öğesi için start özelliği yoksayılır ve başlangıç zamanı, SSML konuşma sentezi işlemi kök <par>
öğesi için çıkış oluşturmaya başladığında başlar (yani "sıfır" olarak etkin bir şekilde zamanlanır).
Örnek
<speak> <par> <media xml:id="question" begin="0.5s"> <speak>Who invented the Internet?</speak> </media> <media xml:id="answer" begin="question.end+2.0s"> <speak>The Internet was invented by cats.</speak> </media> <media begin="answer.end-0.2s" soundLevel="-6dB"> <audio src="https://actions.google.com/.../cartoon_boing.ogg"/> </media> <media repeatCount="3" soundLevel="+2.28dB" fadeInDur="2s" fadeOutDur="0.2s"> <audio src="https://actions.google.com/.../cat_purr_close.ogg"/> </media> </par> </speak>ziyaret edin.
<seq>
Medya öğelerini art arda oynatmanıza olanak tanıyan sıralı medya kapsayıcısı. İzin verilen tek içerik, bir veya daha fazla <seq>
, <par>
ve <media>
öğesinden oluşan bir gruptur. Medya öğelerinin sırası, oluşturuldukları sıradır.
Alt öğelerin begin ve end özellikleri, ofset değerleri olarak ayarlanabilir (aşağıdaki Zaman Spesifikasyonu bölümüne bakın). Bu alt öğelerin ofset değerleri, dizide bir önceki öğenin sonuna göre veya dizideki ilk öğe söz konusu olduğunda <seq>
kapsayıcısının başlangıcına göre değişir.
Örnek
<speak> <seq> <media begin="0.5s"> <speak>Who invented the Internet?</speak> </media> <media begin="2.0s"> <speak>The Internet was invented by cats.</speak> </media> <media soundLevel="-6dB"> <audio src="https://actions.google.com/.../cartoon_boing.ogg"/> </media> <media repeatCount="3" soundLevel="+2.28dB" fadeInDur="2s" fadeOutDur="0.2s"> <audio src="https://actions.google.com/.../cat_purr_close.ogg"/> </media> </seq> </speak>ziyaret edin.
<media>
<par>
veya <seq>
öğesi içindeki bir medya katmanını temsil eder. Bir <media>
öğesinin izin verilen içeriği, SSML <speak>
veya <audio>
öğesidir. Aşağıdaki tabloda, bir <media>
öğesinin geçerli özellikleri açıklanmaktadır.
Özellikler
Özellik | Zorunlu | Varsayılan | Değerler |
---|---|---|---|
xml:id | hayır | değer yok | Bu öğe için benzersiz bir XML tanımlayıcısı. Kodlanmış varlıklar desteklenmez. İzin verilen tanımlayıcı değerleri, "([-_#]|\p{L}|\p{D})+" normal ifadesiyle eşleşir. Daha fazla bilgi için XML-ID konusuna bakın. |
başla | hayır | 0 | Bu medya kapsayıcısının başlangıç zamanı. Bu, kök medya kapsayıcı öğesiyse yoksayılır ("0" varsayılanı ile aynı şekilde işlenir). Geçerli dize değerleri için aşağıdaki Zaman spesifikasyonu bölümüne bakın. |
son | hayır | değer yok | Bu medya kapsayıcısının bitiş zamanıyla ilgili spesifikasyon. Geçerli dize değerleri için aşağıdaki Zaman spesifikasyonu bölümüne bakın. |
repeatCount | hayır | 1 | Medyanın kaç kez ekleneceğini belirten Gerçek Sayı. Kesirli tekrarlar desteklenmediğinden değer en yakın tam sayıya yuvarlanır. Sıfır geçerli bir değer değildir ve bu nedenle belirtilmemiş olarak kabul edilir ve bu durumda varsayılan değere sahiptir. |
repeatDur | hayır | değer yok | Eklenen medyanın süresiyle ilgili bir sınır olan TimeDesignation. Medya süresi bu değerden azsa oynatma o anda sona erer. |
soundLevel | hayır | +0dB | Ses seviyesini soundLevel desibel ile ayarlayın. Maksimum aralık +/-40 dB'dir ancak gerçek aralık etkin olarak daha az olabilir ve çıkış kalitesi, aralığın tamamında iyi sonuçlar vermeyebilir. |
fadeInDur | hayır | 0 sn. | Medyanın sessiz moddan isteğe bağlı olarak belirtilen soundLevel öğesine geçeceği bir TimeDesignation. Medyanın süresi bu değerden azsa kararma sesi oynatmanın sonunda durur ve ses düzeyi, belirtilen ses seviyesine ulaşmaz. |
fadeOutDur | hayır | 0 sn. | Medyanın, isteğe bağlı olarak belirtilen soundLevel cihazından sessize gelinceye kadar kaybolacağı bir TimeDesignation. Medyanın süresi bu değerden azsa ses düzeyi, oynatmanın sonunda sessizliğe ulaşılmasını sağlamak için daha düşük bir değere ayarlanır. |
Zaman spesifikasyonu
<media>
öğelerinin ve medya kapsayıcılarının (<par>
ve <seq>
öğeleri) "begin" ve "end" özelliklerinin değeri için kullanılan zaman spesifikasyonu, bir ofset değeri (ör. +2.5s
) veya bir senkronizasyonbase değeridir (örneğin foo_id.end-250ms
).
- Ofset değeri: Zaman farkı değeri, normal ifadeyle eşleşen değerlere izin veren bir SMIL zaman sayımı değeridir:
"\s\*(+|-)?\s\*(\d+)(\.\d+)?(h|min|s|ms)?\s\*"
İlk basamak dizesi ondalık sayının tam kısmıdır, ikinci basamak dizesi ise ondalık kesir bölümüdür. Varsayılan işaret (yani "(+|-)?") "+"dır. Birim değerleri, sırasıyla saat, dakika, saniye ve milisaniyeye karşılık gelir. Birimler için varsayılan değer "s"dir (saniye).
- Syncbase değeri - Syncbase değeri, normal ifadeyle eşleşen değerlere izin veren bir SMIL senkronizasyon tabanı değeridir:
"([-_#]|\p{L}|\p{D})+\.(begin|end)\s\*(+|-)\s\*(\d+)(\.\d+)?(h|min|s|ms)?\s\*"
Rakamlar ve birimler, ofset değeriyle aynı şekilde yorumlanır.
TTS simülatörü
Actions konsolu, SSML'yi test etmek için kullanabileceğiniz bir TTS simülasyon aracı içerir yukarıdaki öğelerin herhangi birini kullanın. TTS simülatörünü konsolda bulabilirsiniz Simülatör > Ses. Simülatörde metninizi ve SSML'nizi yazın ve TTS çıkışını dinlemek için Güncelle ve Dinle'yi seçin.
TTS'nizin .mp3
dosyasını kaydetmek için indir düğmesini de tıklayabilirsiniz
çıktı.