स्पीच सिंथेसिस मार्कअप लैंग्वेज (एसएसएमएल) रेफ़रंस (बीटा वर्शन)

Actions on Google प्लैटफ़ॉर्म पर, इन सुविधाओं के अलावा कई एसएसएमएल बीटा सुविधाएं भी काम करती हैं Google के स्टैंडर्ड SSML एलिमेंट पर कार्रवाइयां.

इसके साथ काम करने वाली बीटा SSML सुविधाओं के बारे में खास जानकारी:

  • <phoneme>: खास शब्दों का उच्चारण अपनी पसंद के मुताबिक बनाएं.
  • <say-as interpret-as="duration">: अवधियां बताएं.
  • <voice>: एक ही अनुरोध में आवाज़ों के बीच स्विच करना.
  • <lang>: एक ही अनुरोध में कई भाषाओं का इस्तेमाल करें.
  • टाइमपॉइंट: किसी खास समयावधि का टाइमपॉइंट लौटाने के लिए, <mark> टैग का इस्तेमाल करें अंक भी शामिल कर सकते हैं.

<phoneme>

शब्दों के मनमुताबिक उच्चारण बनाने के लिए, <phoneme> टैग का इस्तेमाल किया जा सकता है इनलाइन. Actions on Google स्वीकार करता है IPA और X-SAMPA फ़ोनेटिक वर्णमाला. ज़्यादा जानकारी के लिए, फ़ोनेस पेज पर काम करने वाली कंपनियों की सूची देखें और फ़ोनम.

<phoneme> टैग का हर ऐप्लिकेशन, किसी एक टैग के उच्चारण को निर्देश देता है शब्द:

  <phoneme alphabet="ipa" ph="ˌmænɪˈtoʊbə">manitoba</phoneme>
  <phoneme alphabet="x-sampa" ph='m@"hA:g@%ni:'>mahogany</phoneme>

स्ट्रेस मार्कर

तनाव के ज़्यादा से ज़्यादा तीन लेवल होते हैं, जिन्हें ट्रांसक्रिप्शन में रखा जा सकता है:

  1. प्राइमरी स्ट्रेस: IPA में ˈ और X-SAMPA में " के साथ दिखाया जाता है.
  2. सेकंडरी स्ट्रेस: इसे IPA में ˌ और X-SAMPA में % के साथ दिखाया जाता है.
  3. परेशान न करें: इसे किसी सिंबल (किसी भी नोटेशन में) से नहीं दिखाया जाता है.

कुछ भाषाओं में तीन से कम लेवल हो सकते हैं या हो सकता है कि वे तनाव की जगह नहीं दिखाएं बिलकुल भी नहीं. फ़ोनेस पेज पर जाकर इनके बारे में जानें तनाव के स्तर की जानकारी मिल सकती है. तनाव के मार्कर तनाव वाले हर शब्द का शुरुआती हिस्सा. उदाहरण के लिए, अमेरिकन इंग्लिश में:

उदाहरण के लिए शब्द आईपीए X-SAMPA
पानी ˈwɑːtɚ "wA:t@`
पानी के अंदर ˌʌndɚˈwɑːtɚ %Vnd@"wA:t@

बोली को लेख में बदलने की सुविधा का ब्रॉड मैच (सिर्फ़ कीवर्ड मिलाकर विज्ञापन दिखाना) या छोटे टेक्स्ट में बदलना

सामान्य नियम के तौर पर, अपने ट्रांसक्रिप्शन का दायरा बढ़ाएं और फ़ोनेटिक रखें. उदाहरण के लिए, अमेरिकन इंग्लिश में, इंटरवोकलिक t को ट्रांसक्राइब करें टैप करें):

उदाहरण के लिए शब्द आईपीए X-SAMPA
मक्खन ˈbʌɾɚ के बजाय ˈbʌtɚ "bV4@` के बजाय "bVt@`

कुछ मामलों में, फ़ोनेटिक रिप्रज़ेंटेशन का इस्तेमाल करने पर, आपके नतीजे अप्राकृतिक लगते हैं (उदाहरण के लिए, अगर फ़ोनम का क्रम शारीरिक तौर पर बोलना मुश्किल हो).

इसका एक उदाहरण है, अंग्रेज़ी में s के लिए आवाज़ को अपने हिसाब से बनाना. इस मामले में ट्रांसक्रिप्शन में, कई चीज़ों को शामिल किया जाना चाहिए:

उदाहरण के लिए शब्द आईपीए X-SAMPA
बिल्लियां ˈkæts "k{ts
कुत्ते ˈdɑːgs के बजाय ˈdɑːgz "dA:gs के बजाय "dA:gz

रिडक्शन

हर शब्दांश में एक (और सिर्फ़ एक) स्वर होना चाहिए. इसका मतलब है कि आपको सिलेबिक व्यंजन का इस्तेमाल करने से बचें. इसके बजाय, कम स्वर का इस्तेमाल करें. इसके लिए उदाहरण:

उदाहरण के लिए शब्द आईपीए X-SAMPA
किटन ˈkɪtn के बजाय ˈkɪtən "kitn के बजाय "kIt@n
केतली ˈkɛtl के बजाय ˈkɛtəl "kEtl के बजाय "kEt@l

सिलेबिफ़िकेशन

आपके पास . का इस्तेमाल करके, लिखने की सीमाएं तय करने का भी विकल्प है. हर शब्दांश को एक (और केवल एक) स्वर हो. उदाहरण के लिए:

उदाहरण के लिए शब्द आईपीए X-SAMPA
रीडबिलिटी ˌɹiː.də.ˈbɪ.lə.tiː %r\i:.d@."bI.l@.ti:

अवधि

Actions on Google प्लैटफ़ॉर्म, <say-as interpret-as="duration"> को सही तरीके से काम करने में मदद करता है अवधियां पढ़ें. उदाहरण के लिए, नीचे दिए गए उदाहरण को "पांच घंटे और तीस मिनट":

<say-as interpret-as="duration" format="h:m">5:30</say-as>

फ़ॉर्मैट स्ट्रिंग में ये वैल्यू इस्तेमाल की जा सकती हैं:

छोटा रूप मान
h घंटे
m मिनट
s सेकंड
ms मिलीसेकंड

<voice>

<voice> टैग की मदद से, एक एसएसएमएल में एक से ज़्यादा आवाज़ों का इस्तेमाल किया जा सकता है अनुरोध. नीचे दिए गए उदाहरण में, डिफ़ॉल्ट आवाज़ एक अंग्रेज़ी पुरुष की आवाज़ है. "Qu'est-ce qui t'amène छोड़कर सभी शब्द इस आवाज़ में मिलाए जाएंगे cc" का इस्तेमाल करेगा. इस वाक्य को फ़्रेंच में, महिला की आवाज़ में बदला जाएगा डिफ़ॉल्ट भाषा (अंग्रेज़ी) और लिंग (पुरुष).

<speak>And then she asked, <voice language="fr-FR" gender="female">qu'est-ce qui
t'amène ici</voice><break time="250ms"/> in her sweet and gentle voice.</speak>

इसके अलावा, कोई आवाज़ बताने के लिए <voice> टैग का इस्तेमाल किया जा सकता है ( इस पर आवाज़ का नाम इस पेज पर, सिर्फ़ उन भाषाओं और भाषाओं का इस्तेमाल किया जा सकता है जिनमें इसका इस्तेमाल किया जा सकता है) कोई language और/या gender तय करने के बजाय:

<speak>The dog is friendly<voice name="fr-CA-Wavenet-B">mais la chat est
mignon</voice><break time="250ms"/> said a pet shop
owner</speak>

<voice> टैग का इस्तेमाल करने पर, Actions on Google के लिए name ( आपकी आवाज़ का नाम का इस्तेमाल करना है) या नीचे दी गई विशेषताओं का एक साथ इस्तेमाल करें. तीनों एट्रिब्यूट की वैल्यू देना ज़रूरी नहीं है. हालांकि, अगर आपने कोई एट्रिब्यूट नहीं दिया है, तो आपको कम से कम एक एट्रिब्यूट देना होगा name.

  • gender: male, female या neutral में से कोई एक.
  • variant: इसका इस्तेमाल टाईब्रेकर के तौर पर तब किया जाता है, जब कई आपके कॉन्फ़िगरेशन के आधार पर किस आवाज़ का उपयोग करना है.
  • language: आपकी पसंदीदा भाषा. इसमें सिर्फ़ एक भाषा को चुना जा सकता है <voice> टैग दिया गया. अपनी भाषा को BCP-47 फ़ॉर्मैट में बताएं. आप भाषा कोड कॉलम में, अपनी भाषा का BCP-47 कोड अलग-अलग भाषाओं में उपलब्ध आवाज़ों और भाषाओं वाला पेज देखें.

आपके पास हर gender, variant, और language एट्रिब्यूट, दो अतिरिक्त टैग का इस्तेमाल करते हैं: required और ordering.

  • required: अगर किसी एट्रिब्यूट को required के तौर पर सेट किया गया है और उसे कॉन्फ़िगर नहीं किया गया है ठीक से, अनुरोध विफल हो जाता है.
  • ordering: ordering टैग के बाद लिस्ट किए गए किसी भी एट्रिब्यूट को ऐसा माना जाता है पसंदीदा एट्रिब्यूट चुनें. एसएसएमएल का मानना है कि प्राथमिकता के आधार पर चुने गए एट्रिब्यूट, सूची में मौजूद होने के हिसाब से क्रम में लगाए जाते हैं ordering टैग के बाद. अगर पसंदीदा एट्रिब्यूट कॉन्फ़िगर किए गए हों ग़लती से, Actions on Google अब भी मान्य आवाज़ दिखा सकता है, लेकिन ऐसा करके गड़बड़ी का पता लगाया जा सकता है.

required और ordering टैग का इस्तेमाल करने वाले कॉन्फ़िगरेशन के उदाहरण:

<speak>And there it was <voice language="en-GB" gender="male" required="gender"
ordering="gender language">a flying bird </voice>roaring in the skies for the
first time.</speak>
<speak>Today is supposed to be <voice language="en-GB" gender="female"
ordering="language gender">Sunday Funday.</voice></speak>

<lang>

एक ही एसएसएमएल में एक से ज़्यादा भाषाओं में टेक्स्ट शामिल करने के लिए, <lang> का इस्तेमाल किया जा सकता है अनुरोध. सभी भाषाओं को एक ही आवाज़ में संश्लेषित किया जाएगा, जब तक कि आप आवाज़ को साफ़ तौर पर बदलने के लिए <voice> टैग का इस्तेमाल करें. xml:lang स्ट्रिंग में BCP-47 फ़ॉर्मैट में टारगेट भाषा (यह वैल्यू "भाषा कोड" के तौर पर दी गई है इस्तेमाल की जा सकने वाली आवाज़ें तालिका). नीचे दिए गए उदाहरण में "चैट" का इस्तेमाल करें के बजाय फ़्रेंच में बोला जाएगा डिफ़ॉल्ट भाषा (अंग्रेज़ी):

<speak>The french word for cat is <lang xml:lang="fr-FR">chat</lang></speak>

Actions on Google प्लैटफ़ॉर्म, <lang> टैग के साथ बेहतर तरीके से काम करता है. ऐसा हो सकता है कि सभी पक्षों को भाषा के कॉम्बिनेशन से एक ही क्वालिटी के नतीजे तब मिलते हैं, जब इनके लिए एक ही तरीका बताया गया हो एसएसएमएल अनुरोध. कुछ मामलों में, भाषा का एक संयोजन ऐसा प्रभाव उत्पन्न कर सकता है जो पता लगाने लायक है, लेकिन सूक्ष्म या नकारात्मक माना जाता है. पहले से मालूम समस्याएं:

  • <lang> टैग, कांजी वर्णों वाले जैपनीज़ में काम नहीं करता. कॉन्टेंट बनाने इनपुट को ट्रांसलिट्रेट किया गया और चाइनीज़ वर्णों के तौर पर पढ़ा गया.
  • अरबी, हिब्रू और फ़ारसी जैसे सिमिटिक भाषाओं का समर्थन <lang> टैग को सही तरीके से इस्तेमाल करने से आपकी आवाज़ बंद हो जाएगी. अगर आपको इनमें से किसी एक सुविधा का इस्तेमाल करना है, हमारा सुझाव है कि आप <voice> टैग का इस्तेमाल करके, उन भाषाओं आपकी मनचाही भाषा में बात करता है (अगर उपलब्ध हो).