SSML Rehberi: Geliştiriciler için İleri Ses Kontrolü
Düz metin sizi doğal sesin %80'ine götürür. SSML kalan %20'yi sağlar.
SSML Nedir
Konuşma Sentezi İşaret Dili, metni telaffuz ipuçlarıyla işaretlemek için bir W3C standardıdır. Speeko, çekirdek SSML özelliklerini ve sağlayıcıya özel uzantıları destekler.
Temel SSML Etiketleri
break
Belirli bir süre duraklat:
<speak>
İlk cümle. <break time="500ms"/> İkinci cümle.
</speak>emphasis
Belirli kelimeleri vurgula:
<speak>
Bu <emphasis level="strong">çok önemli</emphasis>.
</speak>Seviyeler: reduced, moderate, strong.
prosody
Hız, perde ve ses seviyesini kontrol et:
<speak>
<prosody rate="slow" pitch="low">Gizemli fısıltı</prosody>
<prosody rate="fast" pitch="high">Heyecanlı duyuru</prosody>
</speak>say-as
Metnin yorumlanmasını zorla:
<speak>
Bizi <say-as interpret-as="telephone">0-212-555-0199</say-as> numarasından arayın.
<say-as interpret-as="ordinal">1</say-as>. siparişiniz yola çıktı.
</speak>phoneme
Belirli kelimelerin telaffuzunu geçersiz kıl:
<speak>
<phoneme alphabet="ipa" ph="ˈkoɾʊm">Çorum</phoneme> şehrindeyiz.
</speak>sub
Bir kelimenin okunuşunu değiştir:
<speak>
<sub alias="World Wide Web">WWW</sub> her yerde.
</speak>Pratik Desenler
Noktalama tabanlı dinamik duraklamalar
Noktalar 300ms, virgüller 150ms, kısa çizgiler 250ms alır. Sese göre ayarlayın.
Sayılar ve para birimi
<say-as interpret-as="currency" language="tr-TR">1.234,56 TL</say-as>Yabancı kelimeler
Bir <lang xml:lang="fr-FR">café</lang>'ye gittik.API Kullanımı
{
"text": "<speak>Merhaba <emphasis>dünya</emphasis>.</speak>",
"voice": "tr_female_aylin",
"input_type": "ssml"
}Yaygın Hatalar
<speak>kök elementini unutmak → düz metin olarak işlenir- Aşırı vurgu → doğal olmayan ses
- prosody rate'i 0.5x-2.0x dışında kullanmak → aralığa kırpılır
- Doğrulanmamış fonem IPA → telaffuz hataları
Test Etme
Dağıtmadan önce Speeko'nun playground'unda iterasyon yapın. Çalışan prompt'ları kaydedin.