Amazon Polly, Gönderilerinizin Sözlü Sürümlerini Oluşturmak İçin Nasıl Kullanılabilir?
Özetle, metin-konuşma teknolojisi, başka türlü yaşayamayan insanların web'i deneyimlemelerini sağlamanın güçlü bir yoludur. Teknoloji geliştikçe, oldukça takdire şayan bir şekilde çalışıyor – ancak birisi size yüksek sesle okuyormuş gibi kulağa doğal geldiği bir noktaya gelmedi.
Amazon'un gerçekçi konuşmaya mümkün olduğunca yaklaşmayı amaçlayan Polly projesi burada devreye giriyor. Bu yazıda, metin okuma yazılımlarının mevcut durumundan bahsedeceğiz ve sizi Amazon Polly projesiyle tanıştıracağız. Ardından Amazon Polly ve WordPress'in birlikte nasıl oynadığına dair izlenimlerimiz hakkında konuşacağız. Hadi konuşalım!
Text-to-Speech Yazılımı Nedir (Ve Kullanmak Ne Zaman Mantıklı)
Metin-konuşma yazılımı kavramı basittir – bir paragraf, bir sayfa, bir makale, hatta bir kitabın tamamını alırsınız ve bir bilgisayarın size yüksek sesle okumasını sağlarsınız. İnsanlar metinden konuşmaya düşündüklerinde, bunu genellikle robotik seslerle ve üsluptaki kadanslarla ilişkilendirirler. Ancak, özellikle modern yazılımlarda, artık durum genellikle böyle değildir.
Bazı insanlar için metinden konuşmaya bir hile gibi gelebilir, ancak bu, aşağıdakiler gibi çok pratik uygulamaları olan bir teknolojidir:
- Engellilerin 'okumasını' sağlamak. Metin-konuşma yazılımının en belirgin kullanımı, görme engelli kişilerin yazılı içeriği kullanmasını sağlamaktır.
- Bir el-off okuma deneyimi sağlar. Görme yeteneğiniz mükemmel olsa bile, bazen bir şeyi okumak yerine dinlemek daha rahat veya kullanışlıdır.
- İçeriğin sesli sürümlerinin bulunmadığı durumlar için. Bu günlerde, en popüler kitaplar da ses formatında yayınlanmaktadır. Ancak aynı şey makaleler, şiirler ve daha fazlası dahil olmak üzere diğer yazılı içeriklerin çoğu için geçerli değildir. Metin-konuşma yazılımı, istediğiniz herhangi bir yazılı içeriği (işlevsellik yerleşik olduğu sürece) istediğiniz kadar dinlemenizi sağlar.
Teknik açıdan, metinden konuşmaya doğru bir şekilde ulaşmak, hayal edebileceğinizden çok daha zordur. İnsan konuşmasını kaydetmek ve çoğaltmak, bizi bir sonraki bölüme getiren yalnızca başlangıçtır.
Metin Okuma Yazılımının Mevcut Durumu
Birkaç yıl önce bile metin-konuşma yazılımının kulağa nasıl geldiğini hatırlarsanız, teknolojiye pek sıcak bakmayabilirsiniz. Ancak, bu tür yazılımlar son birkaç yılda çok yol kat etti. İşte Amazon Kindle'ın Gurur ve Önyargı'yı okuyan metin-konuşma işlevinin eylem halindeki hızlı bir örneği:
Videonun, bazıları hayal ettiğinizden daha iyi ses çıkaran birkaç ses gösterdiğini fark edeceksiniz. Kabul etmek gerekir ki, hepsi biraz yapmacık ama özellikle İngiliz'in yorumunu duymak oldukça keyifli. Bir insanın metni okurken nasıl ses çıkaracağı arasındaki fark dikkat çekicidir. Bununla birlikte, birisinin metinden konuşmaya kullanarak tüm bir kitap üzerinde çalışması ve yine de bundan zevk alması söz konusu değil. Ayrıca, bilgisayar anlatıcınız sözlerini asla yormaz veya bulamaz, bu da ona insanlar üzerinde bir avantaj sağlar.
Doğal olarak, Natural Reader gibi iyi metin okuma özellikleri sunan birçok başka yazılım var. Bu program, belgelerinizi açmanıza ve düzenlemenize, içeriği yapıştırmanıza ve 50'den fazla farklı sesle yüksek sesle okumanıza olanak tanır. İşte yazılımın sunduğu seslerden bazılarını kullanan hızlı bir tanıtım videosu:
Natural Reader ve Amazon arasındaki kalite farkı açıktır. Konuşma çok daha mekanik geliyor ve kelimeler arasındaki duraklamalar daha belirgin. Bununla birlikte, okuyucunun hızını artırmak, bu sorunları maskelemek için iyi bir iş çıkarır.
Özetlemek gerekirse, metinden konuşmaya yazılım söz konusu olduğunda kalite açısından hala çok fazla çeşitlilik var. Birkaç yıl içinde, makine öğrenimi uygulamaları sayesinde teknoloji muhtemelen büyük bir sıçrama yapacak. Bu aşamada, size yüksek sesle okunan bir makineyi veya gerçek bir insanı dinlerken bunu ayırt etmek artık o kadar kolay olmayabilir.
Amazon Polly'ye Giriş

Amazon Polly, 40'tan fazla benzersiz ses kullanarak 20'den fazla dilde metni konuşmaya dönüştürmenize olanak tanıyan bir bulut hizmetidir. Hizmet 2016'dan beri var, ancak 2018'de Amazon, WordPress kullanıcılarının web sitelerine entegre etmesine yardımcı olmak için bir eklenti başlattı.
Eklentinin kendisi, Amazon ve WP Engine arasındaki ortak bir çabanın ürünüydü. Hem Amazon Web Services (AWS) ile çalışan web sitelerinde hem de bağımsız web sunucularında çalışan web sitelerinde çalışır. Her iki durumda da, yazılı içeriğiniz için ses oluşturmak ve kullanıcıların bunu yeniden üretmesini sağlamak için Polly'yi kullanabilirsiniz. Ayrıca, gönderilerinizin sesli sürümlerini kendi sunucunuzda veya Amazon'un Basit Depolama Hizmetini (S3) kullanarak bir ücret karşılığında saklamanıza olanak tanır.
Bu sayfada, farklı dillerde birkaç Amazon Polly konuşması örneği bulabilirsiniz:

Örnekler oldukça kısa ama özellikle İngilizce sesler oldukça iyi. Kindle'ınızdaki metni konuşmaya dönüştürme deneyimiyle hemen hemen aynı, muhtemelen aynı teknolojiyi kullandığı düşünüldüğünde beklenecek.
Maliyetlere gelince, Polly'yi kullanmak için bir AWS hesabına ihtiyacınız olacak. Ancak hizmet, 12 aya kadar ücretsiz olarak ayda beş milyon karakteri destekler. Size bir fikir vermek için, her İngilizce kelime için ortalama yedi ila sekiz karakter vardır. Bu, uzun soluklu bir romanın yaklaşık altı katı uzunluğundaki Amazon Polly'yi kullanarak ücretsiz olarak ayda 600.000'den fazla kelimeye ulaşıyor.
Ana Özellikler:
- Metniniz için 20'den fazla dilde konuşma oluşturun.
- Metniniz için 40'tan fazla ses arasından seçim yapın.
- Tüm WordPress içeriğiniz için metinden konuşmaya varsayılan olarak açın.
- Gönderilerinizin sesli sürümleri için bir oynatıcı oluşturun ve yerleşimini kontrol edin.
- Ses dosyalarınızı sunucunuzda veya Amazon S3 kullanarak depolayın.
- Ayda beş milyona kadar karakteri ücretsiz olarak sese dönüştürün.
Fiyat: Ücretsiz ve premium katmanlar mevcuttur | Daha fazla bilgi
Amazon Polly Eklentisini Kullanma Deneyimimiz
Amazon Polly'yi WordPress'e yüklemek oldukça basittir. Eklentiyi etkinleştirdikten sonra, bir erişim ve gizli anahtar kullanarak eklentiyi AWS hesabınıza bağlamanız yeterlidir:

Eklentiyi AWS hesabınıza bağladığınızda, varsayılan olarak hangi sesi kullanması gerektiğini yapılandırabilirsiniz. Diğer ayarlar, metinden sese sesin hızını kontrol eden oynatma hızını ve Amazon Polly'nin bunu yeniden oluşturmak için kullandığı oynatıcının konumunu içerir:

Amazon Polly ses dosyalarınız için, kullanıcı deneyiminiz için kapalı tutmanızı önerdiğimiz bir otomatik oynatma seçeneği bile var. Ayrıca Amazon Polly'nin gönderileriniz için ses dosyalarını nerede depolayacağını, S3 hesabınıza kaydetme seçeneği de dahil olmak üzere yapılandırabilirsiniz. Amazon CloudFront kullanıyorsanız, sunucularınız üzerindeki etkiyi azaltmak için sesinizi dağıtmak için de kullanabilirsiniz:

Bizi şaşırtan özelliklerden biri, bir iTunes hesabına bağlayabileceğiniz Amazon Polly'yi kullanarak bir podcast beslemesi oluşturma yeteneğiydi. Kişisel olarak, yüksek kaliteli bir podcast için metin-konuşma kalitesinin henüz tam olarak orada olduğunu düşünmüyoruz. Ancak, bu seçeneği dahil etmek doğru yönde atılmış bir adımdır:

Amazon Polly'yi etkinleştirirseniz, gönderilerinizin her birine bir ses çalar eklenir. Ancak, gönderiler için metin okuma işlevini duruma göre kapatabilirsiniz. Bunları düzenleyin ve içinde Amazon Polly'yi Etkinleştir meta kutusunu arayın:

Bu widget ayrıca, her bir gönderi için konuşma oluşturmanın ne kadara mal olacağını önizlemenize olanak tanır, bu hoş bir dokunuş. Artık ziyaretçiler gönderilerinize eriştiğinde Amazon Polly'nin müzik çalarına tıklayabilecek, arkalarına yaslanıp onları rahatça dinleyebilecekler. Genel olarak, bu eklenti sayesinde hizmeti WordPress ile entegre etme deneyimi oldukça basittir.
Çözüm
Gerçeğe yakın sesler, metinden konuşmaya yazılımların kutsal kâsesidir. Sorun şu ki, neredeyse sonsuz sayıda kelime kombinasyonuna sahip olduğunuzda gerçek bir kişinin nasıl ses çıkardığını taklit etmek karmaşıktır. Buna rağmen, metin okuma yazılımı gelişmeye devam ediyor ve Amazon Polly, bu özelliği web sitelerinize ve uygulamalarınıza eklemeniz için size harika bir yol sunuyor.
Kulağa nasıl geldiğine gelince, Amazon Polly iyi bir metin okuma deneyimi sunar. Özel WordPress entegrasyonunun kurulumu kolaydır ve AWS'nin rekabetçi fiyatları sayesinde size gerçekten çok az maliyetli olacaktır.
Web sitenize metinden konuşmaya işlevi ekleme hakkında sorularınız mı var? Aşağıdaki yorumlar bölümünde sorun!
VectorEps / Shutterstock.com'dan makale görseli küçük resmi.
ev borcu WordPress sitesi