Feb
27

Due software gratuiti e open source per il ‘Text to Speech’ (TTS)

Qualche giorno fa, per esigenze di lavoro, mi sono messo alla ricerca di software ‘Text to speech’ (traducibile in italiano in ‘dal testo al parlato’), ovvero capace di leggere con una voce umana sintetizzata un testo scritto, riproducendo i suoni corrispondenti al testo.

Le mie esigenze erano:

  • software gratuito o open source funzionante su Windows XP
  • buona sintetizzazione della voce umana
  • possibilità  di esportare il lavoro in mp3 e/o wav e/o ogg

Dopo numerose ricerche, sono stati 2 i software che hanno soddisfatto tutte le mie esigenze:

DSpeech

progettato (da un italiano) specificamente per fornire in maniera rapida e diretta le funzioni di maggiore utilità  pratica che si richiedono ai programmi di questo tipo, mantenendo al contempo al minimo l’invasività  e il consumo di risorse (non si installa, non si integra nel sistema, è leggerissimo, si avvia in un attimo e non scrive niente nel registro). Le sue principali caratteristiche sono queste:

  • permette di salvare l’output sotto forma di un file Wav, Ogg o Mp3
  • permette di selezionare rapidamente voci diverse e combinarle tra loro per creare dialoghi fra più voci
  • integra un sistema di riconoscimento vocale che, tramite un semplice linguaggio di script, consente di creare dialoghi interattivi con l’utente
  • permette di configurare le voci in maniera indipendente
  • tramite appositi TAG, consente di variare dinamicamente le caratteristiche delle voci durante la riproduzione (velocità , volume e frequenza), inserire pause, enfatizzare termini o fare lo spelling
  • permette di catturare e riprodurre automaticamente il contenuto del ClipBoard
  • supporta tutti gli engine vocali compatibili con SAPI 4 e 5.

eSpeak

software multi-linguaggio, open source e che funziona sia su Windows che su Linux. Le sue principali caratteristiche sono queste:

  • comprende varie voci le cui caratteristiche possono essere variate
  • dimensione compatta. Programma e dati occupano circa 700 kByte
  • può registrare l’output su file WAV.
  • può scomporre il testo in fonemi, quindi può essere usato come interfaccia per altri motori di sintesi vocale
  • possibilità  di riprodurre più lingue. àˆ incluso il supporto rudimentale (e forse ridicolo) per il tedesco e l’esperanto
  • la versione per Windows supporta tutti gli engine vocali compatibili con SAPI 5.

Concludendo, se avete bisogno di un software TTS e non volete spendere decine di euro per un software commerciale, sono sicuro che questi programmi fanno esattamente al caso vostro! Mi raccomando: provateli e fatemi sapere come vi sembrano! ;-)

33 commenti a “Due software gratuiti e open source per il ‘Text to Speech’ (TTS)”


  1. 1 Miguel
    27 Febbraio 2008 alle 9:55 Quota

    .. Interessante .. Io avevo invece cercato un software al contrario, cioè speach to text. Se hai qualcosa di OpenSource da proporre ne sarei interessato!

  2. 2 Paolo
    27 Febbraio 2008 alle 10:16 Quota

    @Miguel: no, purtroppo non ne conosco :-(

    CIao, Paolo.

  3. 3 Daniele S.
    27 Febbraio 2008 alle 11:07 Quota

    :) Interessanti entrambi e complimenti per il nuovo tema… molto bello

  4. 4 Paolo
    27 Febbraio 2008 alle 15:04 Quota

    @Daniele: grazie mille per entrambe le cose ;-)

    Ciao, Paolo.

  5. 5 giuliano
    27 Febbraio 2008 alle 19:54 Quota

    a me piacerebbe trovare uno screenreader per ipovedenti e non-vedenti…qualcuno ha consigli?

  6. 6 necroclerico
    27 Febbraio 2008 alle 21:40 Quota

    grazie mille per la dritta. cercavo un TTS comodo per il mio podcast. ti farò sapere come va….. Thanks a lot!

  7. 7 Paolo
    27 Febbraio 2008 alle 21:57 Quota

    @giuliano e @all: ma perchè postate commenti ad un articolo cercando sempre qualcos’altro?!?! Non lo capirò mai credo!

    @necroclerico: io lo uso a quello scopo, la voce non è come quella umana, ma non è neanche malissimo!

    Ciao, Paolo.

  8. 8 IsaFelina
    28 Febbraio 2008 alle 14:41 Quota

    (y) Uso eSpeak da tempo …un auita per li mie bambini per il inglese , ottimo
    Salutti

  9. 9 Paolo
    28 Febbraio 2008 alle 17:15 Quota

    @IsaFelina: davvero ottimo e soprattutto open source :-D

    Ciao, Paolo.

  10. 10 Bruno Vivi
    18 Marzo 2008 alle 0:43 Quota

    Come screen reader potete usa nvda http://www.nvda.it che utilizza anche Espeak

  11. 11 Paolo
    18 Marzo 2008 alle 12:43 Quota

    @Bruno Vivi: bello! Grazie della segnalazione ;-)

    Ciao, Paolo.

  12. 12 DAB
    19 Marzo 2008 alle 18:53 Quota

    scusate SONO DISPERATO…STO CERCANDO DI CAPIRE il funzionamente della registrazione dopo la lettura di un file txt. CIò CHE NON CAPISCO è:
    MA XCHè LA REGISTRAZIONE è BASSA?…OSSIA LA FA PER FORZA IN OUT PUT?
    MA X FARE UNA REGISTRAZIONE interna che faccia sentire solo la voce della macchina nel file wav o mp3?
    NON SO SE MI SONO SPIEGATO.
    MA DIPENDE PER CASO DA QUELL’OPZIONE IN ALTO A DESTRA DOVE C’è SCRITTO: altoparlanti realtek ?…xchè a me non la fa aprire quella…è fissa su altoparlanti.

    IO vorrei capire come fare a salvare una registrazione post lettura a voce piena e non bassa col brusio sotto. non capisco a che periferica si riferisca la registrazione.
    SE FACCIO LA REGISTRAZIONE CON LA MIA VOCE OK è ALTA XCHè IL MICROFONO è alto …ma quella della voce meccanica viene bassa….
    mi sapete aiutare?
    graziw

  13. 13 Paolo
    20 Marzo 2008 alle 8:40 Quota

    @DAB: non ho ben capito cosa vuoi fare e cosa non ti funziona. Comunque apri un qualsiasi file che vuoi far leggere (con File -> Apri), seleziona la voce che vuoi utilizzare (il Realtek ….. nel 3° “riquadro” è normalissimo), poi salvi (con File -> Salva wav, mp3 … ).

    Semplicissimo, no?

    Ciao, Paolo.

  14. 14 al
    16 Ottobre 2008 alle 15:22 Quota

    Provate la SINTESI VOCALE IN LINGUA ITALIANA della SLD SOFTWARE “VOCE VIVA”?
    E’ veramente eccezionale per naturalezza ed espressione!

    Ascolta in tempo reale:
    http://demoserver1.ath.cx:51234/

    P.S. – non è gratuita

  15. 15 Paolo
    17 Ottobre 2008 alle 0:03 Quota

    @al: a parte che ho rimosso il link perchè non mi piace che si venga a fare pubblicità  qui, comunque ho ascoltato la demo e la qualità  è simile ai software GRATUITI citati nell’articolo.

    L’unico software commerciale che vale la pena davvero di comprare è Loquendo!

    Ciao, Paolo.

  16. 16 elena
    19 Febbraio 2009 alle 15:09 Quota

    DSpeech non riesco a scaricarlo, il file che è presente nel sito zippato mi risulta corrotto … da che altra fonte posso fare il download? grazie … adesso provo espeak buona vita elena

  17. 17 elena
    19 Febbraio 2009 alle 15:31 Quota

    espeak interessante … anche se per fortuna siamo bel lontani dalla replicazione della voce umana :- )

  18. 18 Paolo
    22 Febbraio 2009 alle 15:11 Quota

    @elena: non saprei, io riesco a scaricarlo correttamente comunque!

    Ciao, Paolo.

  19. 19 riccardo
    27 Ottobre 2009 alle 3:38 Quota

    ti ringrazio per la dritta, mi è piaciuto DSpeech, ti chiedo però un aiuto: mi ocorreva sapere come si fa ad implementare in un programmino visual basic 2008 su SO Vista un semplice TTS, dovunque abbia cercato tutti la fanno facile, ma nessuno dice come si fa!
    sapresti aiutarmi?

  20. 20 Paolo
    27 Ottobre 2009 alle 22:55 Quota

    Mi spiace, per me VB (così come tutti i linguaggi Microsoft) sono terra sconosciuta e rimarranno tali, spero!

    Ciao, Paolo.

  21. 21 riccardo
    27 Ottobre 2009 alle 23:59 Quota

    ok!
    grazie comunque.

  22. 22 Raul
    20 Novembre 2009 alle 8:50 Quota

    Conosci anche qualche software TTS commerciale che si possa acquistare anche per privati?

  23. 23 Raul
    20 Novembre 2009 alle 8:55 Quota

    Certamente che non costi molto, ho visto quello dell’Audiolic che costa troppo!!!

  24. 24 Paolo
    30 Novembre 2009 alle 21:43 Quota

    @Raul: a me piace molto Loquendo e non mi sembra costi un’esagerazione!

    Ciao, Paolo.

  25. 25 Raul
    11 Dicembre 2009 alle 21:43 Quota

    Ciao Paolo, ho chiesto a Loquendo, ma mi hanno risposto che non vendono a privati

  26. 26 Raul
    12 Dicembre 2009 alle 10:42 Quota

    Ciao Paolo, sono ancora io. Visto che quando ho domandato a Loquendo dove posso acquistare il loro programma mi hanno risposto che non vendono a privati, tu sapresti dirmi dove posso acquistarlo?
    Ti saluto in attesa di tua risposta. Raul

  27. 27 edo
    28 Gennaio 2010 alle 16:29 Quota

    magari sono solo io ma non riesco a mettere l’italiano nè in eSpeak ne in dspeech

    così “come va” lo pronuncia “cam viei”

    help please
    edo

  28. 28 edo
    28 Gennaio 2010 alle 17:29 Quota

    no tutto risolto grazie |-)

  29. 29 Giancarlo
    28 Giugno 2012 alle 13:39 Quota

    Circa un mese fa ho trovato su internet un sito, credo tedesco, che faceva vedere un programma in grado di trasformare in testo una conversazione televisiva tra la Merkel e Sarkosy. Il testo aveva due varianti, una senza le pause e una con le pause, credo le chiamassero Markierung. Ho provato a scrivere una e-mail dall’interno del sito, soprattutto per sapere quanto veniva a costare quel programma, e come potevo avere più informazioni su di esso, ma non ho ricevuto alcuna risposta. Purtroppo non ho preso nota del sito perchè credevo che, per educazione, qualcosa mi avrebbero risposto. Ho provato a cercare di nuovo il sito, ma non sono più riuscito a trovarlo.

  30. 30 gioacchino
    31 Dicembre 2012 alle 11:01 Quota

    edo ha scritto:

    magari sono solo io ma non riesco a mettere l’italiano nè in eSpeak ne in dspeech

    così “come va” lo pronuncia “cam viei”

    help please
    edo

    ionon ci

  31. 31 gioacchino
    31 Dicembre 2012 alle 11:03 Quota

    gioacchino ha scritto:

    edo ha scritto:

    magari sono solo io ma non riesco a mettere l’italiano nè in eSpeak ne in dspeech

    così “come va” lo pronuncia “cam viei”

    help please
    edo

    ionon ci

    riesco come devo fare ?

  32. 32 demis
    23 Novembre 2013 alle 12:25 Quota

    salve dove posso scaricare il programma?

  33. 33 simon
    18 Novembre 2014 alle 0:27 Quota

    ciao,
    sono capitato qui alla ricerca di un sw o api TTS e ho trovato DSpeech, che ho mi è sembrato veramente comodo per le 2 cose che dovevo fare.
    Grazie!

Lascia un commento

Nome

Email (non verrà pubblicata)

Sito web (opzionale)

Quanto fa 2 + 5 ? (protezione antispam)





Hai bisogno di un sito web?

Web&Dintorni

Vuoi collaborare a questo blog?

Ogni tipo di collaborazione è benvenuta!


Scrivimi all'indirizzo paolo.gatti@gmail.com o invia un messaggio sulla pagina Facebook!