foto testa

flyscribe

FLYSCRIBE

Scarica la Brochure FlyScribe.



download

PERVOICE

Scarica la Brochure PerVoice.

Public   >>   FAQ
 

FAQ - Le risposte alle domande più frequenti

  1. FlyScribe è un servizio creato dalla società PerVoice per tutti coloro che hanno la necessità di trasformare file audio in file testo. Alcuni esempi possono essere aziende del settore della trascrizione e della convegnistica ma anche radioTV che intendono trascrivere testi per la sottotitolazione o l'indicizzazione dei programmi (media indexing), o call center che vogliono strutturare l'informazione parlata a fini di business intelligence.
  2. Una volta ottenute le credenziali di accesso tramite contratto con PerVoice, l'utente entra nel sistema e trova a disposizione una schermata per il carico del file audio. Nella schermata viene anche chiesto di indicare il modello di linguaggio più adeguato ai contenuti da trascrivere e il modello acustico relativo all'ambiente dove è stata effettuata la registrazione (es. microfono, canale televisivo, canale telefonico). Il file viene spedito ed elaborato presso i server di PerVoice. L'elaborazione può essere seguita da una schermata di gestione (Worklist) che informa l'utente sullo stato di trattamento dell'audio. Quando appare lo stato "Completato" il file trascritto può essere scaricato sul PC dell'utente.
  3. PerVoice e il cliente devono concordare un contratto in base alle specifiche esigenze. Per ulteriori informazioni commerciali, contattare marketing@pervoice.it
  4. I formati MP3, OGG e WAV sono supportati sempre. FlyScribe è utilizzabile anche con diversi altri formati il cui l'utilizzo va concordato separatamente. Per maggiori informazioni mandare un e-mail a assistenza@pervoice.it
  5. Sì, attraverso l'uso di appositi software che si possono trovare in rete. Esempi di software adatti disponibili gratuitamente sono dbPowerAmp e Audacity. Si raccomanda comunque di non convertire il segnale audio per aumentare forzatamente la qualità o frequenza di campionamento, in quanto si otterrà un risultato peggiore dell'originale. Per ulteriori informazioni sui formati vedere il manuale raccolta audio.
  6. Per ottenere dei buoni risultati la registrazione deve essere fatta almeno con una frequenza di 16000Hz (8000Hz per l'audio telefonico) per canale e campionamento 16bit per campione. Se il file viene compresso , si raccomanda di utilizzare un bitrate di almeno 64kbps per i file OGG e di 80kbps per i file MP3 per canale.
  7. I file sottoposti a FlyScribe non devono superare le dimensioni di 540MB di dimensione. In caso di file di grandi dimensioni, si consiglia dunque di utilizzare file audio compressi (OGG, MP3) ed eventualmente di dividere gli stessi in più parti. Non esiste un limite minimo. Si consiglia tuttavia di sottoporre file di durata maggiore ai 2 minuti, in quanto daranno luogo ad una trascrizione più accurata.
  8. La qualità della trascrizione dipende da diversi fattori tra cui i principali sono l'adeguatezza dei modelli acustico e del linguaggio scelti, la qualità dell'audio, la dinamica del segnale vocale che è generalmente correlata all'emotività del parlato spontaneo. Con una scelta corretta di questi fattori la percentuale di riconoscimento è superiore al 90%. È opportuno sottolineare che le inflessioni dialettali delle regioni italiane sono supportate mentre il parlato in dialetto non viene riconosciuto.
  9. Un modello di linguaggio (MdL) descrive il tipo di linguaggio utilizzato. Si compone essenzialmente di un vocabolario che contiene tutte le parole ammesse e di una struttura probabilistica che determina la plausibilità delle frasi che con esse si possono formare. Un MdL contiene un insieme di parole tipico di un determinato ambito Esso è quindi dipendente dall'ambito del discorso e per questo FlyScribe permette la selezione di differenti modelli del linguaggio.
  10. Il modello acustico descrive il tipo di canale acustico utilizzato (es. telefonico, radioTV, microfonico). Esso è influenzato per lo più da fattori ambientali e acustici. Possono essere realizzati modelli acustici personalizzati su rumori di fondo ben definiti.
  11. I modelli di linguaggio disponibili alla data coprono tutto l'ambiente della trascrizione Istituzionale Locale (es. Comuni, Province, Regioni) e Centrale (es. Parlamento, Ministeri). Inoltre è disponibile tutto l'ambiente giornalistico, che include anche alcune specializzazioni (es. economico, sportivo). Altri modelli riguardano la convegnistica, l'ambito scientifico e l'area medico-radiologica. PerVoice sta rilasciando nuovi modelli con cadenza mensile. Con i propri sistemi, PerVoice è in grado di preparare nuovi modelli personalizzati in tempi inferiori al mese.
  12. È opportuno scegliere il modello di linguaggio e il modello acustico che più si avvicinano all'ambiente e contesto di registrazione da trascrivere. L'assistenza PerVoice può dare utili indicazioni per orientare l'utente alla scelta più adeguata di modello acustico e modello del linguaggio in funzione del file audio da trascrivere.
  13. Sì. FlyScribe funziona anche per altre lingue. Attualmente sono disponibili dei modelli di linguaggio Istituzionale per l'Inglese e lo Spagnolo. Una nuova lingua può essere realizzata in pochi mesi.
  14. Le trascrizioni vengono salvate in un formato XML proprietario - .pvt (PerVoice Transcription) che conserva, oltre al testo della trascrizione, le informazioni sul time code di ogni parola, sul parlatore, e altro ancora.
  15. Gli argomenti che FlyScribe può trattare sono ristretti ai modelli di linguaggio disponibili. Per alcuni argomenti possono andare bene i modelli di linguaggio più generali, per argomenti molto specifici occorre utilizzare modelli ad hoc. L'assistenza PerVoice (assistenza@pervoice.it) è a disposizione per qualunque informazione.

Top