Script PHP - Conversor de texto para fala e fala para texto



Script PHP - Conversor de texto para fala e fala para texto

Text & Speech permite transformar qualquer texto em fala realista , permitindo que você crie vários conteúdos de mídia, como livros de áudio, podcasts, conteúdo de voz e também aplicativos que falam, e crie categorias totalmente novas de produtos habilitados para fala e também permite que você transcreva áudio em texto em vários formatos , permitindo que você crie transcrições de qualquer conteúdo de áudio e voz , gravações, chamadas de atendimento ao cliente, etc., de maneira simples e eficiente . Serviços da Web , Microsoft Azure , Google Cloud Platform e IBM Cloudpara sintetizar a fala humana com som natural, você pode se registrar com qualquer um deles ou com todos eles de uma vez. Com mais de 900 vozes realistas diferentes em mais de 144 idiomas e dialetos para recurso de texto em fala, você também pode converter fala em texto de forma rápida e precisa com mais de 170 idiomas e dialetos . Além disso, você pode aproveitar o recurso de identificação de alto-falante da AWS e do GCP, que permite identificar até 5 alto-falantes no áudio. A AWS também permite que você use o recurso Live Transcribe em 12 idiomas diferentes.

Além das vozes TTS padrão, o Text & Speech oferece Neural Text-to-Speech (NTTS)vozes que fornecem melhorias avançadas na qualidade da fala por meio de uma nova abordagem de aprendizado de máquina. A maior parte da tecnologia Neural TTS também oferece suporte a estilos de fala exclusivos, dependendo do fornecedor da nuvem, que permitem que você corresponda melhor ao estilo de apresentação do locutor com o aplicativo: Exemplo: um estilo de leitura de apresentador (AWS/Azure) adaptado para casos de uso de narração de notícias , e um estilo de conversação (AWS/Azure) que é ideal para comunicação bidirecional, como aplicativos de telefonia.

Aproveite o uso conveniente de tags SSML para adicionar vários efeitos de voz, como ajuste de tom, volume, velocidade, ênfase, saídas de bipes de palavras ou frases, para citar alguns. A lista completa pode ser encontrada na demonstração ao selecionar as respectivas vozes.


Recursos de texto e fala

  1. Suporte para mais de 144 idiomas e dialetos para conversão de texto em fala
  2. Suporte para mais de 900 vozes e sotaques diferentes para conversão de texto em fala
  3. Suporte para mais de 170 idiomas e dialetos para fala em texto
  4. Suporte para 12 idiomas para transcrição ao vivo para fala em texto
  5. Distribuído por:
    • Amazon Web Services (TTS/STT)
    • Microsoft Azure (TTS)
    • Google Cloud Platform (TTS/STT)
    • IBM Nuvem (TTS)
  6. Vozes com som natural ( Neural TTS )
  7. Vozes Google WaveNet
  8. Várias combinações de efeitos de voz para vozes padrão
  9. Várias combinações de efeitos de voz para vozes neurais
  10. Estúdio de som poderoso
  11. Use qualquer uma das +900 vozes em uma única tarefa de síntese de texto
  12. Misture até 20 vozes em uma única tarefa de síntese de texto
  13. Processe até 60.000 caracteres em uma única tarefa de síntese de texto
  14. Vários formatos de saída de áudio (texto para fala) :
    • MP3 (AWS/Azure/GCP/IBM)
    • OGG (AWS/GCP/IBM/Azure)
    • WAV (GCP/IBM)
    • WEBM (Azure)
  15. Armazene e redistribua a fala facilmente via mídia social
  16. Síntese de texto quase em tempo real
  17. Personalize e controle a saída de voz
  18. Otimize sua transmissão de áudio
  19. Ajustar estilos de fala (para vozes neurais)
  20. Ajuste a velocidade da fala, o tom e o volume
  21. Ajustar a ênfase da fala
  22. Pronuncie dígitos/datas/palavras/abreviaturas corretamente
  23. Adicionar efeito de substituição de trabalho/frase
  24. Silenciar/bipar qualquer parte do texto/frase
  25. Sintetize texto grande diretamente para o seu balde Amazon S3
  26. Armazenar resultados de conversão de texto em fala em:
    • servidor local
    • Amazon S3
    • Armazenamento Wasabi
  27. Compartilhe convenientemente os resultados da síntese ou faça o download
  28. Identificação de alto-falante até 5 pessoas
  29. Transcrição instantânea do GCP para arquivos de áudio curtos
  30. Múltiplos formatos de entrada de áudio ( fala para texto ):
    • MP3 (AWS)
    • OGG (AWS)
    • WAV (AWS/GCP)
    • WEBM (AWS)
    • MP4 (AWS)
    • FLAC (AWS/GCP)
  31. Editar resultados ao vivo
  32. Até 4 horas de duração de arquivo de áudio com AWS (áudio de 2 canais)
  33. Até 8 horas de duração de arquivo de áudio com GCP (1 canal de áudio)
  34. Até 2 GB de tamanho de arquivo de áudio com AWS
  35. Tamanho de arquivo de áudio ilimitado com GCP
  36. Sistema completo de afiliados/referências
  37. Interface totalmente responsiva
  38. Monitore de perto os gastos estimados para os serviços Cloud TTS e STT
  39. Opção de atualização automática com um clique
  40. Desenvolvido com PHP 8.1 e Laravel 9
  41. Documentação detalhada e abrangente
  42. 6 meses de suporte incluso



Preços de texto para fala do fornecedor de nuvem


Preços de voz para texto do fornecedor de nuvem


Notas

Observe que, para que o script funcione corretamente, você precisa ter contas válidas da AWS, GCP, Azure, IBM (você pode usar qualquer combinação de provedores de nuvem, mas pelo menos um provedor de nuvem é necessário. Somente idiomas e vozes de provedores de nuvem ativados estará disponível no script. Para fornecer acesso a todos os +144 idiomas e +909 vozes, você precisa se registrar com todos os 4 fornecedores de nuvem). Não é um aplicativo móvel.




Mais em script php