Las características distintivas de Wenyutong
Asistente de instalación del software Wenyutong
◆ Arquitectura de aplicación conveniente y flexible
Servicio de síntesis de voz en red eficiente y mecanismo de gestión centralizada de recursos basado en TCP/IP, formando una solución orgánica Arquitectura integrada cliente-administrador de recursos-servidor para construir una solución flexible y escalable. Su alta disponibilidad ha sido probada por aplicaciones comerciales clave a gran escala en muchas industrias clave, lo que garantiza la provisión de servicios de voz confiables e ininterrumpidos, 7×24. También admite arquitectura de aplicaciones distribuidas (tecnología patentada). El front-end responsable del análisis y preprocesamiento del texto y el back-end responsable de la síntesis de voz se pueden implementar en servidores remotos respectivamente. Lo que se transmite entre redes remotas es solo lo analizado. e información de texto anotada, por lo que reduce en gran medida los requisitos de ancho de banda de la red para aplicaciones de voz y es muy adecuado para aplicaciones de voz distribuidas a gran escala basadas en Internet. ◆ Interfaz de desarrollo flexible y eficiente
InterPhonic SDK proporciona varias formas de interfaces de desarrollo para diferentes herramientas de desarrollo, diferentes requisitos de integración y soluciones, que incluyen: interfaz de desarrollo estándar (DLL), componentes COM, interfaz de desarrollo SAPI, etc. Los desarrolladores pueden elegir de manera flexible según las necesidades reales. Proporciona documentos y rutinas de desarrollo enriquecidos para ayudar a los socios a acelerar el proceso de desarrollo de aplicaciones de voz.
◆Configuración de parámetros enriquecida y funciones de ajuste flexibles
Proporciona funciones y herramientas de configuración y ajuste de parámetros dinámicos enriquecidos y completos para ayudar a los usuarios a controlar y administrar los efectos de síntesis de voz de manera flexible y eficiente. Proporciona herramientas para configurar y administrar de manera uniforme parámetros globales (como volumen, velocidad de conversación, tono, etc.), diccionarios de usuario, reglas de usuario y paquetes de recursos personalizados para números, signos de puntuación y adición de palabras en inglés y chino; funciones, puede especificar el pinyin o los símbolos fonéticos de cada palabra, etc.; proporciona una interfaz gráfica de usuario unificada y fácil de usar para la configuración de operación, y se puede configurar y ajustar dinámicamente a través de parámetros API. También es compatible con CSSML (chino). Lenguaje de marcado de síntesis de voz) Etiquetar, describir y controlar.
◆Compatible con estándares abiertos
Compatible con el estándar técnico general para el sistema de síntesis de voz chino (GB/T21024-2007) y sigue las definiciones de términos, los estándares de clasificación y el formato de intercambio de datos. estándares estipulados en la norma y especificaciones de aplicación.
Admite el lenguaje de marcado de síntesis de voz (SSML), que forma parte del marco de interfaz de voz del W3C. Es un conjunto de especificaciones para aplicaciones de voz y la creación de aplicaciones de voz en la World Wide Web. A través de SSML, las personas pueden. escuchar más el habla sintética a través de teléfonos móviles, computadoras de escritorio y otros dispositivos, extendiendo la informática y la transmisión de información a todos los rincones del mundo.
Admite el Protocolo de control de recursos multimedia (MRCP), publicado por IETF y que define el estándar de interfaz entre los servidores multimedia y los recursos de voz de la red (incluidos los servidores de reconocimiento y síntesis de voz).
◆ Conjunto de herramientas mejorado, eficiente y conveniente
iFlytek ha acumulado una rica experiencia práctica en el proceso a largo plazo de ayudar a los clientes con el desarrollo de aplicaciones y la optimización de efectos. Sobre esta base, ha ido avanzando gradualmente. Se ha formado una serie de componentes eficientes y fáciles de usar, como herramientas de aplicación de voz fuera de línea, herramientas de edición visual CSSML, herramientas de conversión de formato de texto DOC/XLS, etc. El uso flexible de estas herramientas puede ayudar a acelerar el desarrollo de aplicaciones, optimizar los efectos de síntesis y facilitar el mantenimiento del sistema y el soporte técnico.
◆ Compatibilidad con conjuntos de caracteres y formatos de datos de voz
Totalmente compatible con conjuntos de caracteres codificados GB2312, GBK, BIG5, GB18030, UTF-8 y UNICODE, reconoce automáticamente texto UNICODE y admite salida directa de texto UNICODE; Múltiples datos de voz en múltiples formatos, como Wav lineal, Wav de velocidad A/U y Vox con varias frecuencias de muestreo (incluidos 6K/8K/11K/16K).
◆ Amplia compatibilidad con plataformas
Admite los principales sistemas operativos, el servidor es compatible con Windows, Unix, Linux y otros sistemas operativos, y el cliente es compatible con Microsoft Windows, SUN Solaris, REDHAT Linux, SUSE Linux y otros sistemas operativos.
Tenemos casos de integración exitosos con plataformas relacionadas y proveedores de equipos reconocidos en la industria. A través de una estrecha cooperación con muchos proveedores de plataformas y equipos, integradores de sistemas y desarrolladores de software, podemos asegurarnos de brindar a los usuarios servicios profesionales en todo el proceso de solicitud de voz.
◆ CSSML, el efecto se puede mejorar más libremente
CSSML (Chinese Speech Synthesis Markup Language) es una especificación de descripción de datos de voz china propuesta y dirigida por iFlytek. Este estándar ha recibido gran atención y apoyo del Grupo Nacional de Expertos 863, el Comité Nacional de Balizas y la Oficina Estatal de Supervisión Técnica. En 2005, pasó oficialmente la revisión de la Organización Nacional de Normalización y se convirtió en una parte importante de la técnica de síntesis de voz china. estándares y especificaciones. Diseñado y ampliado para aplicaciones de voz en chino, CSSML puede marcar y controlar de manera flexible una variedad de funciones y es compatible con SSML.
◆ Voz pregrabada, conexión fluida y fácil aplicación
InterPhonic proporciona la innovadora función de gestión unificada de pregrabación de la industria, utilizando la pregrabación como recurso del sistema de síntesis de voz. y la combinación inteligente a través de sonidos de avisos y plantillas de síntesis facilita la combinación de grabaciones previas con sonidos sintetizados y hace que la conexión sea más fluida. Al mismo tiempo, evita problemas frecuentes de conmutación y transición entre la reproducción de sonidos de avisos y la síntesis de voz, y simplifica la complejidad de. el proceso de solicitud y mejora aún más los efectos y la calidad del servicio.
◆ La música de fondo puede mejorar rápidamente el examen físico del usuario.
InterPhonic proporciona la primera función de sonido de fondo de la industria. A través de las herramientas simples y fáciles de usar proporcionadas por el sistema, usted puede. agregue música de fondo y ajuste el fondo de manera rápida y eficiente. Se puede comparar el volumen de la música y el habla sintetizada, y el efecto real se puede escuchar directamente, lo que hace que el servicio de voz sea más amigable y natural.