Acceder al contenido principal

Provedor TIC

Tecnoloxías da fala: recoñecemento e síntesis da fala, transcrición automática, recoñecemento de locutores. Tecnoloxías de imaxe e video: visión artificial para inspección automática de produtos, recoñecemento facial, monitorización de persoas, estimación demográfica (sexo, edade, accións, etc), sistemas de axuda a conducción (ADAS), sistemas biométricos. Procesamento de imaxe médica. Tecnoloxías de audio: medida de ruido, acondicionamento acústico

E.E.Telecomunicación, Campus Universitario de Vigo, Vigo (Pontevedra)
Tlfn: 986812680

[{"razon_social":"Universidade de Vigo","enderezo_social":"E.E.Telecomunicaci\u00f3n, Campus Universitario de Vigo","localidade":"Vigo","telefono":"986812680","latitud":"","longitud":"","nome_entidade":"Grupo de Tecnolox\u00edas Multimedia \/ Universidade de Vigo"}]

O provedor ten as seguintes sedes:
  • Vigo

Solución(s) TIC

Software de análise de atención a pantallas con segmentación de sexo e idade

Software de clasificación demográfica de persoas a partires dunha secuencia de video en directo o grabada. O software detecta as personas do video que miran cara a cámara nalgún intre, estima o tempo de atención e presenza, o sexo e a idade, se levan gafas, se levan barba, e a distancia á que se encontran. O software pode ser empregado en escenarios moi diferentes: segmentación de anuncios por idade e sexo en cartelería dixital, sacar a máxima rendabilidade de espazos publicitarios, conteo de persoas no sector da seguridade ou coñecer horas de afluencia por idade e sexo no sector comercial, entre outros.

Galician SpeechDat FDB

A Base de datos Galician SpeechDat para telefonía fixa contén as gravacións de voz de 653 falantes (217 homes, 436 mulleres) gravados a través da rede de telfonía fixa. Esta base de datos foi deseñada e grabada pola Universidade de Vigo (UVigo) e a Universidade de Santiago de Compostela (USC). A base de datos obedece as especificacións comúns creadas no proxecto de SpeechDat. A base de datos está dividida en 3 CD-ROMs, en formato de 9660 ISO. O sinal de voz está almacenado como secuencias de 8 bits a 8 KHz codicadas con lei-A, non-comprimida. Cada enunciado está almacenado nun arquivo separado, e cada arquivo de sinal está acompañado por un arquivo de etiquetas en formato SAM-ASCII que contén a información descritiva pertinente. Cada falante pronuncia aproximadamente 44 frases. Tamén se inclúe un léxico de pronunciación coa transcrición fonética en formato SAMPA.

COTOVÍA

Cotovía é un sistema de conversión de texto-a-voz ou síntese de fala (TTS: text-to-speech) baseado na selección de unidades fonéticas para o galego e o castelán. Cotovía foi desenvolvido pola Universidade de Vigo e o centro Ramón Piñeiro para a Investigación en Humanidades, ambos en Galicia. O seu desenvolvemento implicou un grupo investigador de lingüistas e enxeñeiros. Cotovía foi desenvolvido como proxecto investigador, por tanto a maioría de do traballo foi centrado nos aspectos máis interesantes desde un punto de vista científico. A pesar de que o rendemento do sistema de TTS enteiro é bastante bo, hai algunhas partes que poderían ser claramente melloradas. Cotovía pódese tamén utilizar para outros propósitos relacionados como a transcrición automática e o POS tagging.

CORPUS GCG (Grupo Correo Galego)

O corpus GCG (Grupo Correo Galego) é un corpus etiquetado morfosintácticamente para o Galego. Este corpus foi etiquetado de forma semi-automática e revisado manualmente. O corpus contén aproximadamente 400.000 palabras coas súas correspondentes etiquetas de tipo part-of-speech (POS) e algunha información lingüística adicional.

DOGalicia: CORPUS PARALELO GALEGO-CASTELÁN

DOGalicia é un corpus paralelo Galego-Castelán seseñado para tareas de tradución estatística automática. Este corpus obtívose a partir dalgunhas seccións do Diario Oficial de Galicia (DOG) desde 1996 a 2010, e contén máis de 42 millóns de palabras para cada idioma. Os datos están alineados a nivel de frase e almacenados en ficheiros de texto, de forma de que hai unha frase por linea de texto. O texto está en formato UTF-8.

TRANSCRIGAL DB

A base de datos Transcrigal DB contén 31 horas de gravacións de programas de noticias da Television de Galicia (TVG). As gravacións presentan unha gran variedade de temas, falantes, canales acústicos, tipos de fala, etc. O corpus completo foi segmentado, etiquetado e transcrito manualmente utilizando o software denominado TRANSCRIBER, que foi desenvolvido por DGA (DélégationGénérale pour lArmement, France) e LDC (Linguistic Data Consortium, USA), seguindo unhas convencións similares as adoptadas por LDC para a transcrición do corpora HUB-4. As transcricións inclúen turnos de falante, temas e información do canal.