Разработчики из Массачусетского технологического института представили необычную нейронную сеть под названием Speech2Face.

И если вкратце, то данная ИИ-система определяет по голосу человека его возраст, пол и этническую принадлежность, а после, на основе полученных данных, рисует его портрет.

Разработчики говорят, что для обучения Speech2Face использовалось несколько миллионов видео с голосами разных людей. Также отмечается, что система работает благодаря нескольким алгоритмам. Один из них анализирует короткие видео и делает снимок лица человека в анфас. А другой воссоздает из аудиодорожки ролика спектрограмму речи и на ее основе генерирует примерный портрет пользователя.

Что касается точности Speech2Face, то она почти всегда может установить пол человека. А вот возраст, искусственному интеллекту дается уже не так хорошо. Кроме того, ИИ может ошибиться с определением расы. Однако азиатов и европейцев он угадывает чаще, чем всех остальных. По словам создателей, это обуславливается неравномерным распределением народностей в обучающих видео.


Источник: Speech2Face

Qualcomm Snapdragon 8cx «уделал» Intel Core i5-8250U

Предыдущий пост

Все желающие могут записаться на первые в мире онлайн-курсы по квантовому программированию

Следующий пост

Оставить комментарий

avatar
 
smilegrinwinkmrgreenneutraltwistedarrowshockunamusedcooleviloopsrazzrollcryeeklolmadsadexclamationquestionideahmmbegwhewchucklesillyenvyshutmouth
  Подписаться  
Уведомление о

Вам может понравиться

Еще больше из категории Интересное