Компьютер научился воссоздавать внешность человека по звуку его голоса

Ученые научили нейросеть воссоздавать лицо человека по его голосу

Нейросетевая модель смогла воссоздать по записи голоса человека примерное изображение его лица.

Результаты своей работы ученые опубликовали на сайте arXiv. org — крупнейшем в мире архиве электронных публикаций научных статей.

Алгоритм, сообщили исследователи, называется Speech2Face.

На основе записи голоса человека нейросеть может запросто определить его пол. С определением национальности у Speech2Face все пока чуть сложнее. То же можно сказать и о возрасте респондента.

Но портрет говорящего, который составляет алгоритм, более или менее похож на хозяина голоса на записи.

На данный момент Speech2Face при определении возраста человека может ошибиться на 5-10 лет. По словам ученых, нейросеть лучше всего воссоздает лица людей с европейской и азиатской внешностью.

Исследователи признали, что точность воссоздания внешности человека по записи его голоса всегда будет оставаться довольно низкой. Дело во множестве особенностей, влияющих на нашу речь. Например, указывают ученые, голос претерпевает значительные изменения с возрастом.

Специалисты сосредоточились на прогнозировании трех параметров — пола, возраста и национальности. И так как пол и национальность Speech2Face определяет с высокой точностью, своей работой они пока что довольны.

Ранее "Правда.Ру" писала о том, что в Эстонии создадут судью-робота, который будет заниматься мелкими судебными тяжбами.

Читайте также:

Ученые ищут способ остановить "восстание машин".