Все новости
Это интересно
Сейчас читают
Технологии 5067
Аватар Evernews Evernews

Исследование: люди неплохо распознают голос, сгенерированный ИИ

0
0
Поделиться
Телеграфировать

По мере улучшения нейросетей ситуация может поменяться.

Исследование: люди неплохо распознают голос, сгенерированный ИИ

Нейросети довольно давно могут генерировать музыку и имитировать голоса людей. Высказывались опасения, что такая генерация может использоваться мошенниками, но пока ее качество, видимо, не слишком высоко.

Исследователи из Университетского колледжа Лондона решили выяснить, насколько хорошо люди отличают реальную речь от сгенерированной. В эксперименте поучаствовало 529 человек, слушавших голоса на английском и мандаринском диалекте китайского.

Участникам эксперимента предложили послушать 20 образцов голоса, среди которых были как реальные, так и сгенерированные. Оказалось, что люди распознают подделку в 73% случаев вне зависимости от языка.

Кроме того, добровольцы прослушали 20 пар роликов, в котором одна запись была настоящей, а вторая — нет. На этот раз подделка была распознана в 85% случаев.

После первых экспериментов добровольцам рассказали, по каким признакам можно распознать голос, сгенерированный ИИ. Например, надо обращать внимание на странное заикание и монотонную речь. Затем опыт повторили.

Оказалось, что дополнительное обучение участников эксперимента лишь незначительно увеличило частоту распознавания речи, сгенерированной ИИ.

Важный момент: авторы исследования признают, что использовали для генерации голосов не самые продвинутые нейросети, имеющиеся на данный момент.

Нейросети, занимающиеся генерацией изображений и видео, в последнее время очень быстро прогрессируют. Можно предположить, что похожий прогресс будет наблюдаться и в генерации голоса; возможно, через пару лет отличить реальную запись от сгенерированной станет гораздо сложнее.

Теги: Технологии
Аватар Evernews
Evernews
8068 подписчиков