Мошенники научились подделывать голоса с помощью нейросети
Мошенники научились подделывать голоса людей с помощью нейросети
На новый уровень охоты за деньгами россиян вышли телефонные мошенники. В сообщники они взяли искусственный интеллект, который теперь умеет подделывать чужие голоса. О первых случаях применения этой схемы и о том, как она работает, – Анна Воропай.
Александра показывает переписку – от ее имени мошенники отправили знакомым десятки сообщений. С общим смыслом: привет, вышли деньги. Чтобы получилось правдоподобно, в стандартную схему обмана добавили новый элемент: голосовое сообщение.
Тембр, интонация. Да и сам голос, будто записанный на бегу, – все это так напоминало настоящего собеседника. Скорее всего, образец мошенники взяли из аудиосообщений во взломанном мессенджере.
"У нас ведь действительно хранятся в облаке сообщения, которые мы пересылаем, голосовые. Просто надо чистить кэш наверное, убирать голосовые. Тогда не будет таких ситуаций, даже если взломают", – рассказала жертва мошенников Александра Никитина.
С появлением новой схемы мошенничества под удар попадают все, кто отправляет голосовые сообщения. И даже любителям текстовых теперь стоит задуматься, какие видео они публикуют в социальных сетях. Ведь для создания клона голоса достаточно записи длиной всего в несколько минут.
"Первым делом нам нужно создать семпл голоса – то есть то, на чем будет обучаться нейронная сеть. Возьмем любой ваш сюжет, тут вы говорите что-то, мы возьмем этот голос, дальше закинем в программу", – рассказал специалист по информационной безопасности Роберт Симонян.
Нейронная сеть думает и достаточно быстро выдает черновую версию. По тексту, который ей написали.
"Вот что мы получили за такое время: "Привет, скинь мне, пожалуйста, 10 тысяч, я тебе потом расскажу, почему надо". Похоже?" – интересуется Симонян.
Похоже, кажется, близкие и родные, конечно, заметят разницу, а вот остальные – нет. Хотя это – стопроцентный фейк.
От массового применения нового типа интернет-попрошайничества пока оберегают сами технологии. На создание копии голоса нейросети сейчас нужно много времени.
"Если мы хотим голос конкретного человека – от часа до двух, в зависимости от сложности, от дефектов речи. Ну и также стоит понимать, что конечный результат тоже не всегда идеален, приходится что-то обрабатывать", – рассказал Симонян.
Подделку голоса можно отличить как раз по чрезмерной обработке. Если в записи сильно шумит ветер, громко едут машины, лают собаки – стоит насторожиться. Но главное: голос нейросети все равно звучит немного механически.
"Это, конечно, полное отсутствие эмоциональности в речи, то есть она обычный бубнеж, человек не задерживает свою речь, не хмыкает, не ухмыляется, не интонирует", – говорит руководитель департамента информационно-аналитических исследований компании по защите информационных систем Игорь Бедеров.
Понять это можно, только если вслушаться. Вот только мошенники часто берут жертв на испуг – имитируют ситуации, когда деньги нужны срочно. Запись голоса они могут получить даже у самого осторожного человека, просто позвонив по телефону с каким-нибудь опросом. Вполне возможно, совсем скоро голос робота в трубке, предупреждающий, что ваш разговор может быть записан, заставит быстро закончить беседу.
"Утечки каких-то голосовых записей – по крайней мере, о таких случаях я не слышал, но, конечно, это возможно. Все зависит от уровня защищенности инфраструктуры конкретной компании. Которая занимается записью переговоров", – подчеркнул директор по информационной безопасности компании по защите веб-приложений Лев Палей.
Специалисты не исключают: в будущем записи разговоров с клиентами аферисты будут продавать. Так же, как сейчас они торгуют базами телефонов. И тогда дипфейки, основанные на подделке голоса, могут стать грозным оружием.