Наука и технологии

Внимание: AI ни мами по телефона - няма да познаете никога, че не е истински!

Задайте въпрос на някои от популярните чатботове и те ще ви отговорят с впечатляващо добра реч

15:04 | 16 декември 24

Внимание: AI ни мами по телефона - няма да познаете никога, че не е истински!

7117

0

Представете си да чуете запис на своя собствен глас, напълно идентичен с вашия диалект и звук, дори с вашите говорни дефекти..., но гласът говори неща, които никога не сте изричал/а.

Да, синтезираната от изкуствен интелект (ИИ) човешка реч вече е с шокиращо високо качество - звучи съвсем реалистично, използва дори акценти и шепот и най-страшното - клонира идеално чужди гласове. Как тогава можем да различим тези гласове от човешките, пита британската обществена медия Би Би Си в своя прясна разработка по темата.

Разговор

Днес е доста лесно да започнете разговор с ИИ. Задайте въпрос на някои от популярните чатботове и те ще ви отговорят с впечатляващо добра реч. Можете да разговаряте с тях на различни езици и да поискате отговор на конкретен диалект или с определен акцент.

Вече е възможно обаче да се използват ИИ инструменти за клониране на реч, за да се пресъздадат гласовете на реални хора. Наскоро такъв инструмент беше използван за копиране на гласа на покоен британски телевизионен водещ и то за осемсерийно предаване. Междувременно известният природоизследовател сър Дейвид Атънбъро бе "дълбоко разтревожен", когато чу собствения си глас, клониран чрез ИИ, да казва неща, които никога не е произнасял.

Цели

Не всички гласове, генерирани от ИИ, се използват с недоброжелателни цели, разбира се. Често това се прави, за да се ползват в чатботове, за да отговарят и водят разговори с потребителите по естествен и убедителен начин.

Например гласовата функция на ChatGPT вече може да отговаря с вариации в тона и акцента върху определени думи, подобно на човешката способност за изразяване на емпатия и емоция. Тя може също така да разбира невербални знаци като въздишки и ридания, да говори на 50 езика и да имитира акценти в реално време.

Може дори да извършва телефонни обаждания от ваше име с различни задачи. По време на една скорошна демонстрация на OpenAI системата след определени инструкции поръча ягоди от търговец по телефона.

Разлика

Но въпросът е има ли нещо уникално в човешкия глас, което да ни помогне да го различим от този, генериран на ИИ. Джонатан Харингтън, професор по фонетика и дигитална обработка на речта в Университета в Мюнхен, Германия, е изучавал десетилетия наред как хората говорят.

Дори и той е впечатлен от възможностите на синтезаторите на реч, задвижвани от ИИ. Съвсем наскоро той тествал стотици слушатели с реална и изкуствена реч и над половината от тях не успели да различат коя коя е.

Стив Гробман, главен технологичен директор на компанията за киберсигурност McAfee, е сред затруднилите се. „Имаше определени детайли извън речта, като например вдишването, които ме караха да мисля, че това е човек, но ритъмът, балансът и тоналността ме насочваха към ИИ”, споделя той.

Според Гробман човешкото ухо трудно улавя тези разлики. „Хората са много слаби в това”, казва той, обяснявайки, че тук софтуерът може да помогне много. Това е ключово, особено за случаите на т.нар. дълбоки фалшификати, които злонамерени лица правят, за да манипулират обществеността. Гробман дава пример с видео на съоснователя на Microsoft Бил Гейтс, в което той „препоръчва” инвестиция във фонд за квантова търговия на акции.

За човешкото ухо аудиото звучи точно като Гейтс. Когато го пуснали на софтуер за разпознаване на измами обаче, той веднага засякъл, че става дума за дълбок фалшификат. Наскоро Гробман и компанията му хващат реклама, в която редом с истински фрази, изречени от певицата Тейлър Суифт, са преплетени и такива, създадени от ИИ.

Пит Николети, глобален директор по информационната сигурност в Check Point Software, съветва да се обръща внимание на изкривявания и несъответствия в звуковия фон.

Липсата на вариации в силата, ритъма и тона на гласа също може да създаде подозрение за клониран глас. „Живеем в постреален свят, в който клонирани чрез ИИ гласове са толкова добри, че могат дори да заблудят системите за гласова верификация на банки и кредитни компании”, казва Николети.

Интонация

Дейн Шеретс, архитект на иновациите в HackerOne, общност от ловци на такива уязвимости, смята, че естествената интонация и дишането никога не могат да бъдат изцяло пресъздадени.

Той съветва да се обръща внимание на акцентирането в изречението - поставянето на ударение над определени думи - с цел да се придаде повече смисъл на точно тази дума. Интонацията - промяната във височината на гласа в рамките на изречението - също е ключов елемент. Тя може да превърне едно твърдение („Мариана направи мармалад”) във въпрос („Мариана направи мармалад?”).

Опасност

Съществуват обаче индикации, че тези различия между езика на ИИ и този на хората могат да намалеят. „Моделите за синтез на реч стават все по-добри в добавянето на елементи като интонация, паузи и дори т.нар. усмивка в гласа”, отбелязва Гренън. Но въпреки напредъка тези технологии все още се сблъскват с предизвикателства при разбиране на контекста.

Например при създаване на клониран глас, който да чете новинарски текст, ИИ все още се затруднява с правилното интониране при различни емоционални ситуации - трагична новина или радостен репортаж.

Риск

Фалшиви гласове, генерирани от ИИ, могат да представляват сериозен риск. Примерите варират от измами с имитиране на чужд глас по телефона до дезинформация в социалните медии.

Клонираните гласове вече се използват дори за телефонни измами, при които се имитират познати на жертвата лица, за да се искат пари. Канадски инвеститор наскоро бе измамен с 11 милиона долара, след като е повярвал, че говори със свой близък адвокат, чийто глас е бил клониран с помощта на ИИ. Според Гробман защитата срещу този вид измами включва не само технологии, но и образование.

„Трябва да подготвим хората да разпознават контекста”, казва той.

„Ако получите обаждане от познат човек с молба за спешен превод на пари, вече не можете да сте сигурен, че това отсреща наистина е той само защото гласът е същият. Ще трябва да се вслушвате в тон, емоционалност, акцентиране на думи...”

Добро средство за разпознаване на измамата винаги си остава задаването на въпроси, отговори на които само вие и лицето знаете. Защото ИИ може да наподоби гласа на приятеля ви от училище, но няма как да знае какво сте му подарил на 17-ия рожден ден.

Добави blitz.bg в предпочитани източници в Google →