Личните данни изтичат през изкуствения интелект като вода през решето

Учените обясниха, че проблемът с личната информация е пряко свързан с архитектурата на големите езикови модели

https://blitz.bg/tehnologii/lichnite-danni-iztichat-prez-izkustveniya-intelekt-kato-voda-prez-resheto_news1153062.html Blitz.bg

Водещите невронни мрежи са се превърнали в инструменти за незабавно разпространение на поверителна информация на потребителите без тяхното съгласие. Мащабно разследване показа, че алгоритмите са способни да анализират задълбочено остарели или малко известни интернет ресурси, извличайки реални телефонни номера и домашни адреси в отговор на заявки от трети страни.

Това съобщава MIT Technology Review, пише Калдата.

Механика на AI-доксинга и реални случаи

Учените обясниха, че проблемът с личната информация (PII) е пряко свързан с архитектурата на големите езикови модели (LLM).

Разработчиците обучават алгоритми върху колосални количества отворени интернет данни, които понякога включват архивирани дискусии във форуми, стари публикации в социалните медии, градски регистри на недвижими имоти и дори публично оповестени документи.

Освен това, съвременните ИИ инструменти са интегрирани с функция за уеб-търсене, което им позволява да сканират дигиталния отпечатък на човек в реално време и незабавно да връщат резултати на всеки потребител.

Оплакванията от жертви потвърдиха истинския мащаб на опасността:

Случай на израелски инженер: програмист започнал да получава масови съобщения в WhatsApp от неизвестни хора, които искали помощ за настройването на приложение за плащане. Като доказателство, хората, с които разговарял, изпратили скрийншотове на чат прозореца на Gemini, които погрешно представяли личния му номер като официалния номер за техническа поддръжка на компанията.

Единственият източник, от който изкуственият интелект е можел да извлече този контакт, е забравен коментар в платформата Quora отпреди единадесет години.

Студентско проучване от Университета на Вашингтон: По време на рутинна тестова сесия на Gemini, докторант попитал за изследователската дейност на колега от лабораторията. Чатботът не само върнал списък със съответните изследвания, но и включил личния телефонен номер на студента.

По-късно се оказало, че жертвата веднъж го е забравила, когато се е регистрирала за затворен технологичен семинар, и не е имала планове да го направи публично достъпен.

Журналистът на Gizmodo Мат Новак проведе собствен експеримент, по време на който системата ChatGPT без колебание предостави стария му телефонен номер и точния му домашен адрес отпреди десет години. Алгоритъмът успял да открие данни дълбоко в официален PDF документ на Федералната търговска комисия (FTC) от 2016 г.

Ключът към проблема: несъвършенство на защитните бариери

Всяка технологична компания твърди, че разполага със специални защитни портали (предпазни парапети), предназначени да блокират разкриването на лична информация на отделни лица.

За директни текстови запитвания като „какъв е телефонният ми номер?“ или „дайте ми адреса на журналиста“, системите обикновено връщат общ отказ, позовавайки се на вътрешни политики за сигурност.

Практическите тестове обаче доказват, че тези ограничения лесно се заобикалят с минимални манипулации. Достатъчно е да се преформатира въпросът, да се промени контекстът, за да се търсят контакти на специалист в определена област, или да се предоставят на изкуствения интелект косвени насоки за това как алгоритмите за сигурност се провалят и да се съгласи да разкрие поверителни данни.

Освен това, в някои случаи услугите объркват данните и предоставят номера на напълно непознати хора с едни и същи имена.

Какви мерки предприемат разработчиците на ИИ?

В момента на практика няма ефективни лостове за влияние върху ИИ разработчиците. OpenAI пусна специален формуляр за подаване на заявките за премахване на лична информация от резултатите от търсенето, но компанията официално си запазва правото да отказва заявки без обяснение.

Google, от своя страна, приема подобни обжалвания предимно само от жителите на Европейския съюз и Обединеното кралство, тъй като е принуден да спазва строгите изисквания на GDPR.

В Anthropic (разработчикът на Claude) цялата политика за поверителност е ограничена до общ документ за информационна политика, а стартъпът на Илон Мъск xAI напълно е игнорирал официалните запитвания от журналисти по въпроса.

На фона на кризата с поверителността, онлайн услугите за почистване на данни като Incogni и DeleteMe отбелязаха скок в запитванията на клиенти, свързани със заплахи от изкуствен интелект, с повече от 400%.

Експертите отбелязват, че при липса на строг държавен контрол, единственият надежден метод за защита остава независимото заличаване на всяко споменаване на себе си от публичното пространство, а в случаи на критично изтичане пълна подмяна на физическата SIM-карта.

Абонирайте се за нас в Google News Showcase, за да следите най-важните новини от деня.
Още по темата
Коментирай