21 червня 2024 року Кеті Драммонд, глобальний редакційний директор Wired, приєдналася до «Squawk Box» CNBC, щоб обговорити нещодавнє поглиблене розслідування пошукового стартапу Perplexity зі штучним інтелектом. Розмова пролила світло на деякі тривожні аспекти діяльності Perplexity і підняла важливі питання про майбутнє ШІ та його вплив на журналістику та точність інформації.

Підйом здивування

Perplexity швидко привернула увагу в світі технологій, забезпечивши значні інвестиції таких відомих діячів, як Джефф Безос, і отримавши оцінку, близьку до мільярда доларів. Однак це стрімке зростання супроводжувалося неабиякою часткою суперечок і скепсису. Розслідування Wired мало на меті проаналізувати, чим насправді займається Perplexity, як він працює та достовірність результатів пошуку.

Результати розслідування: незрозумілі механізми та неточні відповіді

Драммонд підкреслив, що одним із основних висновків розслідування Wired була неоднозначність операційних механізмів Perplexity. Драммонд стверджує, що стартап зі штучним інтелектом, який рекламує себе як складний пошуковий інструмент, часто надає відповіді, які є не тільки неточними, але й потенційно оманливими. Вона каже, що користувачі повідомляли, що отримували відповіді, яким, здавалося б, бракує логічного синтезу, вони значною мірою покладаються на базову агрегацію веб-даних без глибокого аналізу чи розуміння.

Етичні та юридичні проблеми: копіювання та збір даних

Значна частина розслідування була зосереджена на тому, як Perplexity збирає свої дані. Драммонд пояснив, що було виявлено, що Perplexity збирає вміст материнської компанії Wired, Condé Nast, та інших видавців без належного дозволу. Незважаючи на впровадження протоколу robots.txt — стандарту, який використовується для запобігання доступу ботів до певних частин веб-сайту — Perplexity нібито використовував нерозголошені IP-адреси, щоб обійти ці обмеження. Якщо це правда, це викликає серйозні етичні та юридичні занепокоєння щодо того, як компанії ШІ повинні взаємодіяти з журналістським контентом і межами використання даних.

Упередження та якість відповідей ШІ

Обговорення також торкнулося властивих упереджень і якості інформації, яку надають такі інструменти ШІ, як Perplexity. Під час дискусії було акцентовано увагу на проблемі «сміття входить, сміття виходить». Ця концепція підкреслює, що результати штучного інтелекту настільки хороші, наскільки хороші вхідні дані, які вони отримують. Покладення Perplexity на легкодоступні веб-дані, які часто можуть бути упередженими або неточними, означає, що відповіді Perplexity можуть відображати ті самі проблеми.

Драммонд стверджував, що на даний момент найкращий спосіб отримати точну інформацію — це звернутися безпосередньо до джерела — читати журналістику в авторитетних виданнях замість того, щоб покладатися на агрегації ШІ. Це підкреслює фундаментальну проблему в індустрії штучного інтелекту: розробка систем, які можуть розрізняти та визначати пріоритети високоякісної, точної інформації над безліччю ненадійних джерел, доступних в Інтернеті.

Розрив між технологіями та журналістикою

Розмова також торкнулася ширшого впливу ШІ на журналістику. Драммонд зазначив, що індустрія технологій часто була відірвана від цінностей і принципів, які лежать в основі новин і журналістики. Вона каже, що точне та етичне поширення інформації іноді стає супутнім збитком у гонці за розробкою найдосконаліших і цінних інструментів ШІ.

Згідно зі статтею Марка Саллівана для Fast Company, у відповідь на звинувачення Wired співзасновник і генеральний директор Perplexity Аравінд Срінівас сказав, що Perplexity не покладається лише на власні веб-сканери, але також використовує сторонні сервіси для веб-сканування та індексування. Шрінівас зазначив, що веб-сканер, ідентифікований Wired, належав не Perplexity, а неназваному сторонньому постачальнику через Угоду про нерозголошення.

Шрінівас визнав складність негайного припинення доступу стороннього сканера до вмісту Wired, заявивши: «Це складно». Він також підкреслив, що протокол виключення роботів, створений у 1994 році, не є юридично зобов’язуючою структурою, і припустив, що зростання ШІ вимагає нової форми співпраці між творцями контенту та такими платформами, як Perplexity.

Подальша критика виникла, коли Wired продемонстрував, що система відповідей Perplexity може точно перефразувати їхні статті, іноді неточно. Одна помітна помилка включала неправдиву заяву про вчинення злочину офіцером поліції Каліфорнії. Срінівас стверджував, що такі результати, ймовірно, були викликані підказками, розробленими, щоб спровокувати такі відповіді, і підкреслив, що звичайні користувачі не зіткнуться з такими проблемами. Він визнав, що система не застрахована від помилок.

Рекомендоване зображення через Pixabay