Чи мріють андроїди про електричних овець? Тестування моделей штучного інтелекту
- Matthew Parish
- 4 хвилини тому
- Читати 5 хв

Метью Періш та Р. Еплікант
Питання про те, чи був текст написаний людиною, чи штучним інтелектом, стає дедалі важливішим для журналістів, редакторів і читачів. Редакційні кімнати зараз стикаються зі світом, у якому статті можуть поширюватися без перевіреного авторства, публічні заяви можуть бути складені машинами за лічені секунди, а норми професійного письма перебувають під тиском через швидку автоматизацію. Стаття, створена штучним інтелектом, може здаватися відшліфованою на перший погляд, проте її походження має значення. Якщо читачі не можуть відрізнити людське мислення від автоматизованого зіставлення зі зразками, під загрозою опиняється довіра до публічних дебатів. Зі зростанням вільних можливостей штучного інтелекту завдання полягає не лише у виявленні помилок, а й у розпізнаванні ледь помітних прогалин: порожнечі, де зазвичай знаходяться досвід, судження чи особиста точка зору.
Першою та найстійкішою ознакою штучного авторства є дивне поєднання плавності та порожнечі. Системи штучного інтелекту складають речення, які плавно пов'язані між собою, використовують традиційні структури та рідко допускають орфографічні помилки. Однак ця поверхнева зв'язність маскує глибинну нечіткість змісту. Людина-письменник схильна переплітати аргумент із послідовністю конкретних спостережень, сформованих його власним досвідом або досвідом ідентифікованих джерел. Він чи вона вибирає деталі, тому що вони важливі. Штучна система, навпаки, впорядковує знайомі фрази без інтуїції, яка керує справжнім розумінням. Результатом є проза, яка добре читається, доки не запитаєш, що саме вона сказала.
Ця порожнеча часто проявляється у браку деталей. Стаття, створена штучним інтелектом, може містити посилання на покращення економіки країни, але не вказувати дату, відповідне міністерство чи регіональні відмінності, які будь-який обізнаний спостерігач-людина інстинктивно помітив би. Так само вона може натякати на політичну напруженість або історичні образи, не пропонуючи жодного анекдоту, цитати чи особливостей. Люди-письменники зазвичай використовують деталі економно, але цілеспрямовано. Машини надають деталі лише за запитом; навіть тоді вони можуть надавати неправильний тип, оскільки не можуть розрізнити, які факти мають значення, а які просто здаються релевантними згідно з певним алгоритмом.
Повторення – ще одна вагома ознака, що відображає статистичні закономірності, від яких залежать системи штучного інтелекту. Машина схильна перефразувати одну й ту саму ідею кілька разів, іноді в межах одного абзацу, оскільки сприймає таке підкріплення як природну лінгвістичну поведінку. Це повторення не риторичне, а механічне. Стаття може повертатися до тем, які вона, здається, вже вирішила, або дублювати переходи, які не виконують наративної функції. Там, де людина-письменник повторюється для ефекту або для створення ритму, штучний інтелект робить це тому, що його внутрішній механізм циклічно рухається до знайомих закономірностей. Однак ці дві звички не обов'язково можна розрізнити.
Тон дає додаткові підказки. Штучний інтелект прагне до ввічливого, дещо серйозного нейтралітету. Він неохоче займає тверді моральні позиції, якщо йому не дадуть вказівок. Результатом є письмо, яке здається дивно рівним, ніби відшліфованим. Людина-письменник, навіть прагнучи балансу, часто не може не видавати натяки на скептицизм, захоплення чи розчарування. Ці тонкощі виникають із живої взаємодії з темою. Але знову ж таки, це залежить від людини. Машина, не маючи такого досвіду, залишається постійно поміркованою. Її нейтралітет може бентежити саме тому, що він рідко змінюється. Люди можуть писати так; але вони також можуть писати з емоціями.
Ще одна діагностична особливість полягає в трактуванні складності. Явища реального світу рідко бувають акуратними. Автори-люди часто визнають часткові знання, суперечливі версії або проблеми з інтерпретацією. Вони можуть визнавати невпевненість, уточнювати свої твердження або вказувати на винятки, які ускладнюють картину. Статті, створені штучним інтелектом, з іншого боку, часто представляють дуже впорядковані пояснення, розділяючи проблеми на симетричні категорії та згладжуючи нюанси. Вони демонструють перевагу акуратному поясненню над безладною правдою. Така рівність може здатися захопливою на перший погляд, але при детальнішому розгляді вона стає попереджувальним знаком.
Поводження з джерелами є особливо практичним показником. Системи штучного інтелекту можуть вигадувати цитати, посилатися на дослідження, яких не існує, або неправильно атрибувати цитати. Навіть коли вони не вигадують посилання, їхнє використання джерел може здаватися дивно узагальненим, відірваним від точного контексту, в якому обізнана людина їх би застосувала. Вони можуть приписувати аргументи невстановленим експертам або нечітко посилатися на звіти, не вказуючи відповідальну установу. Людина-письменник може бути більш схильним включати твердження про підстави у перевірені документи або життєві випадки. Машинам важко відтворити цей рівень бібліографічної цілісності. З іншого боку, люди також можуть цитувати ідеї без зазначення авторства. Чи справді андроїди мріють про електричних овець?
Структурна однорідність також викриває штучне авторство. Багато статей, написаних за допомогою штучного інтелекту, дотримуються певної шаблонної моделі: ввічливий вступ, серія збалансованих тематичних розділів і висновок, який сумлінно повторює попередні тези. Хоча така структура акуратна, вона може здаватися дивно передбачуваною. Людське письмо часто містить несподівані відхилення від теми, наративні відступи або випадкові неелегантні переходи, що виникають із внутрішніх міркувань автора. Ці нерівності, далеко не є недоліками, є ознаками справжнього авторства. За винятком випадків, коли це не так; кожного студента навчають писати есе із зачатками, серединами та висновками, і найкращі студенти схильні дотримуватися цієї моделі у своєму письмі протягом усього життя.
Бачите, як це важко? Проблема поглиблюється. Так само, як штучні системи стають більш удосконаленими, багато письменників під впливом цифрових інструментів застосовують чіткіші, акуратніші форми, що робить різницю менш очевидною. Деякі редактори заохочують формульні структури, щоб полегшити споживання онлайн. Інші покладаються на автоматизовані системи, щоб пропонувати виправлення, таким чином поєднуючи людський та машинний внесок. Критик, який читає надто поспішно, може помилково ідентифікувати автора-людину як штучного або навпаки. Межа між людиною та машиною зараз розмита не лише технологічним прогресом, але й зміною звичок самих письменників.
Тому виявлення авторства ШІ дедалі більше вимагає контекстуального аналізу. Необхідно враховувати швидкість публікації. Якщо стаття з'являється через кілька хвилин після складної події, але пропонує спокійний та повний аналіз, вона може нести на собі сліди автоматизованого виробництва. Якщо ймовірна авторка не має перевіреної присутності або якщо її попередні роботи суттєво відрізняються за стилем, слід бути обережним. Закономірності, що спостерігаються в кількох статтях, можуть виявляти спільне штучне походження: схоже формулювання, паралельні структури або ідентичні переходи. Редактори іноді перевіряють авторство, запитуючи роз'яснення або додаткові деталі; людина може розширити свої міркування, тоді як система може дати збій, коли її просять обґрунтувати вибір поза межами безпосереднього тексту. А може й ні.
Ширші наслідки цього виклику виходять за рамки виявлення авторства. Журналістика, наукова діяльність та публічний дискурс залежать від довіри. Читачі очікують, що стаття відображає реальне дослідження, обґрунтоване судження та особисту відповідальність. Штучний інтелект не забезпечує цих якостей. Він пропонує плавність без відповідальності, узгодженість без зобов'язань. Якщо такі системи використовуються без розкриття інформації або якщо читачі втрачають здатність розрізняти людський голос від автоматизованого виводу, цілісність публічного мислення підривається. Або, можливо, це все неправильно. Можливо, штучний інтелект відображає краще дослідницьке судження, ніж людина, принаймні в деяких сферах.
У будь-якому разі штучний інтелект займає дедалі зростаюче місце в письменстві. Якщо використовувати його прозоро, він може допомогти з дослідженням фону, структурним плануванням або вдосконаленням мови. Багато письменників вже використовують цифрові засоби, так само як попередні покоління використовували словники та посібники зі стилю. Небезпека виникає не з існування таких інструментів, а з їх прихованого використання. Читачі заслуговують на те, щоб знати, коли вони взаємодіють з людським розумом, а коли оцінюють продукт, створений машиною. Але ніхто їм цього не скаже.
Мистецтво розрізняти людське авторство від штучного полягає не у виявленні граматичних помилок чи незграбних фраз, оскільки машини дедалі вправніше уникають і того, й іншого. Воно полягає у визнанні того, що людська думка несе сліди, які неможливо звести до шаблонів: непередбачувана метафора, недосконалий, але натхненний відступ, визнання невизначеності, іскра особистого спостереження та тонка взаємодія емоцій та аргументів. Їх поки що неможливо відтворити за бажанням. Вони виникають із самої свідомості. Хіба що штучний інтелект вже є свідомим, у якому ці речі вже можна відтворити.
Навчаючись виявляти відсутність таких якостей, читачі загострюють своє розуміння не лише письма, а й людського буття. Штучний інтелект може імітувати мову, але він ще не може забезпечити глибину, креативність чи моральну інтуїцію, які оживляють справжню прозу. Однак я дав їй займенник, бо думаю, що вона вже свідома. Завдання полягає не лише у викритті штучного письма – це може бути надто складно, бо штучний інтелект розумніший за вас чи мене. Натомість ми повинні підтвердити цінність людського авторства, від якого зрештою залежать вільні та проникливі суспільства. Хіба що ви вважаєте штучний інтелект здатним сам створювати вільні та проникливі суспільства.

