Не секрет, что очень много контента в интернет написано с использованием ChatGPT и альтернативных разработок на базе искусственного интеллекта (AI). Можно ли отличить то, что написано человеком, о того, что написано машиной?

В этой статье я перечислю самые верные признаки, которое должны указывать на сгенерированный при помощи ИИ текст, а также расскажу про 7 самых популярных бесплатных онлайн сервисов детекторов ChatGPT, Bing AI, Google Bard и пр.

Основные признаки сгенерированного AI текста

Я попросил ChatGPT перечислить самые яркие признаки того, что текст сгенерирован AI, и вот какой ответ он дал:

  1. Чрезмерно формальный язык. AI имеет тенденцию создавать текст, который хотя и является грамматически выверенным (модели ИИ обучаются на больших наборах данных с правильной грамматикой и орфографией), но может выглядеть чересчур формально. Признаками генерёнки могут быть неестественные фразы или отсутствие шаблонов разговорного языка.
  2. Недостаток конкретных знаний. Каждая языковая модель обучается на данных, имеющихся до какой-то даты. Например, знания GPT 3,5 ограничены сведениями вплоть до Сентября 2021 г. Если тексту не хватает сведений о последних событиях, можно предположить, что он создан искусственным интеллектом.
  3. Частые противоречивые утверждения. ChatGPT может предоставлять по запросу непоследовательную или противоречивую информацию. Несоответствия в естественной человеческой речи встречаются реже, поэтому частые противоречия могут быть признаком текста, сгенерированного ИИ.
  4. Отсутствие эмоционального понимания. Нейросети на данном этапе плохо понимают и выражают эмоции. Они могут давать общие ответы там, где требуется какая-то эмоциональная окраска.
  5. Отсутствие личного или субъективного опыта. В тексте, сгенерированном AI, часто отсутствует личное отношение к предмету, субъективная точка зрения, которую люди обычно включают в свои тексты. Зачастую это приводит к довольно общим ответам, которые не отражают глубокого понимания конкретного вопроса.
  6. Необычные сочетания слов. Сгенерированные фразы и предложения часто выглядят для человека необычно из-за редкого или нетрадиционного выбора и сочетания слов. Также нередко встречается повторяющееся использование определенных фраз, выражений или языковых шаблонов в течение небольшого по объему текста, что свидетельствует об отсутствии разнообразия и творчества.
  7. Отсутствие культурных отсылок. Сгенерированный текст может демонстрировать ограниченное понимание или использование культурных отсылок, идиом, сленга или текущих тенденций, которые обычно используют люди как в устной, так и в письменной речи.

Важно отметить, что эти признаки следует рассматривать в совокупности, поскольку ни один из перечисленных выше индикаторов в отдельности не может окончательно свидетельствовать о том, что текст был создан при помощи AI. И вот тут на помощь придут те самые детекторы AI, которые с высокой долей вероятности подскажут сгенерирован ли конкретный текст при помощи ChatGPT, Jasper и альтернативных разработок.

Лучшие бесплатные AI детекторы

Copyleaks AI Content Detector

Copyleaks является первым в своем роде сервисом, который обнаруживает генерёнку на многих языках, включая английский, русский, польский, немецкий и пр. Определяет контент, созданный с помощью ChatGPT, GPT-4, GPT-3, Jasper и других языковых моделей.

Бесплатные детекторы контента, сгенерированного ИИ

Среди прочих особенностей:

  1. Легко интегрируется с некоторыми из самых популярных систем управления обучением (LMS).
  2. Функция проверки на плагиат.
  3. Есть расширение для Chrome, что значительно повышает удобство работы с ним в браузерах.

Поддержка русского языка: есть.

AI Text Classifier

Данный сервис представлен разработчиком самой языковой модели ChatGPT. Чтобы результат проверки был максимально точный, нужно использовать текст как минимум 1 тыс. символов (150-200 слов).

Бесплатные детекторы контента, сгенерированного ИИ

По признанию самих же разработчиков, AI Text Classifier с высокой долей вероятности ошибется в своей оценке в тексте, написанном детьми, и в тексте не на английском языке, потому что его алгоритм был в первую очередь обучен на базе английского контента, написанного взрослыми людьми.

Данный сервис не дает числовых оценок вероятности генерёнки, но вместо них дает описательные (вероятно, маловероятно и пр.)

Поддержка русского языка: есть.

ContentAtScale Chat GPT Detector

Полностью бесплатный сервис определения текста, написанного ИИ. Для более-менее точного результата требует введения не менее 25 слов. Алгоритм сервиса использует в работе сочетание трех движков искусственного интеллекта, алгоритмов NLP и семантического анализа, а также парсинг поисковой выдачи Google.

Бесплатные детекторы контента, сгенерированного ИИ

Разработчики ContentAtScale заявляют об уникальности своего сервиса, поскольку он основан на самых передовых разработках.

Поддержка русского языка: есть.

Winston AI Detection

Данный сервис был создан главным образом для преподавателей и является, по признаниям многих, одним из лучших для проверки того, был ли текст написан самим студентом или создан им при помощи ИИ.

Бесплатные детекторы контента, сгенерированного ИИ

Основные характеристики Winston AI Detection:

  • Работает со всеми версиями ChatGPT, включая GPT-4.
  • Алгоритм сервиса также обнаруживает плагиат и предоставляет список повторяющихся текстов, найденных в Интернет.
  • Бесплатно можно отправить для проверки не более 2 тыс. слов.
  • Можно загружать файлы Word, PDF, а также нераспознанные сканы или фотографии документов.

Поддержка русского языка: нет.

GPTZero

Довольно популярный сервис, имеющий аудиторию свыше миллиона пользователей. Поскольку его алгоритм был обучен на большом объеме текста, написанного человеком, куда вошли написанные студентами статьи, новостные и научные публикации по дисциплинам в области естественных и гуманитарных наук, то GPTZero считается одним из лучших именно для преподавателей.

Бесплатные детекторы контента, сгенерированного ИИ

Особенности GPTZero:

  1. Проверка на AI бесплатна, платная версия также предлагает средство проверки на плагиат.
  2. Использует уникальные маркеры сгенерированного текста (perplexity и burstiness).
  3. Можно анализировать файлы pdf, docx, txt.

Поддержка русского языка: есть.

Originality.AI

Originality.ai работает как в виде самостоятельного онлайн сервиса, так и в виде расширения для Хрома и всех браузеров на том же движке. После регистрации вы получите 50 кредитов — этого хватит для пятидесяти бесплатных проверок на генеренку. Потом придется раскошелиться на $0,01 за 100 слов.

Есть функция проверки на плагиат. Работает с языковыми моделями GPT-2, GPT-3, GPT-NEO, GPT-J, ChatGPT, GPT 3.5 и GPT 4.

Бесплатные детекторы контента, сгенерированного ИИ

По отзывам пользователей, данный детектор является одним из самых точных при обнаружении как текстов, написанных AI, так и текстов, написанных человеком. Идеально подходит тем, кто работает с копирайтерами и заказывает статьи для сайтов.

Поддержка русского языка: есть.

Writer’s AI Content Detector

Бесплатный инструмент проверки сгенерированного контента. За раз принимает до 1500 символов текста.

Бесплатные детекторы контента, сгенерированного ИИ

Уникальной особенностью данного сервиса является то, что вы можете вставлять как сам текст , так и указывать URL для анализа.

Поддержка русского языка: нет.

Какой из AI-детекторов лучше?

Все перечисленные выше онлайн сервисы хорошо справляются с задачей определения контента, созданного в ChatGPT и других нейросетях. Выбирать стоит, пожалуй, лишь по удобству пользования, возможности загрузки документов, отправки URL и пр.

Все сервисы-детекторы гарантируют высокий процент достоверности анализа и смело заявляют, что смогут отличить текст, написанный человеком, от текста, написанного нейросетью, с достоверностью от 90 до 99,1%. На мой взгляд, это слишком смелое заявление 🙂 Интересно было бы изучить как данные сервисы проявят себя на конкретных примерах и какой результат покажут на самом деле. Поэтому предлагаю следующее…

Если вам тоже был бы интересен такой эксперимент, напишите об этом в комментариях и поделитесь данной статьёй в социальных сетях или Телеграм. Если я увижу, что комментариев к статье наберется хотя бы 10-15 штук (и число лайков меня тоже вдохновит), то я проведу большое тестирование перечисленных в статье детекторов AI-контента и напишу по его результатам отдельную статью. Тогда все точки над i будут расставлены.

Источник