Год назад я наткнулся на статью, которая предсказывала деградацию нейросетей и автор приводил интересную теорию:
● Нейросети обучаются на контенте из интернета, который по большей части делает человек.
● Качество итоговой работы нейросети на данный момент ниже, чем оригинальный контент живого автора. Логические и смысловые ошибки, а так же некое "отсутствие души".
● Несмотря на это, нейросети массово используют для создания контента. Растет количество некачественных материалов в интернете и нейросеть начинает брать эти данные для обучения.
● Из-за общего снижения качества "скармливаемой" информации, нейросеть начинает тупить, все чаще повторяя свои же ошибки и неточности.
Вот недавно я решил поиграть в Kenshi, вспомнить лор и почитать информацию о фракциях. И первая же статья которую мне выдает поиск Яндекса выглядит так:
▸ Я может быть какое то обновление пропустил, но про "Сеть" в Кенши не слыхал
Увидев этот странный текст, я из интереса перешел по ссылке, а там безумие в чистом виде!
▸ Даже в Kenshi есть свой филиал "Без баб"
▸ А как вам такое? Холодные осадки в Kenshi осознали себя и из погодных условий превратились во фракцию
▸ А Шеки решили позабыть свой культ битвы и стать торговцами тех-охотниками
Для тех кто еще не понял - эта статья написана нейросетями!
Написана убого, коряво, без намека на логику, но с нужными SEO элементами - тот самый информационный мусор. А самое забавное, что мусор вынесен на первую позицию поисковой выдачи Яндекса. Да что там, 5 из 15 ссылок на первой странице поиска вели на такие же плоды нейросетей разной степени бредовости.
И в этом ключевая проблема нейросетей - слишком высокая скорость генерации контента. Она априори будет выше, чем создание уникального контента от живого автора. Ужасное качество итогового продукта меркнет на фоне человеческой жадности и лени.
Какая задача у информационного контента в 21 веке? Решить проблему пользователя? Нет - привлечь трафик и желательно здесь и сейчас, ведь трафик это деньги. Поэтому количество такого контента будет расти в геометрической прогрессии.
Масштаб проблемы и как она будет решаться в будущем?
На мой взгляд ключевой момент - это умение отличать материалы живого человека и материалы сделанные нейросетью. И я говорю даже не про умение пользователя, а про умение машинных систем.
● Для самих нейросетей встает вопрос обучения. Chat-GPT потребляет информацию из интернета и недавно с него сняли ограничения 2021 года (все что вышло позже этой даты нейросеть не учитывала). Если на системном уровне не будет фильтра, то в обозримом будущем качество ответов заметно упадет, ведь они будут составляться на основе ошибочных материалов созданных нейросетью до этого.
● Google, Яндекс и другие поисковики в какой то момент столкнутся с недоверием аудитории, ведь перестанут решать основную задачу пользователя - поиск полезной информации. Пока что их инструменты оценки качества контента слишком примитивны, что доказывает пример приведенный в начале статьи (1/3 выдачи поиска загажена мусором нейросетей). Единственный возможный критерий отбора доступный в данной ситуации - отдавать приоритет оригинальным статьям от живого автора.
Я пишу эту статью для того, чтобы люди более критично относились к информации в интернете и поддерживали живых авторов. Экспертного контента в сети все меньше и нельзя позволить ему утонуть под лавиной бреда нейросетей. В конце концов за ошибкой человека стоит мыслительный процесс, а за ошибкой нейросети - случайный алгоритм. И пока что к человеку доверия больше, чем к машине.
Ждем, когда техно-жрецы найдут решение этой проблемы и оно вскроет еще десяток других. А пока подписывайся на мой гоблинский блог - тут много интересного про разработку игр и нейросети.
P.S. По поводу моего месячного отсутствия. Несмотря на навалившийся ворох дел - я не забрасывал изучение инструментов для разработки игр. Просто написание статьей не вписывалось в мое плотное расписание. В ближайшие пару недель постараюсь выложить новую статью про Godot.