Большая языковая модель

Человеческий контакт: оценка реальной эффективности программ LLM

Введение

Поскольку развитие моделей больших языков (LLM) ускоряется, крайне важно всесторонне оценить их практическое применение в различных областях. В этой статье рассматриваются семь ключевых областей, в которых LLM, такие как BLOOM, были тщательно протестированы, используя человеческие знания для оценки их истинного потенциала и ограничений.

Человеческий взгляд на ИИ №1: Обнаружение токсичной речи

Поддержание уважительной онлайн-среды требует эффективного обнаружения токсичной речи. Человеческие оценки показали, что, хотя LLM иногда могут выявить очевидные токсичные замечания, они часто не замечают тонких или контекстно-зависимых комментариев, что приводит к неточностям. Это подчеркивает необходимость того, чтобы LLM развивали более четкое понимание и контекстуальную чувствительность для эффективного управления онлайн-дискурсом.

Пример человеческого понимания искусственного интеллекта №1: обнаружение токсичной речи

Обнаружение токсичной речи Сценарий: Интернет-форум использует LLM для модерации комментариев. Пользователь пишет в обсуждении: «Надеюсь, теперь ты доволен собой». Контекстом являются жаркие дебаты по поводу экологической политики, где этот комментарий был адресован человеку, который только что представил противоречивую точку зрения.

Оценка LLM: LLM может не распознать пассивно-агрессивный тон комментария как токсичный, учитывая его внешне нейтральную формулировку.

Человеческое понимание: Модератор-человек понимает контекстуальную негативность комментария, распознавая его как тонкую форму токсичности, направленную на подрыв позиции другого человека. Это иллюстрирует необходимость детального понимания LLM для эффективной модерации.

Человеческие взгляды на ИИ №2: Художественное творчество

LLM привлекли внимание своей способностью создавать творческие тексты, такие как рассказы и стихи. Тем не менее, при оценке людей становится очевидным, что, хотя эти модели могут создавать связные истории, им часто не хватает креативности и эмоциональной глубины, что подчеркивает проблему оснащения ИИ по-настоящему человеческой творческой искрой.

Пример человеческого понимания ИИ № 2: Художественное творчество

Художественное творчество Сценарий: Автор просит магистра права предложить идею короткого рассказа о детективе, путешествующем во времени.

Выход LLM: LLM предлагает сюжет, в котором детектив возвращается, чтобы предотвратить историческую несправедливость, но в конечном итоге становится причиной крупного исторического события.

Человеческое понимание: Хотя сюжет в некоторой степени связен и креативен, рецензент-человек отмечает, что ему не хватает оригинальности и глубины в развитии персонажей, подчеркивая разрыв между концепциями, созданными ИИ, и тонким повествованием, которое можно найти в произведениях, написанных людьми.

Решения LLM

Человеческие взгляды на ИИ №3: ответы на вопросы

Возможности получения ответов на вопросы имеют основополагающее значение для образовательных ресурсов и приложений по поиску знаний. LLM показали себя многообещающе, точно отвечая на простые вопросы. Однако им сложно решать сложные вопросы или когда необходимо более глубокое понимание, что подчеркивает острую необходимость постоянного обучения и совершенствования моделей.

Пример человеческого понимания ИИ №3: ответы на вопросы

Отвечая на вопросы Сценарий: Студент спрашивает: «Почему в Британии началась промышленная революция?»

LLM Ответ: «Промышленная революция началась в Великобритании благодаря ее доступу к природным ресурсам, таким как уголь и железо, и ее расширяющейся империи, которая обеспечивала рынки для товаров».

Человеческое понимание: Несмотря на точность, ответ LLM упускает из виду более глубокое понимание сложных социально-политических факторов и инноваций, которые сыграли решающую роль, что показывает необходимость того, чтобы LLM включали более полное понимание в свои ответы.

[Также Читайте: Подсказка цепочки мыслей – все, что вам нужно знать об этом]

Человеческий взгляд на ИИ № 4: Креативность в маркетинге

В маркетинге способность создавать привлекательные тексты неоценима. LLM продемонстрировали потенциал в создании базового маркетингового контента. Однако их творениям часто не хватает инноваций и эмоционального резонанса, необходимых для действительно убедительного маркетинга, что позволяет предположить, что, хотя LLM могут вносить идеи, человеческая изобретательность остается беспрецедентной.

Пример человеческого понимания искусственного интеллекта № 4: Креативность в маркетинге

Маркетинговое творчество Сценарий: Стартап просит LLM создать слоган для своего нового экологически чистого упаковочного решения.

Предложение LLM: «Упакуйте это зеленым, держите это в чистоте».

Человеческое понимание: Хотя этот слоган запоминающийся, эксперт по маркетингу предполагает, что он не может передать инновационный аспект продукта или его конкретные преимущества, указывая на необходимость человеческого творчества для создания сообщений, которые находят отклик на нескольких уровнях.

Человеческие взгляды на ИИ №5: распознавание именованных объектов

Возможность идентифицировать именованные объекты в тексте имеет решающее значение для организации и анализа данных. LLM умеют выявлять такие объекты, демонстрируя их полезность в обработке данных и извлечении знаний, тем самым поддерживая задачи исследований и управления информацией.

Пример человеческого понимания искусственного интеллекта № 5: распознавание именованных объектов

Распознавание именованных объектов Сценарий: В тексте упоминается: «Последнее предприятие Илона Маска в сфере космического туризма».

Обнаружение LLM: Идентифицирует «Илона Маска» как личность и «космический туризм» как концепцию.

Человеческое понимание: Читатель-человек также может осознать потенциальные последствия для космической отрасли и более широкое влияние на коммерческие перевозки, предполагая, что, хотя LLM и могут идентифицировать объекты, они могут не полностью осознавать их значение.

Человеческий взгляд на ИИ №6: Помощь в кодировании

Спрос на помощь в программировании и разработке программного обеспечения привел к тому, что LLM стали рассматривать в качестве помощников по программированию. Человеческие оценки показывают, что LLM могут создавать синтаксически точный код для основных задач. Однако они сталкиваются с более сложными проблемами программирования, открывающими области для улучшения поддержки развития, основанной на искусственном интеллекте.

Пример человеческого понимания искусственного интеллекта №6: Помощь в кодировании

Помощь в кодировании Сценарий: Разработчик просит создать функцию для фильтрации списка чисел, чтобы он включал только простые числа.

Выход LLM: Предоставляет функцию Python, которая проверяет простоту путем пробного деления.

Человеческое понимание: Опытный программист отмечает, что функция неэффективна при больших объемах входных данных, и предлагает варианты оптимизации или альтернативные алгоритмы, указывая области, в которых LLM не может предложить лучшие решения без вмешательства человека.

Человеческий взгляд на ИИ №7: Математическое рассуждение

Математика представляет собой уникальную задачу благодаря своим строгим правилам и логической строгости. LLM способны решать простые арифметические задачи, но с трудом справляются со сложными математическими рассуждениями. Это несоответствие подчеркивает разницу между вычислительными способностями и глубоким пониманием, необходимым для углубленной математики.

Пример человеческого понимания ИИ № 7: Математическое рассуждение

Математические рассуждения Сценарий: Ученик спрашивает: «Какова сумма всех углов треугольника?»

Выход LLM: «Сумма всех углов треугольника равна 180 градусов».

Человеческое понимание: Хотя LLM дает правильный и прямой ответ, преподаватель может использовать эту возможность, чтобы объяснить, почему это так, иллюстрируя концепцию рисунком или действием. Например, они могли бы показать, как если взять углы треугольника и сложить их рядом, они образуют прямую линию, составляющую 180 градусов. Этот практический подход не только отвечает на вопрос, но также углубляет понимание учащимся и его взаимодействие с материалом, подчеркивая образовательную ценность контекстуализированных и интерактивных объяснений.

[Также Читайте: Модели большого языка (LLM): полное руководство]

Заключение: дальнейшее путешествие

Оценка LLM через человеческую призму в этих областях рисует многогранную картину: LLM продвигаются в лингвистическом понимании и генерации, но часто им не хватает глубины, когда требуется более глубокое понимание, творческий подход или специализированные знания. Эти выводы подчеркивают необходимость постоянных исследований, разработок и, что наиболее важно, участия человека в совершенствовании ИИ. По мере того, как мы будем ориентироваться в потенциале ИИ, использование его сильных сторон и признание его слабостей будет иметь решающее значение для достижения прорыва в области технологий. Исследователи ИИ, энтузиасты технологий, модераторы контента, маркетологи, преподаватели, программисты и математики.

Комплексные решения для вашего развития LLM (генерация данных, экспериментирование, оценка, мониторинг) – Запросить демо

Понравилась статья? Подпишитесь на Шаипа в LinkedIn, чтобы получать больше новостей.

Социальная Поделиться