Влияние разнообразия на обучающие данные

Разнообразные обучающие данные ИИ для инклюзивности и устранения предвзятости

Искусственный интеллект и большие данные могут найти решения глобальных проблем, уделяя первостепенное внимание локальным проблемам и кардинально изменяя мир. ИИ предлагает решения для всех — и в любых условиях, от дома до рабочего места. компьютеры с искусственным интеллектом, с Машинное обучение обучение, может имитировать интеллектуальное поведение и разговоры автоматизированным, но персонализированным образом.

Тем не менее, ИИ сталкивается с проблемой включения и часто предвзят. К счастью, сосредоточившись на этика искусственного интеллекта может открыть новые возможности с точки зрения диверсификации и включения, устраняя бессознательные предубеждения с помощью разнообразных данных обучения.

Важность разнообразия в обучающих данных ИИ

Разнообразие обучающих данных ИИ Разнообразие и качество обучающих данных связаны, поскольку одно влияет на другое и влияет на результат решения ИИ. Успех решения ИИ зависит от разнообразные данные на нем обучаются. Разнообразие данных предотвращает переоснащение ИИ — это означает, что модель работает или учится только на данных, используемых для обучения. При переоснащении модель ИИ не может дать результатов при тестировании на данных, не используемых при обучении.

Текущее состояние обучения ИИ данным

Неравенство или отсутствие разнообразия в данных приведет к несправедливым, неэтичным и неинклюзивным решениям ИИ, которые могут усугубить дискриминацию. Но как и почему разнообразие данных связано с решениями ИИ?

Неравное представление всех классов приводит к неправильной идентификации лиц — одним из важных примеров является Google Photos, который классифицировал черную пару как «горилл». И Meta подсказывает пользователю, который смотрит видео с чернокожими мужчинами, хочет ли пользователь «продолжить смотреть видео с приматами».

Например, неточная или неправильная классификация этнических или расовых меньшинств, особенно в чат-ботах, может привести к предвзятости в системах обучения ИИ. Согласно отчету за 2019 г. Дискриминационные системы — пол, раса, власть в ИИ, более 80% преподавателей ИИ – мужчины; женщины-исследователи ИИ в FB составляют всего 15%, а в Google — 10%.

Влияние разнообразных обучающих данных на производительность ИИ

Влияние разнообразия на обучающие данные Исключение определенных групп и сообществ из представления данных может привести к искажению алгоритмов.

Предвзятость данных часто случайно вносится в системы данных из-за недостаточной выборки определенных рас или групп. Когда системы распознавания лиц обучаются на разных лицах, это помогает модели идентифицировать определенные особенности, такие как положение лицевых органов и цветовые вариации.

Еще одним следствием несбалансированной частоты меток является то, что система может рассматривать меньшинство как аномалию, когда на нее оказывается давление с целью получения результата в течение короткого времени.

Давайте сегодня обсудим ваши требования к данным для обучения ИИ.

Достижение разнообразия в обучающих данных ИИ

С другой стороны, создание разнообразного набора данных также является проблемой. Полное отсутствие данных по некоторым классам может привести к недопредставленности. Его можно смягчить, сделав команды разработчиков ИИ более разнообразными в отношении навыков, этнической принадлежности, расы, пола, дисциплины и многого другого. Более того, идеальный способ решения проблем разнообразия данных в ИИ — это бороться с ними с самого начала, а не пытаться исправить то, что уже сделано, — привнося разнообразие на этапе сбора и обработки данных.

Несмотря на шумиху вокруг ИИ, он по-прежнему зависит от данных, которые собирают, отбирают и обучают люди. Врожденная предвзятость людей будет отражаться в собранных ими данных, и эта бессознательная предвзятость также проникает в модели машинного обучения. 

Этапы сбора и обработки разнообразных обучающих данных

Включение разнообразия обучающих данных

Разнообразие данных может быть достигнуто за счет:

  • Продуманно добавляйте больше данных из недостаточно представленных классов и подвергайте свои модели различным точкам данных. 
  • Собирая данные из разных источников данных. 
  • Путем увеличения данных или искусственного манипулирования наборами данных для увеличения/включения новых точек данных, явно отличающихся от исходных точек данных. 
  • При найме кандидатов на участие в процессе разработки ИИ удалите из заявки всю не относящуюся к работе информацию. 
  • Повышение прозрачности и подотчетности за счет улучшения документации по разработке и оценке моделей. 
  • Внедрение правил для создания разнообразия и инклюзивность в ИИ системы с низового уровня. Различные правительства разработали руководящие принципы, чтобы обеспечить разнообразие и смягчить предвзятость ИИ, которая может привести к несправедливым результатам. 

[Также читайте: Узнайте больше о процессе сбора данных для обучения ИИ ]

Заключение

В настоящее время лишь несколько крупных технологических компаний и учебных центров занимаются исключительно разработкой ИИ-решений. Эти элитные пространства пропитаны отчуждением, дискриминацией и предвзятостью. Однако именно в этих областях разрабатывается ИИ, и логика, стоящая за этими передовыми системами ИИ, изобилует той же предвзятостью, дискриминацией и исключением, что и недопредставленные группы. 

Обсуждая разнообразие и недискриминацию, важно задаться вопросом, кому это приносит пользу, а кому вредит. Мы также должны посмотреть, кого он ставит в невыгодное положение — навязывая идею «нормального» человека, ИИ потенциально может подвергнуть риску «других». 

Обсуждение разнообразия данных ИИ без признания соотношения сил, равенства и справедливости не покажет более широкой картины. Чтобы полностью понять масштабы разнообразия данных для обучения ИИ и то, как люди и ИИ могут вместе смягчить этот кризис, обратитесь к инженерам Shaip. У нас есть разные инженеры по ИИ, которые могут предоставить динамические и разнообразные данные для ваших ИИ-решений. 

Социальная Поделиться