Практический пример: модерация контента

Более 30 XNUMX веб-документов удалены и аннотированы для модерации контента

Модерация контента - баннер
Растет спрос на модерацию контента с помощью ИИ
которые стремятся защитить онлайн-пространство, где мы подключаемся и общаемся.

Поскольку использование социальных сетей продолжает расти,
проблема киберзапугивания всплыла как
серьезным препятствием для платформ, стремящихся
обеспечить безопасное онлайн-пространство. Ошеломляющий
38% людей сталкиваются с этим
вредное поведение в повседневной жизни,
подчеркивая острую потребность в изобретательских
подходы к модерации контента.
Сегодня организации полагаются на использование
искусственный интеллект для решения устойчивых
проблема киберзапугивания активно.

Кибербезопасность:

В отчете Facebook о соблюдении стандартов сообщества за четвертый квартал раскрыты действия в отношении 4 млн единиц контента с издевательствами и домогательствами с упреждающим уровнем обнаружения 6.3%.

Образование:

2021 Исследование показало, что 36.5%% студентов в Соединенных Штатах в возрасте от 12 и 17 лет подвергались киберзапугиванию в тот или иной момент во время учебы.

Согласно отчету за 2020 год, мировой рынок решений для модерации контента оценивался в 4.07 млрд долларов США в 2019 году и, как ожидается, достигнет 11.94 млрд долларов США к 2027 году при среднегодовом темпе роста 14.7%.

Реальное решение мира

Данные, которые модерируют глобальные разговоры

Клиент разрабатывал надежный автоматизированный
модерация контента Машинное обучение
модель для своего облачного предложения, для которого они
искали доменного поставщика, который
может помочь им с точными данными обучения.

Используя наши обширные знания в области обработки естественного языка (NLP), мы помогли клиенту собрать, классифицировать и аннотировать более 30,000 XNUMX документов на английском и испанском языках для создания автоматизированной модели модерации контента. Модель машинного обучения, разделенная на токсичный, зрелый или сексуально откровенный контент категории.

Реальное решение

Проблема

  • Веб-скрапинг 30,000 XNUMX документов на испанском и английском языках с приоритетных доменов.
  • Разделение собранного контента на короткие, средние и длинные сегменты
  • Маркировка скомпилированных данных как токсичного, зрелого или откровенно сексуального содержания.
  • Обеспечение высокого качества аннотаций с точностью не менее 90%.

Решение

  • Из Интернета удалено 30,000 XNUMX документов на испанском и английском языках из BFSI, Healthcare, Manufacturing, Retail. Содержание было далее разделено на короткие, средние и длинные документы. 
  • Успешная пометка классифицированного контента как токсичного, зрелого или откровенно сексуального содержания.
  • Для достижения качества 90% компания Shaip внедрила двухуровневый процесс контроля качества:
    » Уровень 1: Проверка обеспечения качества: 100 % файлов должны быть проверены.
    » Уровень 2: Критическая проверка анализа качества: команда Shaips CQA оценивает 15–20 % ретроспективных образцов.

Результат

Учебные данные помогли создать модель машинного обучения для автоматической модерации контента, которая может дать несколько результатов, полезных для поддержания более безопасной онлайн-среды. Некоторые из ключевых результатов включают в себя:

  • Эффективность обработки огромного количества данных
  • Последовательность в обеспечении единообразного применения политик модерации
  • Масштабируемость для адаптации к растущей пользовательской базе и объемам контента
  • Модерация в реальном времени может идентифицировать и
    удалять потенциально опасный контент по мере его создания
  • Экономическая эффективность за счет снижения зависимости от модераторов-людей

Примеры модерации контента

Примеры модерации контента

Ускорьте свой разговорный ИИ
разработка приложений на 100%

Расскажите, чем мы можем помочь с вашей следующей инициативой в области искусственного интеллекта.