Набор данных медицинских изображений DICOM для передовых приложений искусственного интеллекта/машинного обучения в здравоохранении

Обезличенный Наборы данных изображений DICOM с сохранением метаданных — и, при необходимости, отчетов о радиологических исследованиях — для ускорения обучения, проверки и клинических исследований модели.

Наборы данных изображений DICOM

Подключите источник данных, которого вам не хватало сегодня

Данные DICOM-изображений, созданные для реального применения искусственного интеллекта.

Shaip предлагает решения, готовые к использованию ИИ. Наборы данных медицинской визуализации DICOM Разработан для того, чтобы помочь командам, занимающимся искусственным интеллектом в здравоохранении, создавать, обучать и проверять надежные модели для диагностики, сортировки пациентов и поддержки принятия решений, используя обезличенные данные, сохраняющие клиническую ценность.

Снимок набора данных

  • Всего исследований:10M +
  • Основные географические регионы (по результатам исследований): США, Бразилия и Индия
  • Представленные модальности: CR, CT, US, DX, MR, MG, OT, RF, NM, Mammography
  • Представлены следующие части тела: Грудь, живот, голова, позвоночник, шея, сердце и многое другое
данные изображения DICOM

Типичные сценарии использования наборов данных изображений DICOM

Обучение моделей искусственного интеллекта для диагностической визуализации

Обучение моделей искусственного интеллекта для диагностической визуализации

  • Обнаружение аномалий
  • Классификация болезней
  • Оценка степени тяжести/стадирование
  • Приоритизация сортировки
  • Поддерживает многомодальное развитие
Проверка и оценка производительности модели.

Проверка и оценка производительности модели.

  • Оцените точность модели на более широких популяциях.
  • Результаты сравнительных тестов по методам диагностики/областям тела
  • Для уменьшения переобучения выполните внешнюю валидацию.
Повышение устойчивости модели к различным устройствам и сайтам.

Повышение устойчивости модели к различным устройствам и сайтам.

  • Обобщение результатов тестирования на разных сканерах/производителях
  • Снижение падения производительности при развертывании в новых больницах.
Создание мультимодального ИИ (изображение + рентгенологический отчет)

Создайте мультимодальный ИИ (изображение + рентгенологический отчет).

  • Вывести слабые метки из текста отчета
  • Обучайте модели в соответствии с текстами отчетов.
  • Создайте систему сортировки и поддержки принятия решений, учитывающую особенности отчетов.
Клинические исследования и формирование когорт

Клинические исследования и формирование когорт

  • Фильтрация групп по методу/части тела/времени
  • Поддержка ретроспективных исследований
  • Ускорьте проверку гипотез, сохраняя при этом контроль конфиденциальности.
Аннотирование и создание эталонных данных для обучения машинного обучения

Аннотирование и создание эталонных данных для обучения машинного обучения

  • Метки классификации
  • Ограничительные рамки
  • Маски сегментации

Что вы получаете в наборе данных изображений DICOM

1. Пиксельные данные DICOM (изображения)

Все изображения обезличены на уровне пикселей:

  • Текст на изображениях отредактирован или псевдонимизирован.
  • Артефакты, «искажающие» изображение лица, могут возникать, когда возможна реконструкция лица (например, с помощью компьютерной томографии высокого разрешения).

3. Отчет об исследовании (необязательно, если имеется)

Неструктурированный повествовательный текст, написанный рентгенологом/врачом, с применением анонимизации по принципу Safe Harbor и того же подхода к учету временных сдвигов.

2. Метаданные DICOM (с функцией Safe Harbor)

Все стандартные метаданные DICOM сохраняются для передачи, а идентификаторы, соответствующие требованиям HIPAA Safe Harbor, анонимизируются, включая:

  • Имя пациента заменено на идентификатор пациента.
  • Идентификатор пациента, криптографически хешированный
  • Название учреждения заменено альтернативным названием.
  • Даты сдвинуты в пределах 365 дней (постоянное смещение на уровне пациента).

4. Пользовательские метаданные (дополнительная опция, необязательная)

В число дополнительных производных метаданных могут входить:

  • Возраст пациента (разобранный по данным анализа)
  • Теги SNOMED (из отчета)
  • Положительные сущности (из отчета)
  • Страна проживания (из адреса)
  • Приписываемая раса / Приписываемая этническая принадлежность (производные поля)

1. Пиксельные данные DICOM (изображения)

Все изображения обезличены на уровне пикселей:

  • Текст на изображениях отредактирован или псевдонимизирован.
  • Артефакты, «искажающие» изображение лица, могут возникать, когда возможна реконструкция лица (например, с помощью компьютерной томографии высокого разрешения).

2. Метаданные DICOM (с функцией Safe Harbor)

Все стандартные метаданные DICOM сохраняются для передачи, а идентификаторы, соответствующие требованиям HIPAA Safe Harbor, анонимизируются, включая:

  • Имя пациента заменено на идентификатор пациента.
  • Идентификатор пациента, криптографически хешированный
  • Название учреждения заменено альтернативным названием.
  • Даты сдвинуты в пределах 365 дней (постоянное смещение на уровне пациента).

3. Отчет об исследовании (необязательно, если имеется)

Неструктурированный повествовательный текст, написанный рентгенологом/врачом, с применением анонимизации по принципу Safe Harbor и того же подхода к учету временных сдвигов.

4. Пользовательские метаданные (дополнительная опция, необязательная)

В число дополнительных производных метаданных могут входить:

  • Возраст пациента (разобранный по данным анализа)
  • Теги SNOMED (из отчета)
  • Положительные сущности (из отчета)
  • Страна проживания (из адреса)
  • Приписываемая раса / Приписываемая этническая принадлежность (производные поля)

Методы деидентификации DICOM, ориентированные на конфиденциальность.

В наборе данных используются криптографическое хеширование и псевдонимизация для соответствия требованиям HIPAA, при этом сохраняется клиническая полезность и защищается конфиденциальная информация.

Защита на уровне пикселей

Редактирование/псевдонимизация вписанного текста и удаление искажений при необходимости.

Защита метаданных

Идентификаторы Safe Harbor анонимизированы, при этом стандартные метаданные DICOM сохранены.

Сдвиг даты

Для сохранения временных взаимосвязей между исследованиями даты сдвигаются в пределах 365-дневного диапазона на уровне отдельных пациентов.

Демографическое напольное покрытие

Для снижения риска повторной идентификации некоторые поля имеют ограниченный/ограниченный порог (например, возраст, вес, размер и некоторые значения этнической принадлежности).

Свяжитесь с нами

Не можете найти то, что ищете?

Новые готовые наборы медицинских данных собираются по всем типам данных. 

Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных о медицинском обучении

  • Регистрируясь, я соглашаюсь с Shaip Персональные данные и Условия Предоставления Услуг и даю свое согласие на получение маркетинговых сообщений B2B от Shaip.

Набор данных изображений DICOM представляет собой коллекцию медицинских изображений, хранящихся в соответствии со стандартом DICOM, включая пиксельные данные и клинические метаданные, и обычно используется для обучения и проверки моделей искусственного интеллекта в здравоохранении.

В зависимости от объема лицензирования, оно может включать пиксельные данные DICOM, сохраненные (обезличенные) метаданные DICOM, необязательные отчеты об исследованиях и необязательные пользовательские метаданные с добавленной стоимостью.

Да. Изображения обезличиваются на пиксельном уровне, включая удаление/псевдонимизацию текста на изображениях и коррекцию искажений при необходимости.

Стандартные метаданные DICOM сохраняются для передачи, в то время как идентификаторы, соответствующие требованиям HIPAA Safe Harbor, анонимизируются (например, идентификаторы пациента/учреждения и даты).

Даты могут быть сдвинуты в пределах 365 дней, при этом изменения применяются последовательно на уровне каждого пациента для сохранения относительной временной целостности в разных исследованиях.

При наличии соответствующей лицензии и возможности включения отчетов об исследованиях (неструктурированного повествовательного текста) идентификаторы могут быть псевдонимизированы.

В число параметров могут входить: возраст пациента, теги SNOMED, ​​положительные результаты, страна проживания и другие производные поля.

Да — укажите целевую область поиска и фильтры, и Shaip предложит наиболее подходящий фрагмент набора данных, исходя из его доступности.

Отправьте ваши требования через форму обратной связи. Наша команда подтвердит наличие, объем работ, условия лицензирования и варианты доставки.