Набор данных медицинских изображений DICOM для передовых приложений искусственного интеллекта/машинного обучения в здравоохранении
Обезличенный Наборы данных изображений DICOM с сохранением метаданных — и, при необходимости, отчетов о радиологических исследованиях — для ускорения обучения, проверки и клинических исследований модели.
Подключите источник данных, которого вам не хватало сегодня
Данные DICOM-изображений, созданные для реального применения искусственного интеллекта.
Shaip предлагает решения, готовые к использованию ИИ. Наборы данных медицинской визуализации DICOM Разработан для того, чтобы помочь командам, занимающимся искусственным интеллектом в здравоохранении, создавать, обучать и проверять надежные модели для диагностики, сортировки пациентов и поддержки принятия решений, используя обезличенные данные, сохраняющие клиническую ценность.
Снимок набора данных
- Всего исследований:10M +
- Основные географические регионы (по результатам исследований): США, Бразилия и Индия
- Представленные модальности: CR, CT, US, DX, MR, MG, OT, RF, NM, Mammography
- Представлены следующие части тела: Грудь, живот, голова, позвоночник, шея, сердце и многое другое
Типичные сценарии использования наборов данных изображений DICOM
Обучение моделей искусственного интеллекта для диагностической визуализации
- Обнаружение аномалий
- Классификация болезней
- Оценка степени тяжести/стадирование
- Приоритизация сортировки
- Поддерживает многомодальное развитие
Проверка и оценка производительности модели.
- Оцените точность модели на более широких популяциях.
- Результаты сравнительных тестов по методам диагностики/областям тела
- Для уменьшения переобучения выполните внешнюю валидацию.
Повышение устойчивости модели к различным устройствам и сайтам.
- Обобщение результатов тестирования на разных сканерах/производителях
- Снижение падения производительности при развертывании в новых больницах.
Создайте мультимодальный ИИ (изображение + рентгенологический отчет).
- Вывести слабые метки из текста отчета
- Обучайте модели в соответствии с текстами отчетов.
- Создайте систему сортировки и поддержки принятия решений, учитывающую особенности отчетов.
Клинические исследования и формирование когорт
- Фильтрация групп по методу/части тела/времени
- Поддержка ретроспективных исследований
- Ускорьте проверку гипотез, сохраняя при этом контроль конфиденциальности.
Аннотирование и создание эталонных данных для обучения машинного обучения
- Метки классификации
- Ограничительные рамки
- Маски сегментации
Что вы получаете в наборе данных изображений DICOM
1. Пиксельные данные DICOM (изображения)
Все изображения обезличены на уровне пикселей:
- Текст на изображениях отредактирован или псевдонимизирован.
- Артефакты, «искажающие» изображение лица, могут возникать, когда возможна реконструкция лица (например, с помощью компьютерной томографии высокого разрешения).
3. Отчет об исследовании (необязательно, если имеется)
Неструктурированный повествовательный текст, написанный рентгенологом/врачом, с применением анонимизации по принципу Safe Harbor и того же подхода к учету временных сдвигов.
2. Метаданные DICOM (с функцией Safe Harbor)
Все стандартные метаданные DICOM сохраняются для передачи, а идентификаторы, соответствующие требованиям HIPAA Safe Harbor, анонимизируются, включая:
- Имя пациента заменено на идентификатор пациента.
- Идентификатор пациента, криптографически хешированный
- Название учреждения заменено альтернативным названием.
- Даты сдвинуты в пределах 365 дней (постоянное смещение на уровне пациента).
4. Пользовательские метаданные (дополнительная опция, необязательная)
В число дополнительных производных метаданных могут входить:
- Возраст пациента (разобранный по данным анализа)
- Теги SNOMED (из отчета)
- Положительные сущности (из отчета)
- Страна проживания (из адреса)
- Приписываемая раса / Приписываемая этническая принадлежность (производные поля)
1. Пиксельные данные DICOM (изображения)
Все изображения обезличены на уровне пикселей:
- Текст на изображениях отредактирован или псевдонимизирован.
- Артефакты, «искажающие» изображение лица, могут возникать, когда возможна реконструкция лица (например, с помощью компьютерной томографии высокого разрешения).
2. Метаданные DICOM (с функцией Safe Harbor)
Все стандартные метаданные DICOM сохраняются для передачи, а идентификаторы, соответствующие требованиям HIPAA Safe Harbor, анонимизируются, включая:
- Имя пациента заменено на идентификатор пациента.
- Идентификатор пациента, криптографически хешированный
- Название учреждения заменено альтернативным названием.
- Даты сдвинуты в пределах 365 дней (постоянное смещение на уровне пациента).
3. Отчет об исследовании (необязательно, если имеется)
Неструктурированный повествовательный текст, написанный рентгенологом/врачом, с применением анонимизации по принципу Safe Harbor и того же подхода к учету временных сдвигов.
4. Пользовательские метаданные (дополнительная опция, необязательная)
В число дополнительных производных метаданных могут входить:
- Возраст пациента (разобранный по данным анализа)
- Теги SNOMED (из отчета)
- Положительные сущности (из отчета)
- Страна проживания (из адреса)
- Приписываемая раса / Приписываемая этническая принадлежность (производные поля)
Методы деидентификации DICOM, ориентированные на конфиденциальность.
В наборе данных используются криптографическое хеширование и псевдонимизация для соответствия требованиям HIPAA, при этом сохраняется клиническая полезность и защищается конфиденциальная информация.
Защита на уровне пикселей
Редактирование/псевдонимизация вписанного текста и удаление искажений при необходимости.
Защита метаданных
Идентификаторы Safe Harbor анонимизированы, при этом стандартные метаданные DICOM сохранены.
Сдвиг даты
Для сохранения временных взаимосвязей между исследованиями даты сдвигаются в пределах 365-дневного диапазона на уровне отдельных пациентов.
Демографическое напольное покрытие
Для снижения риска повторной идентификации некоторые поля имеют ограниченный/ограниченный порог (например, возраст, вес, размер и некоторые значения этнической принадлежности).
Не можете найти то, что ищете?
Новые готовые наборы медицинских данных собираются по всем типам данных.
Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных о медицинском обучении
Часто задаваемые вопросы (FAQ)
1. Что такое набор данных изображений DICOM?
Набор данных изображений DICOM представляет собой коллекцию медицинских изображений, хранящихся в соответствии со стандартом DICOM, включая пиксельные данные и клинические метаданные, и обычно используется для обучения и проверки моделей искусственного интеллекта в здравоохранении.
2. Что входит в этот набор данных изображений DICOM?
В зависимости от объема лицензирования, оно может включать пиксельные данные DICOM, сохраненные (обезличенные) метаданные DICOM, необязательные отчеты об исследованиях и необязательные пользовательские метаданные с добавленной стоимостью.
3. Изображения обезличены?
Да. Изображения обезличиваются на пиксельном уровне, включая удаление/псевдонимизацию текста на изображениях и коррекцию искажений при необходимости.
4. Сохраняются ли метаданные DICOM?
Стандартные метаданные DICOM сохраняются для передачи, в то время как идентификаторы, соответствующие требованиям HIPAA Safe Harbor, анонимизируются (например, идентификаторы пациента/учреждения и даты).
5. Как осуществляется обработка дат?
Даты могут быть сдвинуты в пределах 365 дней, при этом изменения применяются последовательно на уровне каждого пациента для сохранения относительной временной целостности в разных исследованиях.
6. Включаются ли в отчеты рентгенологические исследования/диагностические заключения?
При наличии соответствующей лицензии и возможности включения отчетов об исследованиях (неструктурированного повествовательного текста) идентификаторы могут быть псевдонимизированы.
7. Какие пользовательские метаданные могут быть доступны?
В число параметров могут входить: возраст пациента, теги SNOMED, положительные результаты, страна проживания и другие производные поля.
8. Могу ли я запросить конкретную группу (метод, часть тела, регион и т. д.)?
Да — укажите целевую область поиска и фильтры, и Shaip предложит наиболее подходящий фрагмент набора данных, исходя из его доступности.
9. Как получить лицензию на использование набора данных?
Отправьте ваши требования через форму обратной связи. Наша команда подтвердит наличие, объем работ, условия лицензирования и варианты доставки.