Обезличенные наборы данных электронных медицинских карт (ЭМК) для проектов в области искусственного интеллекта и машинного обучения.
Данные электронных медицинских карт, имеющие коммерческую лицензию и соответствующие требованиям HIPAA, готовы для использования в клинической практике с применением искусственного интеллекта, обработки естественного языка и предиктивного моделирования.
Что такое данные электронных медицинских карт и почему они важны для искусственного интеллекта?
Электронные медицинские карты (ЭМК) — это цифровые истории болезни пациентов, которые ведутся медицинскими учреждениями на протяжении всего процесса лечения — в больницах, амбулаторных клиниках, специализированных кабинетах и лабораториях. В отличие от электронных медицинских карт (ЭМК), которые представляют собой моментальные снимки состояния пациента от одного поставщика медицинских услуг, данные ЭМК охватывают весь путь пациента, фиксируя взаимодействия в различных медицинских учреждениях.
Каталог обезличенных данных электронных медицинских карт от Shaip охватывает оба аспекта, предоставляя вашей команде единый, готовый к соблюдению нормативных требований источник для всего спектра разработок в области искусственного интеллекта в здравоохранении.
В наборах данных электронных медицинских карт содержатся два критически важных типа данных для разработки искусственного интеллекта: структурированные данные (демографические данные, диагностические коды ICD-10, коды DRG, списки лекарств, лабораторные показатели, показатели жизненно важных функций) и неструктурированные данные (клинические записи, выписные эпикризы, рентгенологические заключения, диктовка врача). Примерно 80% информации в электронных медицинских картах неструктурирована, что делает ее основным источником для обучения моделей обработки естественного языка в клинической практике.
Найдите правильные данные электронных медицинских карт (EHR) для вашего здравоохранения AI
Улучшите свои модели машинного обучения с помощью лучших в своем классе обучающих данных. Компания Shaip предлагает доступные на коммерческой основе обезличенные наборы данных электронных медицинских карт (ЭМК), разработанные специально для команд, занимающихся искусственным интеллектом и машинным обучением. Наш готовый каталог данных ЭМК предоставляет структурированные, готовые к исследованиям записи о пациентах по более чем 20 медицинским специальностям — включая диагнозы, рецепты, результаты лабораторных анализов, рентгенологические заключения, историю вакцинации и клинические заметки — все данные полностью обезличены в соответствии со стандартами HIPAA Safe Harbor и GDPR.
Независимо от того, разрабатываете ли вы системы поддержки принятия клинических решений, обучаете модели обработки естественного языка на основе записей врачей, создаёте алгоритмы прогнозирования заболеваний или используете наборы данных электронных медицинских карт Shaip, они обеспечат вам необходимую глубину, разнообразие и соответствие требованиям для вашего проекта в области искусственного интеллекта. Доступны для немедленного лицензирования, выбора пользовательской когорты или загрузки примеров.
Готовые электронные медицинские карты (EHR):
- 5.1M + Записи и аудиозаписи врачей по 31 специальности
- Медицинские записи, соответствующие золотому стандарту реального мира, для обучения клиническому НЛП и другим моделям документооборота с искусственным интеллектом
- Информация метаданных, такая как MRN (анонимизированная), дата поступления, дата выписки, продолжительность пребывания в днях, пол, класс пациента, плательщик, финансовый класс, состояние, решение о выписке, возраст, DRG, описание DRG, возмещение в долларах, AMLOS, GMLOS, риск смертность, тяжесть заболевания, морской окунь, почтовый индекс больницы и т. д.
- Медицинские записи из различных штатов и регионов США: Северо-Восток (46%), Юг (9%), Средний Запад (3%), Запад (28%), Другие (14%)
- Медицинские записи, относящиеся ко всем охватываемым классам пациентов - стационарные, амбулаторные (клинические, реабилитационные, повторяющиеся, хирургические дневные), неотложные.
- Медицинские записи, относящиеся ко всем возрастным группам пациентов <10 лет (7.9%), 11–20 лет (5.7%), 21–30 лет (10.9%), 31–40 лет (11.7%), 41–50 лет (10.4%). ), 51-60 лет (13.8%), 61-70 лет (16.1%), 71-80 лет (13.3%), 81-90 лет (7.8%), 90+ лет (2.4%)
- Соотношение полов пациентов 46% (мужчины) и 54% (женщины)
- Отредактированные документы PII, соответствующие Руководству Safe Harbor в соответствии с HIPAA
| Локация | Текстовые документы |
|---|---|
| К северо-востоку | 4,473,573 |
| Южная | 1,801,716 |
| Средний Запад | 781,701 |
| запад | 1,509,109 |
| Основная категория диагнозов | Текстовые документы |
|---|---|
| Алкоголь / Употребление наркотиков и алкоголь / Органические психические расстройства, вызванные наркотиками | 48,717 |
| Итого, включая все (случаи с и без категории MDC) | 8,566,687 |
| Сгенерированные случаи без возмещения (MDC не указан) | 790,697 |
| Амбулаторные случаи (MDC не указан) | 1,980,606 |
| Случаи использования специального группировщика, такого как 3M (MDC не указан) | 1,619,682 |
| Итого с MDC | 4,175,702 |
| Употребление алкоголя/наркотиков или индуцированные психические расстройства | 48,717 |
| Burns | 444 |
| глаз | 3,549 |
| Мужская репродуктивная система | 9,230 |
| Инфекции, вызванные вирусом иммунодефицита человека | 12,422 |
| Миелопролиферативные заболевания и расстройства, плохо дифференцированные новообразования | 15,620 |
| Факторы, влияющие на состояние здоровья и другие контакты со службами здравоохранения | 21,294 |
| Женской репродуктивной системы | 17,010 |
| Ухо, нос, рот и горло | 22,987 |
| Множественная значительная травма | 27,902 |
| Сердечно-сосудистая система | 589,730 |
| Кровь, кроветворные органы и иммунологические нарушения | 48,990 |
| Травмы, отравления и токсическое действие лекарств | 64,097 |
| Кожа, подкожная ткань и грудь | 89,577 |
| Гепатобилиарная система и поджелудочная железа | 127,172 |
| Эндокринные, нарушения питания и нарушения обмена веществ | 142,808 |
| Новорожденные и другие новорожденные с заболеваниями, возникшими в перинатальном периоде | 163,605 |
| Беременность, роды и послеродовой период | 165,303 |
| Почки и мочевыводящие пути | 209,561 |
| Психические заболевания и расстройства | 282,501 |
| Нервная система | 316,243 |
| Пищеварительная система | 346,369 |
| Костно-мышечная система и соединительная ткань | 329,344 |
| Дыхательная система | 561,983 |
| Инфекционные и паразитарные заболевания | 559,244 |
Мы имеем дело со всеми типами лицензирования данных, т. е. с текстом, аудио, видео или изображением. Наборы данных состоят из медицинских наборов данных для машинного обучения: набор данных для диктовки врача, клинические заметки врача, набор данных для медицинской беседы, набор данных для медицинской расшифровки, беседа между врачом и пациентом, медицинские текстовые данные, медицинские изображения — компьютерная томография, МРТ, ультразвук (собраны на основе пользовательских требований). .
Реальные применения наборов данных EHR в ИИ/МО
- Прогнозирование и диагностика заболеваний: Обучать модели ИИ прогнозировать такие заболевания, как диабет, рак и сердечно-сосудистые заболевания.
- Поддержка клинических решений: Обучение моделей для выявления рекомендаций по диагностике, определения лекарственных взаимодействий и оказания помощи в планировании лечения с использованием структурированных данных электронных медицинских карт.
- Индивидуальная медицина: Используйте демографические и диагностические данные, чтобы рекомендовать индивидуальные планы лечения.
- Автоматизация здравоохранения: Автоматизируйте административные задачи, такие как планирование встреч или выставление счетов, с помощью инструментов на базе обработки естественного языка, обученных на наборах данных электронных медицинских карт.
Прогностическое моделирование в здравоохранении — Разрабатывать модели стратификации риска и прогнозирования заболеваний, используя данные о пациентах за длительный период, коды DRG и шкалы тяжести заболевания.
Исследования реальных данных (RWE) — Получение данных для постмаркетингового анализа и фармаконадзора путем анализа результатов, полученных с помощью электронных медицинских карт, по различным группам пациентов.
Обработка естественного языка для клинических записей — Извлекать сущности, состояния и процедуры из неструктурированных врачебных записей и выписных эпикризов, используя аннотированные обучающие данные электронных медицинских карт.
Почему стоит выбрать Shaip для наборов данных EHR?
Экспертная рабочая сила
Квалифицированные специалисты гарантируют точную и качественную аннотацию данных.
Соответствие нормативным требованиям
Полностью деидентифицированные наборы данных, соответствующие требованиям HIPAA и GDPR.
Конкурентоспособные цены
Экономически эффективные решения, реализуемые без ущерба для качества.
Данные без предвзятости
Строгие протоколы исключают предвзятость, гарантируя надежные результаты ИИ.
Быстро и точно
Оптимизированные процессы обеспечивают быструю доставку разнообразных и высококачественных данных.
Наличие и доставка
Высокая бесперебойная работа сети и своевременная доставка данных, услуг и решений.
Проверено в масштабе
Нам доверяют Google и ведущие компании в сфере здравоохранения, занимающиеся разработкой искусственного интеллекта. Контроль качества осуществляется с помощью процессов 6 Sigma Black Belt и экспертной оценки медицинских специалистов.
Готов к коммерческому применению
Готовый каталог электронных медицинских карт от Shaip лицензирован, обезличен и доступен для загрузки или доступа через Databricks Marketplace уже сегодня.
Поддержка полного жизненного цикла
Нужна дополнительная аннотация к исходным данным? Shaip предоставляет услуги по обезличиванию данных, клинической маркировке именованных сущностей и расширению данных от одного партнера.
Не можете найти то, что ищете?
Новые готовые наборы медицинских данных собираются по всем типам данных.
Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных о медицинском обучении
Часто задаваемые вопросы (FAQ)
1. Для чего используются наборы данных EHR в ИИ?
Наборы данных EHR используются для обучения моделей ИИ для прогнозирования заболеваний, принятия клинических решений и персонализированного лечения.
2. Как данные EHR используются в проектах AI/ML?
Данные электронных медицинских карт используются для обучения моделей искусственного интеллекта для поддержки принятия клинических решений, прогнозирования заболеваний, персонализированного планирования лечения и автоматизации здравоохранения.
3. Обезличиваются ли данные ЭМК?
Да, все данные EHR обезличиваются для удаления персонально идентифицируемой информации (PII) и соблюдения правил конфиденциальности.
4. Каковы основные компоненты данных EHR?
Данные EHR содержат такие сведения, как демографические данные пациента, история болезни, диагнозы, планы лечения, результаты лабораторных анализов, радиологические изображения (например, КТ, МРТ, рентген), рецепты и записи о вакцинации.
5. Соответствуют ли данные HIPAA и другим нормам?
Да, данные соответствуют HIPAA, GDPR и другим мировым стандартам конфиденциальности, что обеспечивает безопасное и этичное использование.
6. Можно ли настраивать наборы данных EHR?
Да, наборы данных можно адаптировать с учетом конкретных медицинских специальностей, регионов, демографических характеристик пациентов или требований проекта.
7. Могут ли данные интегрироваться в мои модели ИИ?
Да, наборы данных предоставляются в стандартных форматах (например, JSON, CSV) для легкой интеграции в рабочие процессы ИИ и МО.
8. Как обеспечивается качество данных?
Данные проходят строгую проверку и контроль качества для обеспечения точности, согласованности и надежности.
9. Какова стоимость наборов данных EHR?
Стоимость зависит от таких факторов, как объем данных, настройка и масштаб проекта. Мы просим вас заполнить форму «Связаться с нами» с вашими требованиями, чтобы получить лучшую цитату.
10. Каковы сроки поставки наборов данных EHR?
Сроки поставки зависят от масштаба и сложности проекта, но разрабатываются с учетом согласованных сроков.
11. Как наборы данных EHR могут улучшить решения ИИ в здравоохранении?
Наборы данных EHR позволяют системам ИИ обеспечивать более качественную диагностику, прогностическую информацию и персонализированное лечение, улучшая результаты лечения пациентов и эффективность здравоохранения.
12. Могу ли я получить индивидуальные наборы данных EHR?
Да, Shaip предлагает индивидуальные наборы данных EHR с учетом специализации, возрастной группы, географии или требований проекта.
13. В чем разница между набором данных EHR и набором данных EMR?
Электронные медицинские карты (ЭМК) содержат клинические данные от одного поставщика медицинских услуг; электронные медицинские карты (ЭМК) охватывают весь процесс лечения у нескольких поставщиков услуг, в разных условиях и в разные периоды времени. Shaip предоставляет как варианты наборов данных ЭМК, так и ЭМК, при этом доступны многосторонние продольные записи от нескольких поставщиков услуг для сложных задач обучения ИИ.
14. Каким образом происходит обезличивание данных электронной медицинской карты?
Все записи обезличены с использованием метода «безопасной гавани» в соответствии с Правилом конфиденциальности HIPAA — удалены все 18 идентификаторов PHI, включая имя, дату рождения, адрес и номера медицинских карт. Анонимизированное поле MRN сохраняется для сопоставления записей внутри набора данных, что позволяет проводить лонгитюдный анализ без риска повторной идентификации.