Обезличенные наборы данных электронных медицинских карт (ЭМК) для проектов в области искусственного интеллекта и машинного обучения.

Данные электронных медицинских карт, имеющие коммерческую лицензию и соответствующие требованиям HIPAA, готовы для использования в клинической практике с применением искусственного интеллекта, обработки естественного языка и предиктивного моделирования.

Данные электронных медицинских карт (ehr)

Что такое данные электронных медицинских карт и почему они важны для искусственного интеллекта?

Наборы данных EHR в AI/ML

Электронные медицинские карты (ЭМК) — это цифровые истории болезни пациентов, которые ведутся медицинскими учреждениями на протяжении всего процесса лечения — в больницах, амбулаторных клиниках, специализированных кабинетах и ​​лабораториях. В отличие от электронных медицинских карт (ЭМК), которые представляют собой моментальные снимки состояния пациента от одного поставщика медицинских услуг, данные ЭМК охватывают весь путь пациента, фиксируя взаимодействия в различных медицинских учреждениях.

Каталог обезличенных данных электронных медицинских карт от Shaip охватывает оба аспекта, предоставляя вашей команде единый, готовый к соблюдению нормативных требований источник для всего спектра разработок в области искусственного интеллекта в здравоохранении.

В наборах данных электронных медицинских карт содержатся два критически важных типа данных для разработки искусственного интеллекта: структурированные данные (демографические данные, диагностические коды ICD-10, коды DRG, списки лекарств, лабораторные показатели, показатели жизненно важных функций) и неструктурированные данные (клинические записи, выписные эпикризы, рентгенологические заключения, диктовка врача). Примерно 80% информации в электронных медицинских картах неструктурирована, что делает ее основным источником для обучения моделей обработки естественного языка в клинической практике.

Найдите правильные данные электронных медицинских карт (EHR) для вашего здравоохранения AI

Улучшите свои модели машинного обучения с помощью лучших в своем классе обучающих данных. Компания Shaip предлагает доступные на коммерческой основе обезличенные наборы данных электронных медицинских карт (ЭМК), разработанные специально для команд, занимающихся искусственным интеллектом и машинным обучением. Наш готовый каталог данных ЭМК предоставляет структурированные, готовые к исследованиям записи о пациентах по более чем 20 медицинским специальностям — включая диагнозы, рецепты, результаты лабораторных анализов, рентгенологические заключения, историю вакцинации и клинические заметки — все данные полностью обезличены в соответствии со стандартами HIPAA Safe Harbor и GDPR.

Независимо от того, разрабатываете ли вы системы поддержки принятия клинических решений, обучаете модели обработки естественного языка на основе записей врачей, создаёте алгоритмы прогнозирования заболеваний или используете наборы данных электронных медицинских карт Shaip, они обеспечат вам необходимую глубину, разнообразие и соответствие требованиям для вашего проекта в области искусственного интеллекта. Доступны для немедленного лицензирования, выбора пользовательской когорты или загрузки примеров.

Готовые электронные медицинские карты (EHR):

  • 5.1M + Записи и аудиозаписи врачей по 31 специальности
  • Медицинские записи, соответствующие золотому стандарту реального мира, для обучения клиническому НЛП и другим моделям документооборота с искусственным интеллектом
  • Информация метаданных, такая как MRN (анонимизированная), дата поступления, дата выписки, продолжительность пребывания в днях, пол, класс пациента, плательщик, финансовый класс, состояние, решение о выписке, возраст, DRG, описание DRG, возмещение в долларах, AMLOS, GMLOS, риск смертность, тяжесть заболевания, морской окунь, почтовый индекс больницы и т. д.
  • Медицинские записи из различных штатов и регионов США: Северо-Восток (46%), Юг (9%), Средний Запад (3%), Запад (28%), Другие (14%)
  • Медицинские записи, относящиеся ко всем охватываемым классам пациентов - стационарные, амбулаторные (клинические, реабилитационные, повторяющиеся, хирургические дневные), неотложные.
  • Медицинские записи, относящиеся ко всем возрастным группам пациентов <10 лет (7.9%), 11–20 лет (5.7%), 21–30 лет (10.9%), 31–40 лет (11.7%), 41–50 лет (10.4%). ), 51-60 лет (13.8%), 61-70 лет (16.1%), 71-80 лет (13.3%), 81-90 лет (7.8%), 90+ лет (2.4%)
  • Соотношение полов пациентов 46% (мужчины) и 54% (женщины)
  • Отредактированные документы PII, соответствующие Руководству Safe Harbor в соответствии с HIPAA
Данные ЭМК по местоположению
Локация Текстовые документы
К северо-востоку 4,473,573
Южная 1,801,716
Средний Запад 781,701
запад 1,509,109
Данные EHR по основным категориям диагноза
Основная категория диагнозов Текстовые документы
Алкоголь / Употребление наркотиков и алкоголь / Органические психические расстройства, вызванные наркотиками48,717
Итого, включая все (случаи с и без категории MDC)8,566,687
Сгенерированные случаи без возмещения (MDC не указан)790,697
Амбулаторные случаи (MDC не указан)1,980,606
Случаи использования специального группировщика, такого как 3M (MDC не указан)1,619,682
Итого с MDC4,175,702
Употребление алкоголя/наркотиков или индуцированные психические расстройства48,717
Burns444
глаз3,549
Мужская репродуктивная система9,230
Инфекции, вызванные вирусом иммунодефицита человека12,422
Миелопролиферативные заболевания и расстройства, плохо дифференцированные новообразования15,620
Факторы, влияющие на состояние здоровья и другие контакты со службами здравоохранения21,294
Женской репродуктивной системы17,010
Ухо, нос, рот и горло22,987
Множественная значительная травма27,902
Сердечно-сосудистая система589,730
Кровь, кроветворные органы и иммунологические нарушения48,990
Травмы, отравления и токсическое действие лекарств64,097
Кожа, подкожная ткань и грудь89,577
Гепатобилиарная система и поджелудочная железа127,172
Эндокринные, нарушения питания и нарушения обмена веществ142,808
Новорожденные и другие новорожденные с заболеваниями, возникшими в перинатальном периоде163,605
Беременность, роды и послеродовой период165,303
Почки и мочевыводящие пути209,561
Психические заболевания и расстройства282,501
Нервная система316,243
Пищеварительная система346,369
Костно-мышечная система и соединительная ткань329,344
Дыхательная система561,983
Инфекционные и паразитарные заболевания559,244

Мы имеем дело со всеми типами лицензирования данных, т. е. с текстом, аудио, видео или изображением. Наборы данных состоят из медицинских наборов данных для машинного обучения: набор данных для диктовки врача, клинические заметки врача, набор данных для медицинской беседы, набор данных для медицинской расшифровки, беседа между врачом и пациентом, медицинские текстовые данные, медицинские изображения — компьютерная томография, МРТ, ультразвук (собраны на основе пользовательских требований). .

Реальные применения наборов данных EHR в ИИ/МО

  • Прогнозирование и диагностика заболеваний: Обучать модели ИИ прогнозировать такие заболевания, как диабет, рак и сердечно-сосудистые заболевания.
  • Поддержка клинических решений: Обучение моделей для выявления рекомендаций по диагностике, определения лекарственных взаимодействий и оказания помощи в планировании лечения с использованием структурированных данных электронных медицинских карт.
  • Индивидуальная медицина: Используйте демографические и диагностические данные, чтобы рекомендовать индивидуальные планы лечения.
  • Автоматизация здравоохранения: Автоматизируйте административные задачи, такие как планирование встреч или выставление счетов, с помощью инструментов на базе обработки естественного языка, обученных на наборах данных электронных медицинских карт.
  • Прогностическое моделирование в здравоохранении — Разрабатывать модели стратификации риска и прогнозирования заболеваний, используя данные о пациентах за длительный период, коды DRG и шкалы тяжести заболевания. 

  • Исследования реальных данных (RWE) — Получение данных для постмаркетингового анализа и фармаконадзора путем анализа результатов, полученных с помощью электронных медицинских карт, по различным группам пациентов.

  • Обработка естественного языка для клинических записей — Извлекать сущности, состояния и процедуры из неструктурированных врачебных записей и выписных эпикризов, используя аннотированные обучающие данные электронных медицинских карт.

Почему стоит выбрать Shaip для наборов данных EHR?

Экспертная рабочая сила

Квалифицированные специалисты гарантируют точную и качественную аннотацию данных.

Соответствие нормативным требованиям

Полностью деидентифицированные наборы данных, соответствующие требованиям HIPAA и GDPR.

Конкурентоспособные цены

Экономически эффективные решения, реализуемые без ущерба для качества.

Данные без предвзятости

Строгие протоколы исключают предвзятость, гарантируя надежные результаты ИИ.

Быстро и точно

Оптимизированные процессы обеспечивают быструю доставку разнообразных и высококачественных данных.

Наличие и доставка

Высокая бесперебойная работа сети и своевременная доставка данных, услуг и решений.

Проверено в масштабе

Нам доверяют Google и ведущие компании в сфере здравоохранения, занимающиеся разработкой искусственного интеллекта. Контроль качества осуществляется с помощью процессов 6 Sigma Black Belt и экспертной оценки медицинских специалистов.

Готов к коммерческому применению

Готовый каталог электронных медицинских карт от Shaip лицензирован, обезличен и доступен для загрузки или доступа через Databricks Marketplace уже сегодня.

Поддержка полного жизненного цикла

Нужна дополнительная аннотация к исходным данным? Shaip предоставляет услуги по обезличиванию данных, клинической маркировке именованных сущностей и расширению данных от одного партнера.

Свяжитесь с нами

Не можете найти то, что ищете?

Новые готовые наборы медицинских данных собираются по всем типам данных. 

Свяжитесь с нами сейчас, чтобы избавиться от беспокойства по сбору данных о медицинском обучении

  • Это поле для целей проверки и должны быть оставлены без изменений.
  • Регистрируясь, я соглашаюсь с Shaip Персональные данные и Условия Предоставления Услуг и даю свое согласие на получение маркетинговых сообщений B2B от Shaip.

Наборы данных EHR используются для обучения моделей ИИ для прогнозирования заболеваний, принятия клинических решений и персонализированного лечения.

Данные электронных медицинских карт используются для обучения моделей искусственного интеллекта для поддержки принятия клинических решений, прогнозирования заболеваний, персонализированного планирования лечения и автоматизации здравоохранения.

Да, все данные EHR обезличиваются для удаления персонально идентифицируемой информации (PII) и соблюдения правил конфиденциальности.

Данные EHR содержат такие сведения, как демографические данные пациента, история болезни, диагнозы, планы лечения, результаты лабораторных анализов, радиологические изображения (например, КТ, МРТ, рентген), рецепты и записи о вакцинации.

Да, данные соответствуют HIPAA, GDPR и другим мировым стандартам конфиденциальности, что обеспечивает безопасное и этичное использование.

Да, наборы данных можно адаптировать с учетом конкретных медицинских специальностей, регионов, демографических характеристик пациентов или требований проекта.

Да, наборы данных предоставляются в стандартных форматах (например, JSON, CSV) для легкой интеграции в рабочие процессы ИИ и МО.

Данные проходят строгую проверку и контроль качества для обеспечения точности, согласованности и надежности.

Стоимость зависит от таких факторов, как объем данных, настройка и масштаб проекта. Мы просим вас заполнить форму «Связаться с нами» с вашими требованиями, чтобы получить лучшую цитату.

Сроки поставки зависят от масштаба и сложности проекта, но разрабатываются с учетом согласованных сроков.

Наборы данных EHR позволяют системам ИИ обеспечивать более качественную диагностику, прогностическую информацию и персонализированное лечение, улучшая результаты лечения пациентов и эффективность здравоохранения.

Да, Shaip предлагает индивидуальные наборы данных EHR с учетом специализации, возрастной группы, географии или требований проекта.

Электронные медицинские карты (ЭМК) содержат клинические данные от одного поставщика медицинских услуг; электронные медицинские карты (ЭМК) охватывают весь процесс лечения у нескольких поставщиков услуг, в разных условиях и в разные периоды времени. Shaip предоставляет как варианты наборов данных ЭМК, так и ЭМК, при этом доступны многосторонние продольные записи от нескольких поставщиков услуг для сложных задач обучения ИИ.

Все записи обезличены с использованием метода «безопасной гавани» в соответствии с Правилом конфиденциальности HIPAA — удалены все 18 идентификаторов PHI, включая имя, дату рождения, адрес и номера медицинских карт. Анонимизированное поле MRN сохраняется для сопоставления записей внутри набора данных, что позволяет проводить лонгитюдный анализ без риска повторной идентификации.