Точность онкологических данных: лицензирование, деидентификация и аннотация для инновационной модели НЛП
Революция в лечении рака с помощью передовых технологий НЛП.
Обзор проекта
Клиенту, крупному игроку в сфере здравоохранения, требовалось передовое решение НЛП для обработки значительного объема медицинских записей по онкологическим заболеваниям. В рамках ключевой инициативы по совершенствованию онкологических исследований необходимость сбалансировать подробный анализ данных со строгими стандартами конфиденциальности имеет первостепенное значение. В этом тематическом исследовании описывается наш вклад в расширение исследовательских усилий клиента посредством высокоточного аннотирования данных, строгих методов деидентификации и применения методов обработки естественного языка (NLP) - и все это в рамках нормативной базы, предусмотренной HIPAA.
Основная статистика
Лицензирование данных
+ Данные де-идентификации
10,000 страницы
Неонкология
Домен
10,000 страницы
Онкология
Домен
10,000 страницы
Онкология
Отношения
4500 страницы
отрицание
9000 страницы
НЭР + Отношения
Карт
1223 страницы
Задачи
Проект требовал детального понимания клинической документации, точной идентификации медицинских объектов и умения точно наносить отрицательные ярлыки, и все это в рамках безопасной структуры, которая защищает конфиденциальность пациентов в соответствии с правилами HIPAA. Это предприятие потребовало не только технических знаний в обработке больших объемов сложных данных, но и стратегического подхода для учета обратной связи и поддержания качества на всех этапах процесса аннотирования.
Подробное описание услуг:
- Комплексный охват клинических данных: Охватывая различные типы записей, условия оказания помощи и онкологические специализации, мы обеспечиваем надежный набор данных, отражающий разнообразные клинические сценарии.
- Строгая деидентификация: Обеспечение обезличивания всех помеченных записей в соответствии с методом Safe Harbor HIPAA, что гарантирует клиентам уверенность в конфиденциальности и безопасности данных.
- Руководство по аннотации: Создание и внедрение стандартных руководств по аннотированию данных для подготовки помеченных записей в соответствии со стандартами HIPAA.
- Расширенные методы аннотирования: Применение естественнонаучного языка к 10,000 XNUMX страниц записей, связанных с онкологией, включая сложную маркировку статусов отрицания и других соответствующих деталей в соответствии с ранее установленными рекомендациями.
- Строгая гарантия качества: Достичь указанного стандарта качества, изложенного в руководстве.
Решение
Наш подход включал следующие ключевые стратегии:
Комплексный охват клинических данных
Чтобы адаптировать набор данных к конкретным потребностям клиента, целевой выбор данных был тщательно извлечен из обширного хранилища Shaip, содержащего более 5 миллионов электронных медицинских карт. Этот курируемый набор данных охватывал различные типы заметок и параметры ухода, предоставляя богатый и разнообразный
спектр клинических сценариев. Это гарантирует, что набор данных не только всеобъемлющий, но и в высокой степени репрезентативный для реальных медицинских данных.
Строгая деидентификация
Этот процесс строго соответствует методу деидентификации Safe Harbor HIPAA, который гарантирует клиенту уверенность в конфиденциальности и безопасности данных. Это предполагает удаление всей защищенной медицинской информации (PHI) и замену ее помеченными заполнителями, тем самым сохраняя полезность данных и одновременно защищая конфиденциальность пациентов.
Переменные деидентификации
| Категория | Подкатегория |
|---|---|
| Имя | Имя пациента, Имя врача, Имя практикующей медсестры, Имя члена семьи, Название медицинского центра, Название клиники, Название дома престарелых, Название компании, Название университета |
| Возраст | |
| Время | Шаблон даты, Шаблон месяца и года, Шаблон дня месяца, Шаблон дня и года, День, Месяц, Год, Сезон |
| Локация | Страна, Штат, Город, Улица, Почтовый индекс, Номер комнаты, Номер люкса, Номер этажа |
| ID | Номер социального страхования, номер медицинской карты, номер получателя медицинского страхования, номер счета, номер сертификата/лицензии, биометрический идентификатор, идентификатор записи, регистрационный номер, идентификационный номер транспортного средства, номерной знак Идентификаторы устройств и серийный номер |
| Контакты | Номер телефона, номер факса, адрес электронной почты, URL-адрес веб-сайта, IP-адрес. |
Пример:
25 сентября 2106 года в 11:00 г-н Гарри Пейс, 90 лет, был госпитализирован в больницу общего профиля Форреста для плановой операции на бедре, предварительно проконсультировавшись с его лечащим врачом доктором Хосе Мартином и посещенной Кендрой Рейт. доктор медицинских наук. Во время своего пребывания он находился под опекой Мэри Ху, штат Нью-Йорк, и Сьюзан Рэй, медсестра, а также консультировался с Р. Чарльзом Меланконом, штат Пенсильвания. Его операция, проведенная в тот же день, что и госпитализация, прошла успешно, никаких осложнений не зарегистрировано. После операции г-на Пейса перевели в палату 202 на втором этаже для восстановления. Его жена Эмма Пейс присутствовала на протяжении всего заседания и получала всю необходимую информацию. Во время его кратковременного пребывания его медицинские записи, включая MRN MR2 и учетную запись KV99062619, велись в соответствии со стандартными протоколами дома престарелых Грейсвуд, его предыдущего места жительства. Позже в тот же день его выписали в амбулаторную клинику Окленда для дальнейшего выздоровления. На протяжении всего процесса все процедуры документировались и обеспечивались с соблюдением стандартов конфиденциальности.
Пример: обезличенный
On [Шаблон даты], в 11:00, г. [Имя пациента], в возрасте [Возраст], был принят в [Название медицинского центра] на плановую операцию на бедре, предварительно проконсультированный его лечащим врачом доктором. [Имя врача], и присутствовали [Имя врача] доктор медицинских наук. Во время пребывания он находился под опекой [Практикующая медсестра], НП и [Практикующая медсестра], РН, с [Имя врача], PA, также консультируется. Его операция, проведенная в тот же день, когда он поступил, прошла успешно, без каких-либо осложнений. После операции г-н [Имя пациента] был переведен в палату №. [Номер комнаты], Этаж № [Номер этажа], для восстановления. Его жена, [Имя члена семьи], присутствовал на протяжении всего времени и был обеспечен всеми необходимыми обновлениями. Во время его краткого пребывания его медицинские записи, включая MRN [Номер медицинской карты] и аккаунт [Номер счета], обрабатывались в соответствии со стандартными протоколами [Название дома престарелых], его предыдущее место жительства. Он был выписан позже в тот же день под опеку [Название клиники] для дальнейшего восстановления. На протяжении всего процесса все процедуры документировались и обеспечивались с соблюдением стандартов конфиденциальности.
Рекомендации по аннотированию и расширенные методы аннотирования
Шаип сыграл важную роль в установлении и внедрении стандартных руководств по аннотации данных, обеспечив, чтобы все маркированные записи были подготовлены последовательно и в соответствии со стандартами HIPAA. Более того, 10,000 XNUMX страниц из различных медицинских записей были тщательно аннотированы, с
фокус на детальной маркировке отрицательных статусов и других клинически значимых сущностей, включая различные онкологические субспециалисты. Аннотирование было выполнено командой экспертов-аннотаторов со специальными знаниями в области онкологии и правил конфиденциальности данных.
Комплексная аннотация
| Категория | Подкатегория |
|---|---|
| Время аннотирование (Онкология) | Дата диагностики, Дата стадии, Начало, Дата процедуры, Дата начала лечения, Дата окончания лечения, Дата начала радиации, Дата окончания радиации |
| Болезнь (Онкология) | Проблема рака, гистология, клинический статус, расположение тела, поведение, степень, стадия рака, стадия TNM, тест на опухолевые маркеры, размеры, код |
| Лечение (Онкология) | Лекарство от рака, Дозировка лекарства, Частота, Хирургия рака, Результат операции, Модальность радиации, Доза радиации |
| Геномика | Код вариации, изученный ген, метод, образец |
| отрицание | Отрицательный, Возможно отрицательный, Неопределенный, Возможно положительный |
| Клинический НЭР Отношения | Проблема рака – Место на теле, Гистология – Место на теле, Поведение – Место на теле, Хирургия рака – Место на теле, Модальность облучения – Место на теле, Гистология – Степень, Проблема рака – Измерение |
Пример:
Заявление о клинической записке по онкологии
«У пациентки Джейн Доу 03 был диагностирован немелкоклеточный рак легкого (НМРЛ) IIIB стадии, а именно аденокарцинома. Рак локализуется в правой нижней доле легкого. Согласно системе стадирования TNM, он классифицируется как T05N2023M3 с размером опухоли 2 см х 0 см. Делеция экзона 5 EGFR была выявлена посредством ПЦР-анализа образца биопсии опухоли. Химиотерапия карбоплатином AUC 3 и пеметрекседом 19 мг/м² была начата 5 и должна проводиться каждые 500 недели. Дистанционная лучевая терапия (ДЛТ) в дозе 03 Гр за 20 фракций начата 2023. Лечение пациента продолжается, на недавнем МРТ нет признаков метастазов в головной мозг. Возможность лимфоваскулярной инвазии еще предстоит определить, а переносимость пациентом полного режима химиотерапии остается неопределенной.
Заявление о клинической записке по онкологии:
Строгий контроль качества
Внедрили гибкую структуру управления проектами, которая способствовала эффективной интеграции отзывов клиентов, поддерживая при этом строгие стандарты качества. Был внедрен всеобъемлющий протокол обеспечения качества, соответствующий руководящим принципам для достижения требуемых контрольных показателей качества. Этот протокол включал последовательные раунды обзора и проверки, обеспечивающие точность и надежность аннотированных данных. Такой тщательный контроль качества имеет решающее значение для создания надежного решения NLP, жизненно важного для информированного принятия клинических решений и исследовательского совершенства.
Результат
Успешно доставлено 10,000 XNUMX высококачественных, деидентифицированных маркированных записей, что обеспечивает безопасный и ценный набор данных для разработки клиентской модели NLP. Тщательное применение NLP и соблюдение стандартов деидентификации HIPAA привели к получению высокоуточненного набора данных, который будет лежать в основе текущих и будущих усилий клиента по исследованию онкологии, в конечном итоге направленных на улучшение результатов лечения онкологических пациентов и эффективности предоставления медицинской помощи.
Успех проекта демонстрирует нашу способность точно обрабатывать сложные медицинские данные, способствуя достижению цели клиента по улучшению результатов лечения пациентов и ускорению темпов внедрения инноваций в здравоохранении.
Наше партнерство с Шаипом сыграло важную роль в расширении наших возможностей НЛП в области онкологии. Профессиональная обработка 10,000 XNUMX медицинских записей, аннотированных подробным отрицанием и другими клиническими данными, продемонстрировала их стремление к совершенству и соблюдению требований. Более того, их приверженность стандартам конфиденциальности, таким как HIPAA, предоставила нам бесценные ресурсы для продвижения наших инициатив в области искусственного интеллекта по разработке передовых методов лечения и диагностики онкологических заболеваний.