Улучшение онкологических исследований НЛП
Точность онкологических данных: лицензирование, деидентификация и аннотация для инновационной модели НЛП
Революция в лечении рака с помощью передовых технологий НЛП
Клиенту, крупному игроку в сфере здравоохранения, требовалось передовое решение НЛП для обработки значительного объема медицинских записей по онкологическим заболеваниям. В рамках ключевой инициативы по совершенствованию онкологических исследований необходимость сбалансировать подробный анализ данных со строгими стандартами конфиденциальности имеет первостепенное значение. В этом тематическом исследовании описывается наш вклад в расширение исследовательских усилий клиента посредством высокоточного аннотирования данных, строгих методов деидентификации и применения методов обработки естественного языка (NLP) - и все это в рамках нормативной базы, предусмотренной HIPAA.
Объём
Вызовы
Проект требовал детального понимания клинической документации, точной идентификации медицинских объектов и умения точно наносить отрицательные ярлыки, и все это в рамках безопасной структуры, которая защищает конфиденциальность пациентов в соответствии с правилами HIPAA. Это предприятие потребовало не только технических знаний в обработке больших объемов сложных данных, но и стратегического подхода для учета обратной связи и поддержания качества на всех этапах процесса аннотирования.
Подробное описание услуг
Категории | Описание |
Комплексный охват клинических данных | Охватывая различные типы заметок, условия оказания медицинской помощи и онкологические специализации, обеспечивая надежный набор данных, отражающий различные клинические сценарии. |
Строгая деидентификация | Обеспечение обезличивания всех помеченных записей в соответствии с методом Safe Harbor HIPAA, что гарантирует клиентам уверенность в конфиденциальности и безопасности данных. |
Рекомендации по аннотациям | Создание и внедрение стандартных руководств по аннотированию данных для подготовки помеченных записей в соответствии со стандартами HIPAA. |
Расширенные стратегии аннотаций | Ручное аннотирование 10,000 XNUMX страниц записей, связанных с онкологией, было выполнено с особым вниманием к выявлению отрицательных статусов и другой соответствующей информации в соответствии с установленными руководящими принципами. |
Строгий контроль качества | Достичь указанного стандарта качества, указанного в руководстве. |
Решения
Наш подход включал следующие ключевые стратегии:
Составление индивидуального набора онкологических данных
Из обширного архива, насчитывающего более 5 миллионов электронных медицинских записей, был извлечен тщательно выбранный набор данных, направленный на удовлетворение специализированных требований клиента к онкологическим данным с акцентом на геномные объекты. Процесс сбора включал создание исчерпывающего списка опухолевых маркеров, генов, вариантов и стадий TNM с использованием поиска по ключевым словам для выявления документов, богатых этими данными. Регулярные выражения использовались для идентификации ряда генетических вариаций и стадий рака. Этот подход в сочетании с широким охватом данных, охватывающим различные типы документов, специальностей, условий оказания медицинской помощи и данные от нескольких врачей, обеспечил комплексный и актуальный набор онкологических данных.
Строгая деидентификация
Этот процесс строго соответствует методу деидентификации Safe Harbor HIPAA, который гарантирует клиенту уверенность в конфиденциальности и безопасности данных. Это предполагает удаление всей защищенной медицинской информации (PHI) и замену ее помеченными заполнителями, тем самым сохраняя полезность данных и одновременно защищая конфиденциальность пациентов.
Переменные деидентификации
Категории | Подкатегория |
Фамилия | Имя пациента, Имя врача, Имя практикующей медсестры, Имя члена семьи, Название медицинского центра, Название клиники, Название дома престарелых, Название компании, Название университета |
Возраст | |
Время | Шаблон даты, Шаблон месяца и года, Шаблон дня месяца, Шаблон дня и года, День, Месяц, Год, Сезон |
Адрес | Страна, Штат, Город, Улица, Почтовый индекс, Номер комнаты, Номер люкса, Номер этажа |
ID | Номер социального страхования, Номер медицинской карты, Номер бенефициара плана медицинского страхования, Номер счета, Номер сертификата/лицензии, Биометрический идентификатор, Идентификатор записи, Номер доступа, Идентификационный номер транспортного средства, Номерной знак Идентификаторы устройства и серийный номер |
Контакты | Номер телефона, номер факса, адрес электронной почты, URL-адрес веб-сайта, IP-адрес. |
Пример:
25 сентября 2106 года в 11:00 г-н Гарри Пейс, 90 лет, был госпитализирован в больницу общего профиля Форреста для плановой операции на бедре, предварительно проконсультировавшись с его лечащим врачом доктором Хосе Мартином и посещенной Кендрой Рейт. доктор медицинских наук. Во время своего пребывания он находился под опекой Мэри Ху, штат Нью-Йорк, и Сьюзан Рэй, медсестра, а также консультировался с Р. Чарльзом Меланконом, штат Пенсильвания. Его операция, проведенная в тот же день, что и госпитализация, прошла успешно, никаких осложнений не зарегистрировано. После операции г-на Пейса перевели в палату 202 на втором этаже для восстановления. Его жена Эмма Пейс присутствовала на протяжении всего заседания и получала всю необходимую информацию. Во время его кратковременного пребывания его медицинские записи, включая MRN MR2 и учетную запись KV99062619, велись в соответствии со стандартными протоколами дома престарелых Грейсвуд, его предыдущего места жительства. Позже в тот же день его выписали в амбулаторную клинику Окленда для дальнейшего выздоровления. На протяжении всего процесса все процедуры документировались и обеспечивались с соблюдением стандартов конфиденциальности.
Пример: обезличенный
On [Шаблон даты], в 11:00, г. [Имя пациента], в возрасте [Возраст], был принят в [Название медицинского центра] на плановую операцию на бедре, предварительно проконсультированный его лечащим врачом доктором. [Имя врача], и приняли участие [Имя врача] доктор медицинских наук. Во время пребывания он находился под опекой [Практикующая медсестра], НП и [Практикующая медсестра], РН, с [Имя врача], ПА, также проводятся консультации. Его операция, проведенная в тот же день, что и госпитализация, прошла успешно, никаких осложнений не зарегистрировано. После операции г-н. [Имя пациента] был переведен в палату №. [Номер комнаты], Этаж №. [Номер этажа], для восстановления. Его жена, [Имя члена семьи], присутствовала на протяжении всего заседания и получала всю необходимую информацию. Во время его краткого пребывания его медицинские записи, включая MRN, [Номер медицинской карты] и аккаунт [Номер счета], проводились по стандартным протоколам [Название дома престарелых], его прежнее место жительства. В тот же день его выписали под опеку [Название клиники] для дальнейшего восстановления. На протяжении всего процесса все процедуры документировались и обеспечивались с соблюдением стандартов конфиденциальности.
Рекомендации по аннотированию и расширенные методы аннотирования
Шаип сыграл важную роль в разработке и внедрении стандартных руководств по аннотированию данных, гарантируя, что все маркированные записи будут подготовлены последовательно и в соответствии со стандартами HIPAA. Более того, 10,000 XNUMX страниц различных медицинских записей были тщательно аннотированы, уделяя особое внимание подробному описанию отрицательных статусов и других клинически значимых объектов, включая различные онкологические специальности. Аннотации были выполнены командой экспертов-аннотаторов, обладающих специальными знаниями в области онкологии и правил конфиденциальности данных.
Сложные критерии аннотации
Категории | Подкатегория |
Аннотация даты (онкология) | Дата диагноза, дата стадии, начало, дата процедуры, дата начала лечения, дата окончания лечения, дата начала облучения, дата окончания облучения |
Болезнь (онкология) | Проблема рака, гистология, клинический статус, расположение тела, поведение, степень, стадия рака, стадия TNM, тест на опухолевые маркеры, размеры, код |
Лечение (онкология) | Лекарство от рака, Дозировка лекарства, Частота, Хирургия рака, Результат операции, Модальность радиации, Доза радиации |
Геномика | Код вариации, изученный ген, метод, образец |
отрицание | Отрицательный, Возможно отрицательный, Неопределенный, Возможно положительный |
Клинический НЭР | Проблема рака – участок тела, гистология – участок тела, поведение – участок тела, хирургия рака – взаимоотношения участок тела, модальность радиации – участок тела, гистология – степень, проблема рака – размерность |
Пример:
Заявление о клинической записке по онкологии
«У пациентки Джейн Доу 03 был диагностирован немелкоклеточный рак легкого (НМРЛ) IIIB стадии, а именно аденокарцинома. Рак локализуется в правой нижней доле легкого. Согласно системе стадирования TNM, он классифицируется как T05N2023M3 с размером опухоли 2 см х 0 см. Делеция экзона 5 EGFR была выявлена посредством ПЦР-анализа образца биопсии опухоли. Химиотерапия карбоплатином AUC 3 и пеметрекседом 19 мг/м² была начата 5 и должна проводиться каждые 500 недели. Дистанционная лучевая терапия (ДЛТ) в дозе 03 Гр за 20 фракций начата 2023. Лечение пациента продолжается, на недавнем МРТ нет признаков метастазов в головной мозг. Возможность лимфоваскулярной инвазии еще предстоит определить, а переносимость пациентом полного режима химиотерапии остается неопределенной.
Заявление о клинической записке по онкологии
Строгий контроль качества
Внедрил гибкую структуру управления проектами, которая способствовала эффективной интеграции отзывов клиентов при соблюдении строгих стандартов качества. Был введен в действие всеобъемлющий протокол обеспечения качества, соответствующий руководящим принципам для достижения необходимых показателей качества. Этот протокол включал последовательные раунды проверки и проверки, обеспечивающие точность и надежность аннотированных данных. Такой тщательный контроль качества имеет решающее значение для создания надежного решения НЛП, жизненно важного для принятия обоснованных клинических решений и повышения качества исследований.
Результат
Успешно доставлено 10,000 XNUMX высококачественных неопознанных помеченных записей, предоставивших безопасный и ценный набор данных для разработки модели НЛП клиента. Тщательное применение НЛП и соблюдение стандартов деидентификации HIPAA привело к созданию высокоточного набора данных, который станет основой текущих и будущих усилий клиента по исследованию онкологии, в конечном итоге направленных на улучшение результатов лечения онкологических пациентов и эффективности оказания медицинской помощи.
Успех проекта демонстрирует нашу способность точно обрабатывать сложные медицинские данные, способствуя достижению цели клиента по улучшению результатов лечения пациентов и ускорению темпов инноваций в сфере здравоохранения.
Наше партнерство с Шаипом сыграло важную роль в расширении наших возможностей НЛП в области онкологии. Профессиональная обработка 10,000 XNUMX медицинских записей, аннотированных подробным отрицанием и другими клиническими данными, продемонстрировала их стремление к совершенству и соблюдению требований. Более того, их приверженность стандартам конфиденциальности, таким как HIPAA, предоставила нам бесценные ресурсы для продвижения наших инициатив в области искусственного интеллекта по разработке передовых методов лечения и диагностики онкологических заболеваний.