Улучшение онкологических исследований НЛП

Точность онкологических данных: лицензирование, деидентификация и аннотация для инновационной модели НЛП

Онкология НЛП

Революция в лечении рака с помощью передовых технологий НЛП

Клиенту, крупному игроку в сфере здравоохранения, требовалось передовое решение НЛП для обработки значительного объема медицинских записей по онкологическим заболеваниям. В рамках ключевой инициативы по совершенствованию онкологических исследований необходимость сбалансировать подробный анализ данных со строгими стандартами конфиденциальности имеет первостепенное значение. В этом тематическом исследовании описывается наш вклад в расширение исследовательских усилий клиента посредством высокоточного аннотирования данных, строгих методов деидентификации и применения методов обработки естественного языка (NLP) - и все это в рамках нормативной базы, предусмотренной HIPAA.

Объём

Лицензирование данных + деидентификация данных
10 Разделы
Отношения с онкологией
10 Разделы
Неонкологический домен
10 Разделы
отрицание
10 Разделы
Домен онкологии
10 Разделы
НЭР + картирование отношений
10 Разделы

Вызовы

Проект требовал детального понимания клинической документации, точной идентификации медицинских объектов и умения точно наносить отрицательные ярлыки, и все это в рамках безопасной структуры, которая защищает конфиденциальность пациентов в соответствии с правилами HIPAA. Это предприятие потребовало не только технических знаний в обработке больших объемов сложных данных, но и стратегического подхода для учета обратной связи и поддержания качества на всех этапах процесса аннотирования.

Цели

Подробное описание услуг

КатегорииОписание
Комплексный охват клинических данныхОхватывая различные типы заметок, условия оказания медицинской помощи и онкологические специализации, обеспечивая надежный набор данных, отражающий различные клинические сценарии.
Строгая деидентификацияОбеспечение обезличивания всех помеченных записей в соответствии с методом Safe Harbor HIPAA, что гарантирует клиентам уверенность в конфиденциальности и безопасности данных.
Рекомендации по аннотациямСоздание и внедрение стандартных руководств по аннотированию данных для подготовки помеченных записей в соответствии со стандартами HIPAA.
Расширенные стратегии аннотацийРучное аннотирование 10,000 XNUMX страниц записей, связанных с онкологией, было выполнено с особым вниманием к выявлению отрицательных статусов и другой соответствующей информации в соответствии с установленными руководящими принципами.
Строгий контроль качестваДостичь указанного стандарта качества, указанного в руководстве.

Решения

Наш подход включал следующие ключевые стратегии:

Составление индивидуального набора онкологических данных

Из обширного архива, насчитывающего более 5 миллионов электронных медицинских записей, был извлечен тщательно выбранный набор данных, направленный на удовлетворение специализированных требований клиента к онкологическим данным с акцентом на геномные объекты. Процесс сбора включал создание исчерпывающего списка опухолевых маркеров, генов, вариантов и стадий TNM с использованием поиска по ключевым словам для выявления документов, богатых этими данными. Регулярные выражения использовались для идентификации ряда генетических вариаций и стадий рака. Этот подход в сочетании с широким охватом данных, охватывающим различные типы документов, специальностей, условий оказания медицинской помощи и данные от нескольких врачей, обеспечил комплексный и актуальный набор онкологических данных.

Сбор данных по онкологии

Строгая деидентификация

Этот процесс строго соответствует методу деидентификации Safe Harbor HIPAA, который гарантирует клиенту уверенность в конфиденциальности и безопасности данных. Это предполагает удаление всей защищенной медицинской информации (PHI) и замену ее помеченными заполнителями, тем самым сохраняя полезность данных и одновременно защищая конфиденциальность пациентов.

Переменные деидентификации

КатегорииПодкатегория
ФамилияИмя пациента, Имя врача, Имя практикующей медсестры, Имя члена семьи, Название медицинского центра, Название клиники, Название дома престарелых, Название компании, Название университета
Возраст 
ВремяШаблон даты, Шаблон месяца и года, Шаблон дня месяца, Шаблон дня и года, День, Месяц, Год, Сезон
АдресСтрана, Штат, Город, Улица, Почтовый индекс, Номер комнаты, Номер люкса, Номер этажа
IDНомер социального страхования, Номер медицинской карты, Номер бенефициара плана медицинского страхования, Номер счета, Номер сертификата/лицензии, Биометрический идентификатор, Идентификатор записи, Номер доступа, Идентификационный номер транспортного средства, Номерной знак Идентификаторы устройства и серийный номер
КонтактыНомер телефона, номер факса, адрес электронной почты, URL-адрес веб-сайта, IP-адрес.

Пример:

25 сентября 2106 года в 11:00 г-н Гарри Пейс, 90 лет, был госпитализирован в больницу общего профиля Форреста для плановой операции на бедре, предварительно проконсультировавшись с его лечащим врачом доктором Хосе Мартином и посещенной Кендрой Рейт. доктор медицинских наук. Во время своего пребывания он находился под опекой Мэри Ху, штат Нью-Йорк, и Сьюзан Рэй, медсестра, а также консультировался с Р. Чарльзом Меланконом, штат Пенсильвания. Его операция, проведенная в тот же день, что и госпитализация, прошла успешно, никаких осложнений не зарегистрировано. После операции г-на Пейса перевели в палату 202 на втором этаже для восстановления. Его жена Эмма Пейс присутствовала на протяжении всего заседания и получала всю необходимую информацию. Во время его кратковременного пребывания его медицинские записи, включая MRN MR2 и учетную запись KV99062619, велись в соответствии со стандартными протоколами дома престарелых Грейсвуд, его предыдущего места жительства. Позже в тот же день его выписали в амбулаторную клинику Окленда для дальнейшего выздоровления. На протяжении всего процесса все процедуры документировались и обеспечивались с соблюдением стандартов конфиденциальности.

Пример: обезличенный

On [Шаблон даты], в 11:00, г. [Имя пациента], в возрасте [Возраст], был принят в [Название медицинского центра] на плановую операцию на бедре, предварительно проконсультированный его лечащим врачом доктором. [Имя врача], и приняли участие [Имя врача] доктор медицинских наук. Во время пребывания он находился под опекой [Практикующая медсестра], НП и [Практикующая медсестра], РН, с [Имя врача], ПА, также проводятся консультации. Его операция, проведенная в тот же день, что и госпитализация, прошла успешно, никаких осложнений не зарегистрировано. После операции г-н. [Имя пациента] был переведен в палату №. [Номер комнаты], Этаж №. [Номер этажа], для восстановления. Его жена, [Имя члена семьи], присутствовала на протяжении всего заседания и получала всю необходимую информацию. Во время его краткого пребывания его медицинские записи, включая MRN, [Номер медицинской карты] и аккаунт [Номер счета], проводились по стандартным протоколам [Название дома престарелых], его прежнее место жительства. В тот же день его выписали под опеку [Название клиники] для дальнейшего восстановления. На протяжении всего процесса все процедуры документировались и обеспечивались с соблюдением стандартов конфиденциальности.

Рекомендации по аннотированию и расширенные методы аннотирования

Шаип сыграл важную роль в разработке и внедрении стандартных руководств по аннотированию данных, гарантируя, что все маркированные записи будут подготовлены последовательно и в соответствии со стандартами HIPAA. Более того, 10,000 XNUMX страниц различных медицинских записей были тщательно аннотированы, уделяя особое внимание подробному описанию отрицательных статусов и других клинически значимых объектов, включая различные онкологические специальности. Аннотации были выполнены командой экспертов-аннотаторов, обладающих специальными знаниями в области онкологии и правил конфиденциальности данных.

Сложные критерии аннотации

КатегорииПодкатегория
Аннотация даты (онкология)Дата диагноза, дата стадии, начало, дата процедуры, дата начала лечения, дата окончания лечения, дата начала облучения, дата окончания облучения
Болезнь (онкология)Проблема рака, гистология, клинический статус, расположение тела, поведение, степень, стадия рака, стадия TNM, тест на опухолевые маркеры, размеры, код
Лечение (онкология)Лекарство от рака, Дозировка лекарства, Частота, Хирургия рака, Результат операции, Модальность радиации, Доза радиации
ГеномикаКод вариации, изученный ген, метод, образец
отрицаниеОтрицательный, Возможно отрицательный, Неопределенный, Возможно положительный
Клинический НЭРПроблема рака – участок тела, гистология – участок тела, поведение – участок тела, хирургия рака – взаимоотношения участок тела, модальность радиации – участок тела, гистология – степень, проблема рака – размерность

Пример:

Клиническая справка по онкологии

Заявление о клинической записке по онкологии

«У пациентки Джейн Доу 03 был диагностирован немелкоклеточный рак легкого (НМРЛ) IIIB стадии, а именно аденокарцинома. Рак локализуется в правой нижней доле легкого. Согласно системе стадирования TNM, он классифицируется как T05N2023M3 с размером опухоли 2 см х 0 см. Делеция экзона 5 EGFR была выявлена ​​посредством ПЦР-анализа образца биопсии опухоли. Химиотерапия карбоплатином AUC 3 и пеметрекседом 19 мг/м² была начата 5 и должна проводиться каждые 500 недели. Дистанционная лучевая терапия (ДЛТ) в дозе 03 Гр за 20 фракций начата 2023. Лечение пациента продолжается, на недавнем МРТ нет признаков метастазов в головной мозг. Возможность лимфоваскулярной инвазии еще предстоит определить, а переносимость пациентом полного режима химиотерапии остается неопределенной.

Заявление о клинической записке по онкологии

Клиническая справка по онкологии

Строгий контроль качества

Внедрил гибкую структуру управления проектами, которая способствовала эффективной интеграции отзывов клиентов при соблюдении строгих стандартов качества. Был введен в действие всеобъемлющий протокол обеспечения качества, соответствующий руководящим принципам для достижения необходимых показателей качества. Этот протокол включал последовательные раунды проверки и проверки, обеспечивающие точность и надежность аннотированных данных. Такой тщательный контроль качества имеет решающее значение для создания надежного решения НЛП, жизненно важного для принятия обоснованных клинических решений и повышения качества исследований.

Результат

Успешно доставлено 10,000 XNUMX высококачественных неопознанных помеченных записей, предоставивших безопасный и ценный набор данных для разработки модели НЛП клиента. Тщательное применение НЛП и соблюдение стандартов деидентификации HIPAA привело к созданию высокоточного набора данных, который станет основой текущих и будущих усилий клиента по исследованию онкологии, в конечном итоге направленных на улучшение результатов лечения онкологических пациентов и эффективности оказания медицинской помощи.

Успех проекта демонстрирует нашу способность точно обрабатывать сложные медицинские данные, способствуя достижению цели клиента по улучшению результатов лечения пациентов и ускорению темпов инноваций в сфере здравоохранения.

Наше партнерство с Шаипом сыграло важную роль в расширении наших возможностей НЛП в области онкологии. Профессиональная обработка 10,000 XNUMX медицинских записей, аннотированных подробным отрицанием и другими клиническими данными, продемонстрировала их стремление к совершенству и соблюдению требований. Более того, их приверженность стандартам конфиденциальности, таким как HIPAA, предоставила нам бесценные ресурсы для продвижения наших инициатив в области искусственного интеллекта по разработке передовых методов лечения и диагностики онкологических заболеваний.

Золотой-5-звездочный

Ускорьте работу ИИ в сфере здравоохранения
разработка приложений на 100%