В новом исследовании, посвященном предсказанию стадии рака легких на основе самоотчетов о симптомах и фоновых факторах, ученые применили машинное обучение для анализа данных пациентов. Целью работы было сравнение симптомов и факторов, влияющих на диагностику рака легких, а также разработка предсказательных моделей, которые помогут выявлять ранние и поздние стадии заболевания.
В ходе исследования были использованы унивариантная логистическая регрессия и три алгоритма машинного обучения. Результаты показали, что у пациентов с нераспространенным раком легких наблюдаются отличия в шести фоновых факторах и двух симптомах по сравнению с пациентами без рака. В случае с распространенным раком различия были более значительными: 11 фоновых факторов и 19 симптомов.
Модели машинного обучения продемонстрировали умеренную эффективность в классификации пациентов с раком легких и без него. Интересно, что ключевые предикторы выходят за рамки классических респираторных симптомов. Демографические и жизненные факторы, такие как возраст, статус курения и условия проживания, оказались важными, наряду с симптомами, такими как боль, потеря аппетита, снижение веса и респираторные проблемы.
Эти результаты подчеркивают необходимость интеграции клинических, демографических данных и симптомов, сообщаемых пациентами, для улучшения моделей оценки риска рака легких и уточнения решений о направлениях в рамках скрининговых программ. Это может значительно повысить шансы на раннюю диагностику и, как следствие, улучшить результаты лечения.
Данные, поддерживающие результаты исследования, не доступны для открытого доступа из-за соображений конфиденциальности, но могут быть получены у авторов по запросу. Код, использованный для анализа, доступен на GitHub, что позволяет другим исследователям воспроизводить и развивать эти методы.