Проектом руководит заведующий кафедрой информатики Института математики и информационных технологий АлтГУ Денис Козлов.
Классификаторы будут использоваться в расшифровке снимков компьютерной томографии легких. В частности, в анализе шаровидных образований легких, которые, как правило, имеют три причины возникновения: рак, пневмония или туберкулез. На сегодняшний день достоверно определить происхождение образования можно только с помощью гистологической экспертизы, когда фрагмент ткани исследуется под микроскопом. Это исследование может принести дискомфорт пациенту, а также занимает время. А в некоторых случаях — например, при онкологии — медлить с лечением нельзя. Тут и придет на помощь искусственный интеллект.
Задача ученых — создать софт, который сможет анализировать и классифицировать полученные снимки КТ.
В настоящее время они занимаются построением моделей, используя типичную для программирования задачу «Задача машинного обучения с учителем». Компьютеру «показывают» множество изображений (в данном случае — образований легких), а потом правильные ответы — в каком случае, какой диагноз был поставлен по результатам гистологического исследования. Задача — научить нейросеть выявлять закономерности. И когда ей дадут новое изображение, которое не показывали ранее, она на основе накопившегося опыта сможет определить, какой класс на нем представлен: туберкулез, рак или пневмония.
Подобные работы ведутся учеными по всему миру. Это стало возможным благодаря гигантскому прогрессу в области искусственного интеллекта, который наблюдается в последнее десятилетие. Но здесь перед учеными встает проблема анонимности персональных данных. Закон Об охране персональных данных не позволяет использовать их даже в научно-исследовательских целях.
«Коллективу кафедры информатики совместно с коллегами из АГМУ и Диагностического центра Алтайского края пришлось решать задачу деперсонализации данных. Вся информация о пациенте при выполнении томографического обследования сохраняется в файле специального стандарта DICOM, и, как правило, хранит ряд персональных данных. Прежде, чем передать их исследователю, нужно их обезличить. Мы писали специальное программное обеспечение, которое умеет с файлами такого формата работать и удалять эти персональные данные. Сами изображения при этом остаются нетронутыми, как и информация о диагнозе, и мы можем их использовать, чтобы построить такой классификатор, который бы умел различать классы заболеваний на КТ-изображении», — говорит руководитель проекта Денис Козлов.
Реализация проекта будет способствовать повышению эффективности исследовательских процессов университета через внедрение в исследовательские процессы технологий искусственного интеллекта и методов обработки больших данных, разработке и внедрение технологий и продуктов для обеспечения качества здоровьесбережения населения и профилактики социально-значимых заболеваний. Кроме того, развитие инфраструктуры разработки и продвижения высокотехнологичных средств диагностики и прогнозирования клинического течения онкологических заболеваний направлено на обеспечение перехода к персонифицированной медицине и развитие новых технологий здоровьесбережения.