Второй по распространенности исследовательской задачей является сравнение диагностической точности врачей-рентгенологов и технологий искусственного интеллекта. Эта задача рассматривается в 26,0% (10) метаанализов, пять из которых имеют онкологическую направленность. Надо подчеркнуть, что в 50,0% этих метаанализов отсутствовали данные о квалификации, опыте врачей-рентгенологов, что, несомненно, снижает объективность результатов. В одной работе (Campello et al.) диагностическую точность ИИ оценивали по нативным изображениям, а врачей – по изображениям с контрастным усилением [124]; эту работу рассмотрели отдельно.
Опираясь на данные из семи указанных выше работ (где соответствующая информация была представлена в полном объеме), определили интервалы показателей диагностической точности для ИИ и для врачей [178, 138, 165, 146, 179, 160, 174].
Значение чувствительности ИИ колебалось в диапазоне 75,4—91,0%, в среднем составляя 85,2% (медиана – 86,0%); для врачей-рентгенологов диапазон составил 73,0—94,0%, среднее – 84,4% (медиана – 85,0%). Специфичность ИИ колебалась от 78,0 до 96,0%, в среднем достигая 89,5% (медиана – 91,0%); для врачей диапазон составил 82,0—98,0%, среднее – 90,0% (медиана – 94,0%).
Диапазон значений площади под характеристической кривой для ИИ был 89,0—97,0%, среднее составило 93,5% (медиана – 92,5%); соответственно для врачей – 85,0—98,0%, среднее – 92,8% (медиана – 94,0%).
Лишь в двух метаанализах приведены уровни статистической значимости при сравнении диагностических параметров ИИ и врачей. В обзоре J. H. Yoon и соавторов (2023), рассматривающем диагностику ЗНО посредством цифровой маммографии и томосинтеза, показано, что чувствительность ИИ (80,6%) достоверно выше (p = 0,031), чем 143 суммарно включенных врачей (73,6%); показатели специфичности ИИ (85,7%) и врачей (89,6%) не различаются достоверно (p = 0,221); значения AUROC не различаются достоверно (p = 0,152) между ИИ (87—90%) и врачами (81—96%) [178].
В обзоре S. E. Hickman и соавторов (2023) по аналогичной тематике, но без томосинтеза, показано, что чувствительность ИИ (75,4%) и 211 суммарно включенных врачей (73%) не различается достоверно (p = 0,7); специфичность ИИ (90,6%) и врачей (88,6%) не различается достоверно (p = 0,73) [138].
Еще в четырех метаанализах, рассматривающих диагностику пневмоторакса с использованием рентгенографии грудной клетки и КТ [165], переломов костей конечностей с использованием рентгенографии и КТ [146, 179], узлов щитовидной железы с использованием ультразвукового исследования [160], указано отсутствие разницы в значениях диагностических показателей между ИИ и врачами; при этом приведены сами показатели, но отсутствуют значения p-value.
В целом отмечается крайне высокая гетерогенность количества врачей, данных об их стаже, квалификации, компетенциях. Отсутствуют принятые подходы к описанию