7 min read

Meniscus Tear Detection with AI: Why Detection Outpaces Localisation in Knee MRI

AI detects meniscal tears with 87% sensitivity — but accurately localising them remains a challenge. How deep learning is advancing meniscus assessment, where the gaps are, and what clinicians should know about the detection-localisation asymmetry.

Salnus Orthopedic Solutions
MeniscusMeniscal TearAIMRIDeep LearningKneeMusculoskeletal Radiology

The Meniscus: A Unique Challenge for AI

The menisci are among the most commonly injured structures in the knee — and among the most difficult for AI to assess accurately. Unlike ACL tears, which present as a disrupted linear structure on MRI, meniscal tears are morphologically diverse: horizontal cleavage tears, radial tears, complex tears, bucket-handle tears, and root tears each have distinct appearances and distinct surgical implications.

This morphological diversity makes meniscal assessment one of the harder problems in musculoskeletal radiology — and one where AI performance has historically lagged behind human experts.

Prevalence of degenerative changes. In patients over 40, meniscal signal abnormalities are extremely common — many represent asymptomatic degenerative changes rather than clinically significant tears. An AI model that flags every signal abnormality will have high sensitivity but poor specificity, generating excessive false positives that erode clinical trust.

What Does the Evidence Show?

Systematic Reviews and Meta-Analyses

A 2024 systematic review and meta-analysis in the European Journal of Radiology examined AI performance for meniscal tear detection across published studies. The pooled results revealed an important asymmetry: AI was better at detecting the presence of tears (sensitivity 87%, specificity 89%) than at accurately locating them within specific anatomical sub-regions (sensitivity 88%, specificity lower and more variable).

This finding has direct clinical implications. Knowing that a meniscal tear exists is useful for screening, but surgical planning requires knowing where it is. AI that detects but cannot localise offers limited value to the treating surgeon.

A 2025 systematic review published in Cureus examined AI-based meniscal tear detection across multiple studies, confirming that binary detection performance is approaching clinical utility — but location-specific classification remains less reliable. A separate 2025 meta-analysis in PLoS One reinforced these findings across a broader dataset.

Technical Approaches

MRNet (Bien et al., 2018) remains a foundational benchmark. This Stanford dataset of 1,370 knee MRI examinations with labels for ACL tears, meniscal tears, and general abnormalities established the deep learning approach to knee MRI interpretation. Published models achieve AUC of 0.84–0.87 for meniscal tear detection on this dataset.

nnU-Net-based approaches that combine segmentation with classification have shown improved performance. Using nnU-Net for segmentation followed by 3D CNN classification, AUC values of 0.89–0.93 have been reported.

YOLOv8 + EfficientNetV2 (Gungor et al., 2025) achieved mAP@50 of 0.98 for meniscus localisation and AUC of 0.97–0.98 for tear classification — the highest published results. However, this study used 642 knees with expert annotation of specifically selected slices (one sagittal, one coronal per patient), which may overestimate performance on full volumetric data.

Weakly supervised approaches (FAD-MIL, 2026) address the annotation bottleneck by learning from image-level labels rather than pixel-level segmentation, achieving AUC 0.833 on the FracAtlas-equivalent meniscus dataset — lower than fully supervised approaches but requiring dramatically less annotation effort.

The Location Problem

The most clinically relevant finding across the literature is that AI performs substantially better at binary detection (tear present/absent) than at anatomical localisation (which compartment, which horn, which tear pattern).

This matters because treatment decisions depend on localisation. A small radial tear in the red-red zone (peripheral vascularised region) may be amenable to repair, while the same tear in the white-white zone (avascular central region) is more likely to require partial meniscectomy. A bucket-handle tear needs urgent surgical attention; a stable horizontal cleavage tear may be managed conservatively.

Until AI can reliably distinguish these patterns, its role in meniscal assessment remains primarily as a screening tool — flagging cases that warrant careful radiologist review — rather than a diagnostic tool that can inform surgical planning directly.

Multi-Structure Assessment: The Future Direction

Beyond Single-Structure Models

The knee does not tear one structure at a time. ACL ruptures are frequently associated with lateral meniscal tears. PCL injuries often accompany complex multi-ligament patterns. Meniscal tears commonly coexist with cartilage damage and early osteoarthritic changes.

Multi-task models that simultaneously assess ligament, meniscus, cartilage, and bone from a single MRI acquisition represent the natural evolution of knee AI. These models mirror the radiologist's approach — evaluating the entire joint rather than isolated structures — and are more computationally efficient than running separate models for each pathology.

The MRNet dataset includes labels for ACL tears, meniscal tears, and general abnormalities, making it a natural platform for multi-task learning research. Published multi-task models have shown that joint learning across structures improves performance for each individual task compared to single-task models.

Integration with Bone Segmentation

Meniscal assessment does not exist in isolation. Combining soft tissue evaluation (meniscus, cartilage, ligaments) with bone segmentation and geometric analysis creates a comprehensive joint assessment platform.

For example, a medial meniscal tear combined with varus mechanical axis alignment (measured from automated geometric analysis) carries a different prognosis — and may warrant different treatment — than the same tear in a neutrally aligned knee. Integrating these assessments into a unified platform supports more nuanced clinical decision-making.

What Clinicians Should Know

AI is a screening tool for meniscal tears, not a diagnostic replacement. Pooled sensitivity of 87% and specificity of 89% is useful but insufficient for stand-alone diagnosis.

Detection outpaces localisation. AI can reliably tell you that a meniscal tear exists. It is less reliable at telling you exactly where it is and what type it is.

MRI sequence matters. Most published models are trained on specific sequences (proton density-weighted, T2-weighted). Performance may degrade on sequences the model has not seen.

Degenerative signal is the main source of false positives. In older patients, AI models frequently flag grade 2 intrasubstance signal as tears. Understanding this limitation prevents unnecessary surgical referrals.

Multi-structure models are coming. Rather than separate tools for ACL, meniscus, and cartilage, expect integrated platforms that assess the entire knee joint from a single MRI — matching the radiologist's holistic approach.

Explainability is particularly important for meniscal assessment. Because tears are morphologically diverse and can be subtle, the ability to see which region of the MRI the model is attending to is critical for trust calibration.

Where Salnus Fits

Salnus's MRI analysis pipeline (Motor 2) is currently focused on ACL assessment, with meniscal tear detection as a planned extension. The Stanford MRNet dataset — which we use for ACL model development — includes meniscal tear labels, providing a natural path for multi-task model development.

Our bone segmentation pipeline, achieving Dice scores of 0.964 across four knee bones, complements soft tissue assessment by providing the geometric context needed for comprehensive joint evaluation. The combination of bone geometry, ligament integrity (ACL, PCL), and meniscal status represents the long-term vision: a unified AI-powered knee assessment platform.

For clinicians and researchers interested in meniscal AI assessment or multi-structure knee MRI analysis, contact our team →


Disclaimer: This article is for educational and research purposes only. Salnus tools are designated for Research Use Only (RUO) and are not cleared medical devices. Clinical decisions regarding meniscal pathology should be made by qualified orthopaedic surgeons based on comprehensive clinical and imaging assessment.

References:

  • Zhao Y, et al. AI applied to MRI reliably detects the presence, but not the location, of meniscus tears: systematic review and meta-analysis. Eur Radiol. 2025;35(5):2952-2953.
  • Giammanco PA, et al. Diagnostic Accuracy of AI for Detection of Meniscus Pathology on MRI: A Systematic Review. Cureus. 2025;17(9):e91832.
  • Gungor N, et al. High accuracy in meniscus tear detection using YOLOv8 and EfficientNetV2. KSSTA. 2025.
  • Bien N, et al. Deep-learning-assisted diagnosis for knee MRI: MRNet. PLoS Med. 2018;15(11):e1002699.
  • Tack A, et al. Multi-Task Deep Learning for Detection of Meniscal Tears. Frontiers Bioeng Biotechnol. 2021;9:747217.
  • Mohammadi S, et al. Diagnosis of knee meniscal injuries using AI: systematic review and meta-analysis. PLoS One. 2025;20(6):e0326339.

Menisküs: Yapay Zeka İçin Benzersiz Bir Zorluk

Menisküsler dizde en sık yaralanan yapılar arasındadır — ve yapay zekanın doğru değerlendirmesi en zor olanlar arasında. ÖÇB yırtıklarından farklı olarak — MR'da bozulmuş lineer bir yapı olarak görülen — menisküs yırtıkları morfolojik olarak çeşitlidir: yatay bölünme yırtıkları, radyal yırtıklar, kompleks yırtıklar, kova sapı yırtıkları ve kök yırtıklarının her birinin farklı görünümleri ve farklı cerrahi etkileri vardır.

Bu morfolojik çeşitlilik, menisküs değerlendirmesini kas-iskelet radyolojisindeki daha zor problemlerden biri yapar — ve yapay zeka performansının tarihsel olarak insan uzmanların gerisinde kaldığı bir alan.

Dejeneratif değişikliklerin yaygınlığı. 40 yaş üstü hastalarda meniskal sinyal anormallikleri son derece yaygındır — birçoğu klinik olarak anlamlı yırtıklardan ziyade asemptomatik dejeneratif değişiklikleri temsil eder. Her sinyal anormalliğini işaretleyen bir yapay zeka modeli yüksek duyarlılığa ancak düşük özgüllüğe sahip olacak, klinik güveni aşındıran aşırı yanlış pozitifler üretecektir.

Kanıtlar Ne Gösteriyor?

Sistematik Derlemeler ve Meta-Analizler

2024 yılında European Journal of Radiology'de yayımlanan bir sistematik derleme ve meta-analiz, yapay zekanın menisküs yırtığı tespitindeki performansını incelemiştir. Havuzlanmış sonuçlar önemli bir asimetri ortaya koymuştur: yapay zeka yırtıkların varlığını tespit etmede (duyarlılık %87, özgüllük %89) spesifik anatomik alt bölgelerde doğru lokalize etmekten (duyarlılık %88, özgüllük daha düşük ve daha değişken) daha başarılıdır.

Bu bulgunun doğrudan klinik sonuçları vardır. Menisküs yırtığının var olduğunu bilmek tarama için yararlıdır, ancak cerrahi planlama nerede olduğunu bilmeyi gerektirir. Tespit eden ancak lokalize edemeyen yapay zeka, tedavi eden cerrah için sınırlı değer sunar.

2025 yılında Cureus'ta yayımlanan sistematik derleme, yapay zeka tabanlı menisküs yırtığı tespitinin birden fazla çalışmada incelenmesiyle ikili tespit performansının klinik faydaya yaklaştığını — ancak lokalizasyona özgü sınıflandırmanın daha az güvenilir kaldığını doğrulamıştır. 2025'te PLoS One'da yayımlanan ayrı bir meta-analiz bu bulguları daha geniş bir veri setinde pekiştirmiştir.

Teknik Yaklaşımlar

MRNet (Bien vd., 2018) temel bir referans noktası olmaya devam etmektedir. Stanford'dan 1.370 diz MR incelemesini içeren bu veri seti, ÖÇB yırtıkları, menisküs yırtıkları ve genel anormallikler için etiketlerle diz MR yorumlamasına derin öğrenme yaklaşımını belirlemiştir. Yayınlanmış modeller bu veri setinde menisküs yırtığı tespiti için 0,84-0,87 AUC elde etmektedir.

nnU-Net tabanlı yaklaşımlar segmentasyonu sınıflandırmayla birleştirerek iyileştirilmiş performans göstermiştir. nnU-Net segmentasyonu ardından 3B CNN sınıflandırması kullanılarak 0,89-0,93 AUC değerleri raporlanmıştır.

YOLOv8 + EfficientNetV2 (Güngör vd., 2025) menisküs lokalizasyonunda mAP@50 0,98 ve yırtık sınıflandırmasında AUC 0,97-0,98 elde etmiştir — en yüksek yayınlanmış sonuçlar. Ancak bu çalışma, özellikle seçilmiş kesitlerde (hasta başına bir sagittal, bir koronal) uzman anotasyonlu 642 diz kullanmıştır — bu durum tam hacimsel verideki performansı abartıyor olabilir.

Zayıf denetimli yaklaşımlar (FAD-MIL, 2026) piksel düzeyinde segmentasyon yerine görüntü düzeyinde etiketlerden öğrenerek anotasyon darboğazını ele almakta ve menisküs veri setinde AUC 0,833 elde etmektedir — tam denetimli yaklaşımlardan düşük ancak çok daha az anotasyon çabası gerektirmektedir.

Lokalizasyon Problemi

Literatürdeki klinik olarak en ilgili bulgu, yapay zekanın ikili tespitte (yırtık var/yok) anatomik lokalizasyondan (hangi kompartman, hangi boynuz, hangi yırtık paterni) önemli ölçüde daha iyi performans göstermesidir.

Bu önemlidir çünkü tedavi kararları lokalizasyona bağlıdır. Kırmızı-kırmızı zondaki (periferik vaskülarize bölge) küçük bir radyal yırtık tamire uygun olabilirken, beyaz-beyaz zondaki (avasküler merkezi bölge) aynı yırtığın kısmi menisektomi gerektirmesi daha olasıdır. Kova sapı yırtığı acil cerrahi dikkat gerektirir; stabil yatay bölünme yırtığı konservatif olarak yönetilebilir.

Yapay zeka bu paternleri güvenilir şekilde ayırt edene kadar, menisküs değerlendirmesindeki rolü temel olarak tarama aracı olarak kalacaktır — dikkatli radyolog incelemesi gerektiren vakaları işaretleyen — doğrudan cerrahi planlamayı bilgilendirebilen tanı aracı değil.

Çoklu Yapı Değerlendirmesi: Gelecek Yönü

Tek Yapı Modellerinin Ötesinde

Diz tek seferde tek yapı yırtmaz. ÖÇB rüptürleri sıklıkla lateral menisküs yırtıklarıyla ilişkilidir. AÇB yaralanmaları genellikle kompleks çoklu bağ paternleriyle birlikte bulunur. Menisküs yırtıkları yaygın olarak kıkırdak hasarı ve erken osteoartritik değişikliklerle birlikte görülür.

Tek MR çekiminden ligament, menisküs, kıkırdak ve kemiği eş zamanlı değerlendiren çok görevli modeller diz yapay zekasının doğal evrimini temsil eder. Bu modeller radyoloğun yaklaşımını yansıtır — tüm eklemi izole yapılar yerine bir bütün olarak değerlendirir — ve her patoloji için ayrı modeller çalıştırmaktan hesaplama açısından daha verimlidir.

MRNet veri seti ÖÇB yırtıkları, menisküs yırtıkları ve genel anormallikler için etiketler içermekte olup çok görevli öğrenme araştırması için doğal bir platform oluşturmaktadır. Yayınlanmış çok görevli modeller, yapılar arası ortak öğrenmenin tek görevli modellere kıyasla her bir bireysel görev için performansı artırdığını göstermiştir.

Kemik Segmentasyonu ile Entegrasyon

Menisküs değerlendirmesi izole olarak var olmaz. Yumuşak doku değerlendirmesini (menisküs, kıkırdak, ligamentler) kemik segmentasyonu ve geometrik analiz ile birleştirmek kapsamlı bir eklem değerlendirme platformu oluşturur.

Örneğin, varus mekanik aks dizilimi (otomatik geometrik analizden ölçülen) ile birlikte medial menisküs yırtığı, nötral dizilimli bir dizdeki aynı yırtıktan farklı bir prognoz taşır — ve farklı tedavi gerektirebilir. Bu değerlendirmeleri birleşik bir platformda entegre etmek daha nüanslı klinik karar vermeyi destekler.

Klinisyenler Ne Bilmeli?

Yapay zeka menisküs yırtıkları için bir tarama aracıdır, tanısal ikame değil. Havuzlanmış %87 duyarlılık ve %89 özgüllük tarama için yararlı ancak tek başına tanı için yetersizdir.

Tespit lokalizasyonun önünde. Yapay zeka menisküs yırtığının var olduğunu güvenilir şekilde söyleyebilir. Tam olarak nerede olduğunu ve ne tip olduğunu söylemekte daha az güvenilirdir.

MR sekansı önemlidir. Çoğu yayınlanmış model spesifik sekanslarda (proton yoğunluklu, T2 ağırlıklı) eğitilmiştir. Performans modelin görmediği sekanslarda düşebilir.

Dejeneratif sinyal yanlış pozitiflerin ana kaynağıdır. Yaşlı hastalarda yapay zeka modelleri sıklıkla derece 2 intrasubstans sinyali yırtık olarak işaretler. Bu sınırlamayı anlamak gereksiz cerrahi sevkleri önler.

Çoklu yapı modelleri geliyor. ÖÇB, menisküs ve kıkırdak için ayrı araçlar yerine, tek MR'dan tüm diz eklemini değerlendiren entegre platformlar beklenmektedir — radyoloğun bütüncül yaklaşımını yansıtan.

Açıklanabilirlik menisküs değerlendirmesi için özellikle önemlidir. Yırtıklar morfolojik olarak çeşitli ve silik olabileceğinden, modelin MR'ın hangi bölgesine dikkat ettiğini görebilme yeteneği güven kalibrasyonu için kritiktir.

Salnus'un Konumu

Salnus'un MR analiz pipeline'ı (Motor 2) şu anda ÖÇB değerlendirmesine odaklanmakta olup menisküs yırtığı tespiti planlanan bir genişleme olarak yer almaktadır. ÖÇB model geliştirmesi için kullandığımız Stanford MRNet veri seti menisküs yırtığı etiketlerini içermekte olup çok görevli model geliştirme için doğal bir yol sunmaktadır.

Dört diz kemiğinde 0,964 Dice skoru elde eden kemik segmentasyon pipeline'ımız, kapsamlı eklem değerlendirmesi için gereken geometrik bağlamı sağlayarak yumuşak doku değerlendirmesini tamamlar. Kemik geometrisi, ligament bütünlüğü (ÖÇB, AÇB) ve menisküs durumunun kombinasyonu uzun vadeli vizyonu temsil eder: birleşik yapay zeka destekli diz değerlendirme platformu.

Menisküs yapay zeka değerlendirmesi veya çoklu yapı diz MR analizi ile ilgilenen klinisyen ve araştırmacılar için ekibimizle iletişime geçin →


Sorumluluk Reddi: Bu makale yalnızca eğitim ve araştırma amaçlıdır. Salnus araçları Yalnızca Araştırma Amaçlı Kullanım (RUO) statüsündedir ve onaylı tıbbi cihaz değildir. Menisküs patolojisine ilişkin klinik kararlar nitelikli ortopedi cerrahları tarafından kapsamlı klinik ve görüntüleme değerlendirmesine dayalı olarak alınmalıdır.

Kaynaklar:

  • Zhao Y, vd. AI applied to MRI reliably detects the presence, but not the location, of meniscus tears. Eur Radiol. 2025;35(5):2952-2953.
  • Giammanco PA, vd. Diagnostic Accuracy of AI for Detection of Meniscus Pathology on MRI. Cureus. 2025;17(9):e91832.
  • Güngör N, vd. High accuracy in meniscus tear detection using YOLOv8 and EfficientNetV2. KSSTA. 2025.
  • Bien N, vd. MRNet: Deep-learning-assisted diagnosis for knee MRI. PLoS Med. 2018;15(11):e1002699.
  • Tack A, vd. Multi-Task Deep Learning for Detection of Meniscal Tears. Frontiers Bioeng Biotechnol. 2021;9:747217.
  • Mohammadi S, vd. Diagnosis of knee meniscal injuries using AI: systematic review and meta-analysis. PLoS One. 2025;20(6):e0326339.

Reviewed by the Salnus biomedical engineering team.

← All Posts

Orthopaedic AI Research Updates

Monthly research digest, product updates, and clinical AI insights.

Unsubscribe anytime.