5 min read

Why Orthopaedic AI Needs Surgeon-Engineer Collaboration

Why pure-tech teams fail in medical AI and how surgeon-engineer collaboration from day one produces better orthopaedic AI models and outcomes.

Salnus Orthopedic Solutions
CollaborationMedical AIOrthopaedicsProduct DevelopmentClinical Validation

The Pattern That Fails

A recurring pattern in medical AI follows a predictable arc. An engineering team trains a deep learning model on a public dataset, achieves impressive accuracy metrics on a held-out test set, publishes a paper, and builds a product around the model. The product launches. Surgeons try it. Adoption stalls.

The model works on the benchmark but not in the clinic. The preprocessing pipeline does not handle the variety of radiographic techniques used across different hospitals. The output format does not match the clinical workflow. The measurement precision is insufficient for surgical planning. The model performs well on the dataset's distribution but poorly on the images that actually arrive from clinical practice.

This failure mode is not about engineering quality, it is about building in isolation from the clinical context where the product must eventually function.

What Surgeons Know That Engineers Do Not

An orthopaedic surgeon evaluating a knee radiograph does not simply classify the image into a category. They assess the image within a clinical context that includes patient symptoms, physical examination findings, prior imaging, comorbidities, activity level, and treatment goals.

This context shapes what "useful AI output" means. A KL grade without associated quantitative measurements (JSW, alignment angles) is insufficient for surgical planning. A classification without a confidence interval does not help with borderline cases. A model that works on AP views but fails on lateral views misses half the diagnostic information a surgeon uses.

Engineers building without clinical input will optimise for the wrong metric (overall accuracy instead of per-class recall), present results in the wrong format (probability distributions instead of clinical categories with measurements), and miss critical edge cases (post-surgical hardware, bilateral studies, paediatric anatomy).

What Engineers Know That Surgeons Do Not

The collaboration must flow in both directions. Surgeons typically underestimate the data requirements for robust model performance and overestimate the current capabilities of AI for complex clinical reasoning.

A surgeon might request "an AI that can plan my osteotomy", a task that requires 3D reconstruction, anatomical landmark detection, biomechanical simulation, and surgical path planning. This is feasible but represents years of development, not months. An engineer can help decompose this into achievable milestones: first automated alignment measurement, then correction angle calculation, then guide design integration.

Engineers also understand the data pipeline constraints that surgeons may not consider. Training a reliable model requires not just images but consistently annotated images, and inter-observer variability in KL grading means that "ground truth" labels are themselves noisy. Managing this label noise through consensus grading, weighted loss functions, or ordinal regression is an engineering challenge that directly affects clinical utility.

How Collaboration Changed Our Product

At Salnus, every major product decision has been shaped by direct surgeon input. Three examples illustrate the impact:

The DICOM viewer was initially designed with a radiology-centric layout (single large viewport, reading list sidebar). Surgeon feedback redirected the design toward a surgical planning layout (multiplanar 2x2 grid, measurement tools prominent, AI results integrated into the viewing panel rather than a separate report).

The AI model's output format was changed from a single predicted class to a structured clinical summary: KL grade plus confidence plus JSW measurement plus GradCAM visualisation, because surgeons told us that a grade without supporting evidence was not clinically actionable.

The PDF reporting system was redesigned three times based on surgeon feedback about what information belongs in a clinical report, how findings should be structured, and what language is appropriate for patient communication versus referral documentation.

None of these changes would have emerged from an engineering team working in isolation.

How to Structure the Partnership

For organisations considering surgeon-engineer collaboration for medical AI, several structural elements improve outcomes.

Establish clear intellectual property agreements before development begins. The surgeon contributes clinical expertise, dataset access, and validation capacity. The engineering team contributes software development, model training, and platform infrastructure. Both contributions have value, and the arrangement should reflect that, whether through co-authorship, revenue-sharing, or licensing.

Invest in regular, structured communication. A monthly "show-and-tell" where the engineering team demonstrates current progress to the clinical team, and the clinical team presents real cases that test the current system's limits, is more valuable than sporadic email exchanges.

Plan for clinical validation from the beginning. A model that achieves 85% accuracy in development but has no clinical validation pathway is commercially worthless. The validation study design (patient population, comparison standard, outcome measures, sample size) should be defined before model development begins, not after.

The Invitation

Salnus is actively seeking orthopaedic surgeon partners for the next phase of our AI development, expanding our OA screening model to hip OA, ACL injury assessment, and fracture detection. If you are a surgeon with access to clinical data and an interest in AI-assisted clinical tools, we would like to discuss collaboration. Visit our Surgeon Portal to see the current platform, or contact us directly.


Salnus Medikal Yazılım ve Cihaz Teknolojileri San. Tic. A.Ş., Bridging biomedical engineering and orthopaedic surgery through AI.

Başarısız Olan Kalıp

Tıbbi yapay zekada tekrarlayan bir kalıp öngörülebilir bir seyir izler. Bir mühendislik ekibi, kamuya açık bir veri seti üzerinde derin öğrenme modeli eğitir, ayrılmış test setinde etkileyici doğruluk metrikleri elde eder, bir makale yayımlar ve modelin etrafında bir ürün inşa eder. Ürün piyasaya sürülür. Cerrahlar dener. Benimseme durur.

Model kıyaslamada çalışır ancak klinikte çalışmaz. Ön işleme hattı, farklı hastanelerde kullanılan çeşitli radyografik teknikleri karşılayamaz. Çıktı formatı klinik iş akışıyla eşleşmez. Ölçüm hassasiyeti cerrahi planlama için yetersizdir. Model, veri setinin dağılımında iyi performans gösterir ancak klinik pratikte gerçekten gelen görüntülerde kötü performans gösterir.

Bu başarısızlık modu mühendislik kalitesiyle ilgili değildir, ürünün sonunda işlev görmesi gereken klinik bağlamdan izole şekilde inşa etmekle ilgilidir.

Cerrahların Bilip Mühendislerin Bilmediği

Bir diz radyografisini değerlendiren ortopedi cerrahı, görüntüyü basitçe bir kategoriye sınıflandırmaz. Görüntüyü; hasta semptomları, fizik muayene bulguları, önceki görüntüleme, komorbiditeler, aktivite düzeyi ve tedavi hedeflerini içeren klinik bir bağlam içinde değerlendirir.

Bu bağlam, "yararlı yapay zeka çıktısı"nın ne anlama geldiğini şekillendirir. İlişkili kantitatif ölçümler (JSW, dizilim açıları) olmadan bir KL-Grade cerrahi planlama için yetersizdir. Güven aralığı olmayan bir sınıflandırma sınır olgularda yardımcı olmaz. AP grafilerinde çalışıp lateral grafilerde başarısız olan bir model, cerrahın kullandığı tanısal bilginin yarısını kaçırır.

Klinik girdi olmadan inşa eden mühendisler yanlış metrik için optimize edecek (sınıf başına duyarlılık yerine genel doğruluk), sonuçları yanlış formatta sunacak (ölçümlerle birlikte klinik kategoriler yerine olasılık dağılımları) ve kritik uç durumları kaçıracaktır (cerrahi sonrası implantlar, bilateral çalışmalar, pediatrik anatomi).

Mühendislerin Bilip Cerrahların Bilmediği

İşbirliği her iki yönde de akmalıdır. Cerrahlar genellikle güçlü model performansı için gereken veri gereksinimlerini hafife alır ve yapay zekanın karmaşık klinik muhakeme için mevcut yeteneklerini abartar.

Bir cerrah "osteotomimi planlayabilen bir yapay zeka" isteyebilir, 3D rekonstrüksiyon, anatomik referans noktası tespiti, biyomekanik simülasyon ve cerrahi yol planlaması gerektiren bir görev. Bu uygulanabilirdir ancak aylar değil, yıllar süren bir geliştirme sürecini temsil eder. Bir mühendis bunu ulaşılabilir kilometre taşlarına ayırmaya yardımcı olabilir: önce otomatik dizilim ölçümü, sonra düzeltme açısı hesaplaması, ardından kılavuz tasarımı entegrasyonu.

Mühendisler ayrıca cerrahların göz önünde bulunduramayacağı veri hattı kısıtlamalarını da anlar. Güvenilir bir model eğitmek yalnızca görüntüler değil, tutarlı şekilde etiketlenmiş görüntüler gerektirir, ve KL derecelendirmesinde gözlemciler arası değişkenlik, "altın standart" etiketlerinin kendilerinin gürültülü olduğu anlamına gelir. Bu etiket gürültüsünü konsensüs derecelendirme, ağırlıklı kayıp fonksiyonları veya ordinal regresyon yoluyla yönetmek, klinik kullanışlılığı doğrudan etkileyen bir mühendislik zorluğudur.

İşbirliği Ürünümüzü Nasıl Değiştirdi

Salnus'ta her önemli ürün kararı doğrudan cerrah girdisiyle şekillendirilmiştir. Üç örnek etkiyi göstermektedir:

DICOM görüntüleyicisi başlangıçta radyoloji merkezli bir düzenle tasarlanmıştı (tek büyük görüntü alanı, okuma listesi kenar çubuğu). Cerrah geri bildirimi, tasarımı cerrahi planlama düzenine yönlendirdi (multiplanar 2x2 grid, ölçüm araçları belirgin, yapay zeka sonuçları ayrı bir rapor yerine görüntüleme paneline entegre).

Yapay zeka modelinin çıktı formatı, tek bir tahmin edilen sınıftan yapılandırılmış bir klinik özete değiştirildi: KL-Grade artı güven artı JSW ölçümü artı GradCAM görselleştirmesi, çünkü cerrahlar destekleyici kanıt olmadan bir derecenin klinik olarak eyleme dönüştürülebilir olmadığını belirtti.

PDF raporlama sistemi, cerrah geri bildirimlerine dayalı olarak üç kez yeniden tasarlandı, klinik raporda hangi bilgilerin yer alması gerektiği, bulguların nasıl yapılandırılması gerektiği ve hasta iletişimi ile sevk dokümantasyonu için hangi dilin uygun olduğu konularında.

Bu değişikliklerin hiçbiri izole çalışan bir mühendislik ekibinden ortaya çıkamazdı.

Ortaklığı Nasıl Yapılandırmalı

Tıbbi yapay zeka için cerrah-mühendis işbirliğini düşünen kuruluşlar için çeşitli yapısal unsurlar sonuçları iyileştirir.

Geliştirmeye başlamadan önce net fikri mülkiyet anlaşmaları oluşturun. Cerrah klinik uzmanlık, veri seti erişimi ve validasyon kapasitesi katkısında bulunur. Mühendislik ekibi yazılım geliştirme, model eğitimi ve platform altyapısı katkısında bulunur. Her iki katkının da değeri vardır ve düzenleme, ister ortak yazarlık, ister gelir paylaşımı, ister lisanslama yoluyla olsun, bunu yansıtmalıdır.

Düzenli, yapılandırılmış iletişime yatırım yapın. Mühendislik ekibinin mevcut ilerlemeyi klinik ekibe gösterdiği ve klinik ekibin mevcut sistemin sınırlarını test eden gerçek olguları sunduğu aylık bir "göster ve anlat" toplantısı, düzensiz e-posta alışverişlerinden çok daha değerlidir.

Klinik validasyonu en başından planlayın. Geliştirmede %85 doğruluk elde eden ancak klinik validasyon yolu olmayan bir model ticari olarak değersizdir. Validasyon çalışma tasarımı (hasta popülasyonu, karşılaştırma standardı, sonuç ölçütleri, örneklem büyüklüğü) model geliştirmeden sonra değil, önce tanımlanmalıdır.

Davet

Salnus, yapay zeka geliştirmemizin bir sonraki aşaması için aktif olarak ortopedi cerrahı ortaklar aramaktadır, OA tarama modelimizi kalça OA, ACL yaralanma değerlendirmesi ve kırık tespitine genişletmek. Klinik veriye erişimi olan ve yapay zeka destekli klinik araçlara ilgi duyan bir cerrahsanız, işbirliğini tartışmak isteriz. Mevcut platformu görmek için Cerrah Portalımızı ziyaret edin veya doğrudan bizimle iletişime geçin.


Salnus Medikal Yazılım ve Cihaz Teknolojileri San. Tic. A.Ş., Yapay zeka aracılığıyla biyomedikal mühendisliği ve ortopedi cerrahisini birleştiriyoruz.

Reviewed by the Salnus biomedical engineering team.

← All Posts

Orthopaedic AI Research Updates

Monthly research digest, product updates, and clinical AI insights.

Unsubscribe anytime.

Why Orthopaedic AI Needs Surgeon-Engineer Collaboration, Salnus Blog, Salnus