Günümüzde sosyal ağlardan biyoinformatiğe kadar her şey devasa bir veri ağı (graf) olarak temsil ediliyor. Ancak bu ağların içindeki "klik" adı verilen, her noktanın birbirine bağlı olduğu tam yapılı desenleri saymak, veri büyüdükçe matematiksel bir kabusa dönüşüyordu. İzmir Yüksek Teknoloji Enstitüsü’nde tamamlanan yeni bir doktora tezi, bu "kombinatoryel patlamayı" durduracak devrim niteliğinde bir çözüm sundu.
Veri Madenciliğinde Matematiksel Devrim: BDAC
Dr. Büşra Çalmaz tarafından geliştirilen BDAC (Boundary-Driven Approximations of K-Cliques) algoritması, klasik ekstremal çizge teoremlerini kullanarak modern veri biliminin en büyük engellerinden birini aşıyor. Mevcut yöntemler, aranılan desen boyutu (k değeri) arttıkça kilitlenirken, BDAC bu karmaşıklıktan etkilenmeden çalışabiliyor.
"İmkansız" Denilen Hesaplamalar Artık Mümkün
Bilim dünyasında k-klik sayımları, k değeri 10’u geçtiğinde genellikle hesaplanamaz kabul ediliyordu. Çalmaz’ın çalışması, bu sınırı yerle bir ederek k=50 gibi devasa değerlerde bile hem yerel hem de küresel düzeyde alt ve üst sınırlar sunmayı başardı. Bu, daha önce "hesaplama açısından ulaşılamaz" olarak nitelendirilen devasa ve yoğun ağların artık analiz edilebileceği anlamına geliyor.
Proteinden Sosyal Medyaya: Her Alanda Yeni Bir Ufuk
Bu algoritma sadece teorik bir başarı değil; gerçek dünya problemlerinde de kilit rol oynayacak:
- Biyoinformatik: Protein etkileşim ağlarının yapısını çözerek hastalıkların teşhisinde yeni yollar açabilir.
-
Güvenlik: İnternet üzerindeki spam saldırılarını ve topluluk yapılarını çok daha hızlı tespit edebilir.
- Sosyal Ağlar: Milyarlarca kullanıcılı platformlarda karmaşık topluluk modellerini saniyeler içinde analiz edebilir.
Geleceğin Veri Analiz Standartı
Paralelleştirme teknikleriyle performansı en üst düzeye çıkarılan BDAC, büyük veri analizinde doğruluğu ve hızı bir araya getiriyor. Bilim insanları artık verinin büyüklüğünden veya karmaşıklığından korkmadan, en derin yapısal prensipleri keşfedebilecekleri güçlü bir araca sahipler.
Kaynak: Çalmaz, B. (2024). Graphlet Mining in Big Data. Doktora Tezi, İzmir Yüksek Teknoloji Enstitüsü, Mühendislik ve Fen Bilimleri Enstitüsü. Tez No; 923153





