چارچوب یادگیری ماشین اجماعی برای طبقه‌بندی پایدار سنگ‌های آذرین با استفاده از داده‌های ژئوشیمیایی ترکیبی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 گروه مهندسی معدن، دانشکده مهندسی شهید نیکبخت، دانشگاه سیستان و بلوچستان، زاهدان، ایران

2 گروه مهندسی کامپیوتر، مهندسی برق و کامپیوتر، دانشگاه سیستان و بلوچستان، زاهدان، ایران

10.22034/anm.2026.23941.1709

چکیده

طبقه‌بندی سنگ‌های آذرین بر اساس ترکیب ژئوشیمیایی، یکی از چالش‌های اساسی در پترولوژی و اکتشافات معدنی است. نمودارهای کلاسیک ژئوشیمیایی اگرچه به‌عنوان ابزار استاندارد در تفکیک سنگ‌ها کاربرد گسترده دارند، اما در مواجهه با داده‌های چندعنصری، نویزدار و دارای هم‌پوشانی ترکیبی، چالش‌هایی در تفسیر دقیق ایجاد می‌کنند. این پژوهش با هدف تکمیل رویکردهای موجود و افزایش پایداری طبقه‌بندی، یک چارچوب اجماعی یادگیری ماشین ارائه می‌دهد که با ترکیب خروجی چهار الگوریتم خوشه‌بندی مستقل k-means)، سلسله‌مراتبی تجمیعی،DBSCAN و طیفی)، قابلیت تحلیل همزمان 22 مؤلفه ژئوشیمیایی شامل اکسیدهای اصلی و عناصر کمیاب را فراهم می‌سازد. مجموعه داده شامل 517 نمونه سنگ آذرین از پایگاه GEOROC است که پس از پیش‌پردازش با تبدیل CLR برای اکسیدهای اصلی و تبدیل log₁₊ برای عناصر کمیاب، به‌منظور حذف اثرات ترکیبی و ناهمگونی مقیاس‌ها آماده‌سازی شدند. تعداد بهینه خوشه‌ها (9k=) با بررسی شاخص‌های سیلوئت و دیویس-بولدین تعیین گردید و الگوریتم‌های خوشه‌بندی بر داده‌های نرمال‌شده اعمال شدند. ارزیابی کمی نشان داد که مدل اجماعی با استراتژی وزن‌دهی مبتنی بر تنوع‌افزایی، با کسب مقادیر بالاتر شاخص‌های ARI و NMI، عملکرد بهتری نسبت به الگوریتم‌های مستقل از جمله خوشه‌بندی طیفی داشت. خوشه‌های شناسایی‌شده الگوی ژئوشیمیایی متمایزی را از سنگ‌های مافیک تا فلسیک نشان دادند که با روندهای شناخته‌شده تفریق ماگمایی در سیستم‌های کالک‌آلکالن همخوانی دارد. نمایش داده‌ها در فضاهای کاهش‌بعدیافته UMAP و t-SNE، ثبات و تمایز ساختاری خوشه‌ها را تأیید کرد. این چارچوب داده‌محور می‌تواند به‌عنوان ابزاری مکمل برای شناسایی واحدهای سنگی، تفکیک زون‌های دگرسانی و تحلیل محیط‌های زمین‌ساختی در مطالعات اکتشافی مورد استفاده قرار گیرد.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

A Consensus-Based Machine Learning Framework for Robust Classification of Igneous Rocks Using Compositional Geochemical Data

نویسندگان [English]

  • Soheil Zaremotlagh 1
  • Asieh Ghanbarpour 2
1 Department of Mining Engineering. Faculty of Engineering. University of Sistan and Baluchestan. Zahedan. Iran
2 Dept. of Computer Engineering. Faculty of Electrical and Computer Engineering, University of Sistan and Baluchestan, Zahedan, Iran
چکیده [English]

The geochemical classification of igneous rocks represents a fundamental challenge in petrology and mineral exploration. Although classical geochemical diagrams serve as standard tools for rock discrimination, they encounter interpretive challenges when dealing with multi-element datasets characterized by noise and compositional overlap. This study presents a machine learning consensus framework designed to complement existing approaches and enhance classification robustness by integrating outputs from four independent clustering algorithms (K-Means, Agglomerative Hierarchical, DBSCAN, and Spectral), enabling simultaneous analysis of 22 geochemical components including major oxides and trace elements. The dataset comprises 517 igneous rock samples from the GEOROCK database, preprocessed using CLR transformation for major oxides and log₁₊ transformation for trace elements to eliminate compositional effects and scale heterogeneity. The optimal number of clusters (K=9) was determined through Silhouette and Davies-Bouldin indices, and clustering algorithms were applied to normalized data. Quantitative assessment demonstrated that the consensus model employing a diversity-based weighting strategy achieved superior performance with ARI of 0.3354 and NMI of 0.4975, outperforming individual algorithms including Spectral clustering (ARI of 0.3327). The weight distribution prioritized Spectral clustering (0.441) and Agglomerative clustering (0.286), reflecting their superior capability in capturing inherent geochemical structures, while DBSCAN received minimal weight (0.066) due to its density-focused approach. Identified clusters exhibited distinct geochemical patterns ranging from mafic to felsic compositions, consistent with recognized magmatic differentiation trends in calc-alkaline systems. Data visualization in UMAP and t-SNE reduced-dimensional spaces confirmed structural stability and distinction of clusters. This data-driven framework can serve as a complementary tool for lithological unit identification, alteration zone discrimination, and tectonic setting analysis in exploration studies.

کلیدواژه‌ها [English]

  • Igneous rock classification
  • High-dimensional data
  • Consensus clustering
  • Unsupervised machine learning
  • Compositional data
  • Spectral clustering
  • Geochemical exploration