ماهیت ترکیبی داده های لیتوژئوشیمیایی و تاثیر آن بر تحلیل رگرسیونی عیار طلا: مطالعه موردی اندیس طلای قره چر، شمال غرب ایران

نوع مقاله: مقاله پژوهشی

نویسندگان

دانشکده مهندسی معدن و متالورژی، دانشگاه یزد

چکیده

تحلیل رگرسیونی به عنوان بخش مهمی از اکتشاف ذخایر طلا با داده­های ژئوشیمیایی با ماهیت ترکیبی سر و کار دارد. در داده­های ترکیبی، متغیرهای عیاری بخشی از کل بوده و اطلاعات مفید در آنها در قالب نسبت متغیرها وجود دارد. محدود بودن داده­ها در بازه صفر تا 100 درصد باعث ایجاد همبستگی تحمیلی و کوواریانس دروغین شده و این موضوع، تحلیل‌های آماری مرسوم را با اشتباه و عدم قطعیت همراه خواهد کرد. این موضوع برای داده‌های ژئوشیمیایی که مجموع آنها به 100 درصد نمی­رسد نیز ثابت شده است. در این پژوهش تحلیل رگرسیونی عیار طلا در یک رخداد معدنی طلا در شمال غربی ایران با دو رویکرد سنتی (رگرسیون غیرخطی چند متغیره داده‌های خام) و ترکیبی (رگرسیون غیرخطی چند متغیره بالانس‌های به دست آمده از تبدیل نسبت لگاریتمی ایزومتریک (ilr)) مورد توجه قرار گرفته است. هدف از این کار مقایسه توانایی دو رویکرد در برآورد دقیق عیار طلا است. ضریب همبستگی مقادیر واقعی و تخمینی برای رویکرد سنتی 74/0 و برای رویکرد ترکیبی 84/0 و نرخ طبقه­بندی صحیح (CCR) به عنوان مثال در عیار ppb40 به ترتیب 688/0 و 875/0 است. به علاوه، تابع توزیع مقادیر تخمینی با رویکرد ترکیبی بیش از رویکرد سنتی به تابع توزیع داده­های واقعی شبیه است. همچنین، رویکرد سنتی در یک نمونه، عیار طلا را کم‌تر از صفر تخمین زده است. این تناقض آشکار نشانه‌ای از نامناسب بودن روش‌های سنتی ریاضی برای کار با داده‌هایی با سیستم بسته است. به علاوه، رویکرد ترکیبی در برآورد چارک­های اول و سوم که مقادیر حیاتی‌تری در جدایش داده‌های آنومال هستند، تخمین­های دقیق­تری ارائه نموده است. مجموع این موارد دلالت بر این دارند که به منظور یک تحلیل آماری دقیق و قابل اعتماد، باید ماهیت ترکیبی داده­های ژئوشیمیایی مورد توجه واقع شده و داده­ها با روش نسبت لگاریتمی مناسب تحلیل شوند.

تازه های تحقیق

مطالعه و بررسی ماهیت ترکیبی داده­های لیتوژئوشیمیایی در مطالعات آماری ضروری است.

اگر ماهیت ترکیبی این داده ها نادیده گرفته شود، نتایج تحلیل­های آماری مستعد خطا و تناقض هستند.

نادیده گرفتن ماهیت ترکیبی داده­های ژئوشیمیایی در یک کانسار طلا منجر به براورد عیار منفی برای عنصر طلا شد که تناقضی آشکار است.

مطالعه آماری داده های ژئوشیمیایی با رویکرد ترکیبی با نتایج قابل قبول تر و دقیق تری نسبت به رویکرد سنتی همراه است.

در تحلیل رگرسیونی طلا، روش تبدیل لگاریتم ایزومتریک (ilr) بر سایر روش های تحلیل داده های ترکیبی ارجحیت دارد.

رویکرد ترکیبی در برآورد چارک های اول و سوم بهتر از روش های سنتی عمل می کند. این چارک ها از نظر اکتشافی اهمیت بالایی دارند.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Compositional nature of lithogeochemical data and its impact on gold grade regression analysis: A case study in Qareh Char gold occurrence, NW Iran

نویسندگان [English]

  • Hossein Molayemat
  • Farhad Mohammad Torab
  • Amir Hosein Kouhsary
Dept. of Mining and Metallurgy, Yazd University
چکیده [English]

Summary
When a geochemical sample is analyzed, grades are reported as strictly positive and constrained values, which are a form of compositional data (CoDa). It is proven that spurious correlations of closed data can affect the conventional statistical analysis such as regression modeling. The problem is that one cannot say how much of the uncertainty of the model is due to spurious covariance and correlations. Thus, it is wiser to choose the safe side and consider the compositional nature of the data using proper logratio approach. In this study, we assessed the regression analysis of gold grade in a gold occurrence located in the NW Iran. Compositional and noncompositional approaches were followed and the consequent results were compared to understand the impact of neglecting the compositional nature of data on gold grade regression analysis. Isometric logratio (ilr) balances were calculated and used to perform the compositional approach.
Comparison of the two approaches was carried out based on Correct Classification Rate (CCR) of the estimated values and the correlation coefficient of the estimated and real gold grades (R2). Additionally, the resemblance between the distribution of the estimated and real data were compared. R2 values for compositional and noncompositional approaches are 0.84 and 0.74 respectively, and CCR values at 40 ppb cut-off are 0.875 and 0.688 for the same set. On the other side, the distribution of estimated grades by compositional approach is closer to the real gold grades. It is notable that the noncompositional approach has estimated a negative grade, which is an evident inconsistency. Although the noncompositional approach is returning the exact value of the average, the compositional approach is more accurate at the first and the third quartiles, which are more critical.
All above-mentioned results approve that CoDa analysis of lithogeochemical data is essential. It is concluded that neglecting the compositional nature of data will compromise the reliability of the regression models. Thus, to stay away from the falsification, it is highly recommended to perform the proper logratio approach in multivariate statistical studies of geochemical data.
 
Introduction
Almost all geochemical data are reported as constrained and strictly positive grades and concentrations. They count as a form of compositional data. Statistical analysis of such data, in the raw form, is exposed to inconsistency and can result unrealistic models. Logratio approach is an adequate way to treat the problem.
 
Methodology and Approaches
Multivariate regression analysis of the raw and logratio transformed data was performed and the results were compared. Isometric logratio (ilr) transform was executed to calculate unconstrained balances for the compositional approach.
 
Results and Conclusions
The compositional approach outperforms the noncompositional approach in terms of Correct Classification Rate (CCR) and R2 (correlation coefficient of estimated and real data). In addition, the noncompositional approach inconsistently estimated a negative grade and is less accurate in the first and the third quartiles of the population. It is concluded that the compositional data analysis is essential when we are working with multivariate geochemical data.

کلیدواژه‌ها [English]

  • Compositional data (CoDa)
  • Isometric logratio transform (ilr)
  • Multivariate regression analysis
  • Mahalanobis distance
  • Gold
  • Qareh Char
[1]           Buccianti, A., Mateu-Figueras, G., Pawlowsky-Glahn, V. (2006). Compositional Data Analysis in the Geosciences: from Theory to Practice. The Geological Society of London, 212 pp.

[2]           Pawlowsky-Glahn, V., Egozcue, J. J., Lovell, D. (2015). Tools for compositional data with a total. Stat. Modelling, 15, 175–190.

[3]           Pawlowsky-Glahn, V., Egozcue, J. J., Olea, R. A., Pardo-Igúzquiza, E. (2015). Cokriging of compositional balances including a dimension reduction and retrieval of original units. Journal of South African Institution of Mining and Metallurgy, 115.

[4]           Aitchison J. (1984). The statistical analysis of geochemical compositions. Mathematical Geology, 16 (6), 531-564.

[5]           Reimann, C., Filzmoser, P., Garrett, R., Dutter, G. (2008). Statistical Data Analysis Explained: Applied Environmental Statistics with R. 362 pp.

[6]           Pawlowsky-Glahn, V., Egozcue, J. J. (2006). Compositional data and their analysis: an introduction. Geological Society, London, Special Publications, 264; 1-10.

[7]           Chayes F. (1960). On correlation between variables of constant sum. Journal of Geophysical Research, 65 (12), 4185-4193.

[8]           Chayes F. (1983). Detecting nonrandom associations between proportions by tests of remaining space variables.  Mathematical Geology, 15 (1), 197- 206.

[9]           Chayes F. (1971). Ratio Correlation. University of Chicago Press, Chicago, IL, 99 pp.

[10]         Butler, J. C. (1976). Principal components analysis using the hypothetical closed array. Mathematical Geology, 8, 25–36.

[11]         Darroch, J.N. (1969). Null correlations for proportions. Mathematical Geology, 1, 221–227.

[12]         Pawlowsky-Glahn, V. (1984). On spurious spatial covariance between variables of constant sum. Sci. Terre Sér. Inform, 21, 107–113.

[13]         Carranza J. (2006). Analysis and mapping of stream sediment geochemical anomalies: should we logratio transform the data?, University of Twente.

[14]         Pawlowsky-Glahn, V., Olea, R. A., Davis, J.C. (1995). Estimation of regionalized compositions: a comparison of three methods. Math. Geol, 27 (1).

[15]         Pawlowsky-Glahn, V., Olea, R. A. (2004). Geostatistical analysis of compositional data. In: Number 7 in Studies in Mathematical Geology. University Press, Oxford.

[16]         Aitchison J. (1986). The statistical analysis of compositional data. Monographs on Statistics and Applied Probability. Chapman & Hall Ltd, London. Reprinted, with additional material by The Blackburn Press, Caldwell, NJ.

[17]         Egozcue J. J., Pawlowsky-Glahn, V., Ateufigueras, G., Barcelo-Vidal, C. (2003). Isometric logratio transformations for compositional data analysis. Mathematical Geology, 35 (3), 279-300.

[18]         Molayemat, H., Torab, F. M., Pawlowsky-Glahn, V., Hossein Morshedy, A., Egozcue, J. J. (2018). The impact of the compositional nature of data on coal reserve evaluation, a case study in Parvadeh IV coal deposit, Central Iran. International Journal of Coal Geology, 188, 94-111.

[19]         Govvet, G. J. S. (1983). Rock Geochemistry in Exploration. Elsevier Scientific Publications Co. 461­pp.

[20]         Kouhestani, H., Ghaderi, M., Chang, Z., Zaw, K. (2015). Constraint on the ore fluids in the Chah Zard breccia-hosted epithermal Au-Ag deposit, Iran: fluid inclusion and stable isotope studies. Ore Geology Reviews, 65, 512-521.

[21]         Kouhestani, H., Rastad, E., Rashidnezhad Omran, N., Mohjel, M. (2013). Controlling settings, genesis and forming model of Chah-bagh gold deposit, Muteh mine ditrict. Geoscience Journal of Geology Survey of Iran, Vol. 88.3. (in Persian).

[22]         Niroumand, S., Moor, F., Mohjel M., Emami, M. H., Mehrparto, M., Borna, B. (2013). Kharapeh gold deposit: an example of epi-zonal gold occurrence, NE of Piranshahr, Western Azarbayjan province, NW Iran. Geoscience Journal of Geology Survey of Iran, Vol. 88.3. (in Persian).

[23]         Ghavami Riabi, R., Shahsavani, D. (2012). Application of the MARS modeling to estimate the gold values based on the paragenetic elements for an exploration data set. Iranian Journal of Mining Engineering, 7(15), 15-23. (in Persian).

[24]         Hariri, A. (2003). Geological report of 1:100,000 geological map of Saqez. Geological Survey of Iran. (in Persian).

[25]         Novin Ekteshaf Tose’e consulting engineers, (2008). Exploration and prospecting of gold in the Qareh Char area, 62 pages.

[26]         Hosseini, S. A., Eftekhari Mahabadi, S., Asghari, O. (2015). The Comparison of Appropriate Methods in imputation of the censored values in the geochemical datasets. Journal of Analytical and Numerical Methods in Mining Engineering 5(9), 63-72 (in Persian).

[27]         Moeini, H., Torab, F. M. (2017). Comparing compositional multivariate outliers with autoencoder networks in anomaly detection at Hamich exploration area, east of Iran. Journal of Geochemical Explorations, 180, 15–23.

[28]         Takezawa, K. (2006). Introduction to nonparametric regression. John Wiley and sons, Inc., publications, 546 pages.