CENTROID SINIFLAYICILAR YARDIMIYLA MEME KANSERİ TEŞHİSİ

HİDAYET TAKCI
1.562 316

Öz


Meme kanseri kadınlarda en sık görülen kanser türüdür. Artan meme kanseri vakaları nedeniyle meme kanserinde erken teşhis eskisinden daha önemli hale gelmiştir. Erken teşhis için yaşa bağlı birçok yöntem olmakla birlikte en yaygın yöntem mamografidir çünkü mamografi mikro seviyede teşhise imkân tanımaktadır. Bununla birlikte mamografik görüntüleri yorumlamada radyologların yaşadığı görüş ayrılıkları nedeniyle daha güvenilir sonuçlar veren bilgisayar destekli karar verme mekanizmalarına ihtiyaç vardır. Bu kapsamda destek vektör makineleri, yapay sinir ağları ve karar ağaçları gibi makine öğrenme yöntemleri kullanan bilgisayar destekli karar verme mekanizmaları bugüne kadar kullanılmıştır. Bu çalışmada, daha önce meme kanseri teşhisinde kullanılmamış olan üç farklı centroid sınıflayıcının kullanımı önerilmektedir. Bu tercihin en önemli nedeni centroid sınıflayıcıların yüksek performanslı sınıflayıcılar olmasıdır. Centroid sınıflayıcılar Wisconsin meme kanseri veri seti üzerinde test edilmiş olup en yüksek sınıflandırma doğruluğunu %99,04 ile Euclidian tabanlı centroid sınıflayıcı vermiştir. Centroid sınıflayıcılar kendi arasında karşılaştırıldıktan sonra diğer makine öğrenmesi yöntemleri ile de karşılaştırılmış ve sonuçlar raporlanmıştır. 


Anahtar kelimeler


Anahtar Kelimeler: Makine öğrenmesi, Sınıflandırma, Meme kanseri teşhisi, Centroid tabanlı sınıflayıcılar, Manhattan uzaklık ölçümü, Euclidian uzaklık ölçümü

Tam metin:

PDF


DOI: http://dx.doi.org/10.17341/gummfd.50403

Referanslar


Sariego, J. (2010). Breast cancer in the young patient. The American Surgeon: 76 (12): 1397–1401.

Florescu, A., Amir, E., Bouganim, N., Clemons, M. (2011). Immune therapy for breast cancer in 2010—hype or hope? Current Oncology: 18 (1): e9–e18.

Breast cancer. Wikipedia. Retrieved April 23, 2014 from http://en.wikipedia.org/wiki/Breast_cancer

Takci, H. and Güngör, T., (2012). A High Performance Centroid-based Classification Approach for Language Identification. Pattern Recognition Letters: Vol. 33 (16), p.2077-2084.

Bellaachia, A. and Erhan G. (2006). Predicting Breast Cancer Survivability using Data Mining Techniques. Ninth Workshop on Mining Scientific and Engineering Datasets in conjunction with the Sixth SIAM International Conference on Data Mining.

Pena-Reyes, C. A. and Sipper, M. A. (1999). Fuzzy-genetic approach to breast cancer diagnosis. Artificial Intelligence in Medicine; 17, 131–155. doi: 10.1016/S0933-3657(99)00019-6.

Setiono, R. (2010). Generating concise and accurate classification rules for breast cancer diagnosis. Artificial Intelligence in Medicine: 18(3), 205–217. doi:10.1016/ S0933-3657(99)00041-X.

Abonyi, J., and Szeifert, F. (2003). Supervised fuzzy clustering for the identification of fuzzy classifiers. Pattern Recognition Letters: 14(24), 2195–2207. doi:10.1016/ S0167-8655(03)00047-3.

Übeyli, E. D. (2007). Implementing automated diagnostic systems for breast cancer detection. Expert Systems with Applications: 33(4), 10541062. Doi: 10.1016/ j.eswa.2008.02.064.

Akay, M. F. (2009). Support vector machines combined with feature selection for breast cancer diagnosis. Expert Systems with Applications: 36(2), 3240–3247. doi:10.1016/j.eswa.2008.01.009.

Peng, L., Yang, B., and Jiang, J. (2009). A novel feature selection approach for biomedical data classification. J Biomed Inform: 179(1), 809–819. doi:10.1016/j.jbi.2009.07.008.

Kaya, Y. (2013). A new intelligent classifier for breast cancer diagnosis based on a rough set and extreme learning machine: RS + ELM. Turk J Elec Eng & Comp Sci; 21: 2079-2091. © TÜBİTAK, doi: 10.3906/elk-1203-119

Delen, D., Walker G. and Kadam A. (2005). Predicting breast cancer survivability: a comparison of three data mining methods, Artificial Intelligence in Medicine, vol. 34, pp. 113-127, June 2005.

Han, E. H. and Karypis, G. (2000). Centroid-based Document Classification: Analysis and Experimental Results. Principles of Data Mining and Knowledge Discovery, p.424-431.

Manhattan and Euclidian distance. Wikipedia. Retrieved May 5, 2014 from http://en.wikipedia.org/wiki/Minkowski_distance

Christobel, A. and Sivaprakasam, Y. (2011). An Empirical Comparison of Data Mining Classification Methods. International Journal of Computer Information Systems, Vol. 3, No. 2.

Vapnik, V.N. (1995). The Nature of Statistical Learning Theory, 1st ed., Springer-Verlag,New York, 1995

Shantakumar B. P. and Kumaraswamy Y.S. (2009). Intelligent and Effective Heart Attack Prediction System Using Data Mining and Artificial Neural Network; European Journal of Scientific Research, ISSN 1450-216X Vol. 31 No. 4.

Rakotomalala R. (2005). TANAGRA: a free software for research and academic purposes, in Proceedings of EGC'2005, RNTI-E-3, vol. 2, pp.697-702, 2005. (in French)

Newton, C. (2001). Machine Learning Techniques for Medical Analysis, Thesis for the degree of Bachelor of Engineering.

William, H., Wolberg, M.D., W. Nick Street, Dennis, M. Heisey, Olvi, L. Mangasarian. (1994). Computerized breast cancer diagnosis and prognosis from fine needle aspirates, Western Surgical Association meeting in Palm Desert, California, November 14.




Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 License.