TÜRKÇE İÇİN ARDIŞIK ŞARTLI RASTGELE ALANLARLA BAĞLILIK AYRIŞTIRMA

METİN BİLGİN, Mehmet Fatih AMASYALI
285 45

Öz


Sekans etiketleme bir giriş dizisine karşılık bir çıkış dizisinin üretimidir. Giriş ve çıkış dizisinin içeriklerine göre doğal dil işlemenin birçok konusu (varlık isim tanıma, makine çevirisi, morfolojik analiz, cümleleri öğelerine ayırma vb.) sekans etiketleme olarak tanımlanabilir.

Bağlılık ayrıştırması, bir cümle içerisindeki sözcükler arasındaki ilişkilerin ve ilişki türlerinin belirlenmesidir ve bir cümlenin anlamsal analizinin yapılabilmesi için şarttır. Bağlılık ayrıştırması sekans etiketleme problemi olarak tanımlandığında iki çıkış dizisinin (ilişki türü, ilişkili kelime) birden üretilmesi gerekmektedir.

Bizim önerimiz, özellikle Sekans etiketleme problemlerinin çözümünde sıklıkla kullanılan Şartlı Rastgele Alanların bağlılık ayrıştırması problemi içinde kullanılabilir olduğudur. Ancak Şartlı Rastgele Alanlar tek çıkış üreten bir yöntemdir. Bu zorluğu aşabilmek için iki çıkışlı (Bağlılık Türü ve Bağlanılan Kelime) bir problem olan Bağlılık Ayrıştırması iki parçaya bölünerek çözülmüştür. Ardından elde edilen sonuçlar birleştirilerek sistemin çıktısı olarak verilmiştir. Gerçekleştirilen bu çalışma ile Türkçe için en yüksek bağlılık ayrıştırması sonuçlarına ulaşılmıştır.


Anahtar kelimeler


Optimizasyon, Sekans Etiketleme, Bağlılık Ayrıştırması, Şartlı Rastgele Alanlar, Makine Öğrenmesi, Doğal Dil İşleme

Tam metin:

PDF


Referanslar


Tesnière, L., (1959). Introduction A la Syntaxe Structurale, Klincksieck, Paris.

Graham N., NLP Programming Tutorial-Dependency Parsing, http://www.phontron.com/slides/nlp-programming-en-11-depend.pdf, 25 Kasım 2013.

Bilgin,M.,(2015). Ardışık Şartlı Rastgele Alanlarla Sekans Etiketleme, Doktora Tezi, Yıldız Teknik Üniversitesi Fen Bilimleri Enstitüsü, İstanbul.

Buchholz, S. ve Marsi, E., (2006). "CoNLL-X Shared Task on Multilingual Dependency Parsing", Computational Natural Language Learning (CoNLL), 8-9 June 2006, New York.

Chen, W., Zhang, Y. ve Isahara, H., (2007). "A Two-Stage Parser for Multilingual Dependency Parsing", Computational Natural Language Learning (CoNLL), 28-30 June 2007, Prague.

Ambati, B.R., Samar,H., Sambhav,J., Sharma ,D.M. ve Sangal, R. , (2010). "Two Methods to Incorporate Local Morphosyntactic Features in Hindi Dependency Parsing", Statistical Parsing of Morphologically Rich Languages (SPMRL), 5 June 2010 , Los Angeles.

Cer, D., Marneffe, M.C., Jurafsky, D. ve Manning, C.D., (2010). "Parsing to Stanford Dependencies: Trade-offs Between Speed and Accuracy", Language Resources and Evaluation (LREC), 19-21 May 2010, Malta.

Eryiğit,G., İlbay,T. ve Can, O.A., (2011). "Multiword Expressions in Statistical Dependency Parsing", Statistical Parsing of Morphologically Rich Languages (SPMRL), 6 October 2011, Dublin.

Lafferty, J., McCallum, A. ve Pereira, F., (2001). "Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data", International Conference on Machine Learning (ICML), 28 June-1 July 2001, Massachusetts.

Kazkılınç,S., (2012). Türkçe Metinlerin Etiketlenmesi, Yüksek Lisans Tezi, İstanbul Teknik Üniversitesi Fen Bilimleri Enstitüsü, İstanbul.

Vapnik, V., (1995). The Nature of Statistical Learning Theory, Second Edition, Springer, New York.

Lu, W., Wang, W., Leung, A., Lo, S., Yuen, R., Xu, Z. ve Fan., H., (2002). "Air Pollutant Parameter Forecasting Using Support Vector Machines", International Joint Conference on Neural Networks (IJCNN), 12-17 May 2002, Honolulu.

Shen, J., Pei, Z. J. ve Lee, E. S., (2004). "Support Vector Regression in the Analysis of Soft-Pad Grinding of Wire-Sawn Silicon Wafers", Cybernetics and Information Technologies Systems and Applications (CITSA), 21-25 July 2004, Orlando.

Burbidge, R. ve Buxton, B., An Introduction to Support Vector Machines for Data Mining Technical Report, http://www.cs.ucl.ac.uk /staff/r.burbidge/pubs/ yor12-svm-intro.html, 18 Eylül 2014.

Kim, H., Pang, S., Je, H., Kim, D. ve Bang, S. Y., (2003). "Constructing Support Vector Machine Ensemble", Pattern Recognition, 36:2757–2767.

Goh, K. S., Chang, E. ve Cheng, K. T., (2001). "SVM Binary Classifier Ensembles for Image Classification", Information and Knowledge Management (CIKM), 5–10 November 2001, Atlanta.

Eryiğit,G., Adalı,E. ve Oflazer, K., (2008). "Türkçe'nin Olasılık Tabanlı Bağlılık Ayrıştırması", İTU Dergisi Mühendislik, 7(4):106117.




Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 License.