Basit öğe kaydını göster

dc.contributor.authorDoğuç, Özge
dc.contributor.authorAytaç, Ömer Berkay
dc.contributor.authorSilahtaroğlu, Gökhan
dc.date.accessioned2021-06-22T11:38:08Z
dc.date.available2021-06-22T11:38:08Z
dc.date.issued2020en_US
dc.identifier.citationDoğuç, Ö., Aytaç, Ö. B. ve Silahtaroğlu, G. (2020). Lemmatizer: Akıllı Türkçe kök bulma yöntemi. Turkish Studies - Information Technologies and Applied Sciences, 15(3), 289-299. https://dx.doi.org/10.47844/TurkishStudies.44220en_US
dc.identifier.issn2667-5633
dc.identifier.urihttps://dx.doi.org/10.47844/TurkishStudies.44220
dc.identifier.urihttps://hdl.handle.net/20.500.12511/7265
dc.description.abstractYakın zamanda Türkçe doğal dil işleme alanında çeşitli çalışmalar yapılmıştır. Bu çalışmalar, üretilen akıllı bir sistemin Türkçe soru cevaplama, yazıyı başka bir dile çevirme, yazıyı özetleme,e-postalara otomatik yanıt gönderme gibi kabiliyetlere sahip olmasını öngörmektedir. Bahsedilen kabiliyetlerin temelinde, Türkçe kelimelerin köklerinin doğru şekilde bulunması gereksinimi yatmaktadır. Literatürde çeşitli Türkçe kök bulma yöntemleri verilmiş olsa da, Türkçe kelimelerin kompleks yapılarından dolayı başarı oranları genelde düşük kalmıştır. Bu çalışmada, Türkçe’nin sondan eklemeli yapısı kullanılarak bir kök bulma sistemigeliştirilmiş (Lemmatizer) ve bu konuda daha önce yapılmış olan Zemberek ve Snowball yöntemleriyle karşılaştırması verilmiştir. Lemmatizer sistemi Python ile yazılmıştır ve Türkçe’de en sık kullanılan 130’dan fazla ekive TDK sözlüğünübaz almaktadır. Ayrıca Knime platformu kullanılarak istatistiksel analiz yapılmıştır. Bu çalışma için öncelikle Lemmatizer sistemi çok sayıda Türkçe makale ve kitapla eğitilmiş ve Lemmatizer sistemi dağarcığını sürekli geliştirmiştir. Aynı zamanda, Kalbur isimli Türkçe ek ve kök veritabanıkullanılarak alınan geri beslemeler sayesinde, doğruluk oranı sürekli artmıştır.Lemmatizer sistemisonuçları hem sayı hem doğruluk açısından daha önce yapılmış olan Zemberek ve Snowball yöntemleriyle karşılaştırılmıştır. Karşılaştırmada farklı uzunluklarda Türkçe metinler kullanılmıştır. Lemmatizer yönteminin TDK sözlüğü kullanarak öğrenebilme özelliği sayesinde, Snowball ve Zembere yöntemlerine yakın sonuçlar verdiği ve kullanılan her yeni metinle başarı oranının diğer yöntemlere göre arttığı gösterilmiştir.en_US
dc.description.abstractRecently, various studies have been conducted in the field of Turkish natural language processing. These studies require a smart system that has the capability of answering Turkish questions, translating articles into another language, summarizing the articles, and sending automatic replies to e-mails. The need to find the correct roots of Turkish words is the basis of the aforementioned capabilities. Although various methods of finding Turkish roots have been given in the literature, success rates are generally low due to the complex structures of Turkish words. In this study, a root finding system (Lemmatizer) has been developed using the agglutinating structure ofTurkish words and its comparison with the Zemberek and Snowball methodsis given. The Lemmatizer system is written in Python and is based on more than 130 most frequently used suffixes and TDK dictionaries in Turkish. In addition, statistical analysis was performed using the Knime platform. For this study, firstly the Lemmatizer system was trained with many Turkish articles and books and ithas continuously improved its repertoire. At the same time, thanks to the feedback received using the Turkish suffix and root database called Kalbur, the accuracy rate has increased continuously. The results ofthe Lemmatizer system were compared with the Zemberek and Snowball methods previously made in terms of both number and accuracy. Turkish texts of different lengths were used for comparison. It has been shown that the Lemmatizer method gives results close to the Snowball and Zembere methods, and the success rate increases with each new text, thanks to its ability to learn using the TDK dictionary.en_US
dc.language.isoturen_US
dc.publisherInternational Balkan Universityen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectYapay Zekaen_US
dc.subjectDoğal Dil İşlemeen_US
dc.subjectTürkçe Kök Bulmaen_US
dc.subjectKendi Kendine Öğrenmeen_US
dc.subjectArtificial Intelligenceen_US
dc.subjectSd Anatural Language Processingen_US
dc.subjectTurkish Lemmatizationen_US
dc.subjectSelf Learningen_US
dc.titleLemmatizer: Akıllı Türkçe kök bulma yöntemien_US
dc.title.alternativeLemmatizer: Smart root finder for Turkish wordsen_US
dc.typearticleen_US
dc.relation.ispartofTurkish Studies - Information Technologies and Applied Sciencesen_US
dc.departmentİstanbul Medipol Üniversitesi, İşletme ve Yönetim Bilimleri Fakültesi, Yönetim Bilişim Sistemleri Bölümüen_US
dc.authorid0000-0002-5971-9218en_US
dc.authorid0000-0001-7220-2881en_US
dc.authorid0000-0001-8863-8348en_US
dc.identifier.volume15en_US
dc.identifier.issue3en_US
dc.identifier.startpage289en_US
dc.identifier.endpage299en_US
dc.relation.publicationcategoryMakale - Ulusal Hakemli Dergi - Kurum Öğretim Elemanıen_US
dc.identifier.doi10.47844/TurkishStudies.44220en_US


Bu öğenin dosyaları:

Thumbnail

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster