Osmanlı arşiv ve kaynaklarına yapay zeka takviyeli tahlil geliştirildi

Sosyal bilimlerde en büyük sorunlardan biri olan Osmanlı arşiv ve kaynaklarının günümüz Türkçesine aktarılmasına ülkemiz akademisyenlerinden yapay zeka takviyeli tahlil geliyor. İstanbul Üniversitesi-Cerrahpaşa doktora öğrencisi İshak Dölek’in danışmanıyla birlikte geliştirdiği proje, TÜBİTAK 1512 destekleme programına kabul edildi. KOSGEB’ten de dayanak alan proje, tamamlanan OCR uygulamasıyla birlikte teşebbüse dönüştürüldü.

Ülkemiz akademisyenleri Osmanlıca kaynakları yapay zeka ile günümüz Türkçesine aktarıyor. İstanbul Üniversitesi-Cerrahpaşa Bilgisayar Mühendisliği Bölümü’nden Doç. Dr. Atakan KURT’un danışmanlığında Dr. İshak DÖLEK tarafından bir doktora tezi projesi olarak başlayan yerli teşebbüs Osmanlica.com Osmanlıca kaynakların günümüz Türkçesine transferinin birinci adımı olan Osmanlıca OCR sürecinde yüzde 96’lık bir muvaffakiyet elde etti.

Osmanlıca-Türkçe Transferi 3 adımda çözüyorlar: 1- OCR 2- Alfabe Çevirisi 3- Lisan Çevirisi

Osmanlı arşiv ve kütüphanelerindeki her türlü kaynağı Osmanlıca OCR, Osmanlıca-Türkçe Alfabe Çevirisi ve Osmanlıca-Türkçe Lisan Çevirisi olmak üzere üç adımda günümüz Türkçesine aktarmak maksadıyla bir doktora tezi olarak başlayan “Osmanlica.com: Yapay Zeka Takviyeli Osmanlıca-Türkçe Uçtan-Uca Aktarım” projesi, sonrasında Avcılar Yerleşkesindeki Entertech Teknokent A.Ş. aracılığı ile TÜBİTAK 1512 teşebbüs destekleme programına kabul edildi. Teşebbüsçüler Mina ARGE Bilişim Ltd. Şti. ismi altında şirketleşerek projenin birinci adımı olan OCR projesini geliştirdiler. OCR projesini muvaffakiyetle tamamlayan Mina ARGE, hala bu projenin devam niteliğindeki Osmanlıca-Türkçe Alfabe Çevirisi projesini KOSGEB ve TÜBİTAK’tan aldığı dayanakla geliştiriyor. Alfabe çevirisi projesinde halihazırda %75 doğruluk oranına erişen şirket, bu uygulamada %95’lik bir doğruluk oranı elde etmek için ARGE faaliyetlerine bilgisayar, lisan, edebiyat ve tarihçilerden oluşan bir küme ile devam ediyo

Osmanlıca OCR’da %96 oranında muvaffakiyet elde edildi

Osmanlıca dokümanların günümüz Türkçesine transferinin birinci adımı olan Osmanlıca OCR sürecinde %96 doğruluk oranına ulaştıklarını belirten Doç. Dr. Atakan KURT şu açıklamalarda bulundu: “Yurt içi ve dışındaki devlet arşivleri, kütüphane ve özel koleksiyonlarda yüzbinlerce Osmanlıca kitap, gazete, mecmua ve evrak bulunuyor. Bu kadar evrakın insan eliyle manuel olarak Türkçeye çevirilmesi pratik olarak mümkün değil. Bilgi teknolojilerinde ve yapay zekada son vakitlerde büyük ilerlemeler oldu. Bu sayede daha evvel çözülmesi mümkün olmayan sorunlar yeni gelişmeler ışığında çözülebiliyor. Biz bu yeni teknolojileri Osmanlı arşiv ve kütüphanelerindeki evrakların günümüz Türkçesine aktarılması için adapte ediyoruz. OCR ve alfabe çevirisi basamaklarında gözle görülür değerli muvaffakiyetler elde ettik. Batı ülkelerinde büyük oranda çözülmüş olan bu sorun ülkemizde şimdi çözülemedi. Maksadımız Osmanlıca kitap, mecmua, gazete ve arşiv dokümanlarının günümüz Türkçesine çevirilerek sıradan beşerler ve bilhassa yeni kuşak tarafından okunabilmesi ve anlaşılabilmesini sağlamak; ve şimdiye kadar tahminen de hiç incelenmemiş yahut okunmamış dokümanları gün yüzüne çıkararak tarihe ışık tutulması için gerekli yazılımları geliştirmektir. Bize nazaran bu proje Türkiyenin toplumsal bilimlerde vizyon projesi olmaya aday bir projedir. Bu proje ile yüzbinlerce kitap, mecmua, gazete ve milyonlarca arşiv evrakı günümüz Türkçesine süratli bir formda aktarılabilecektir.”

Osmanlıca-Türkçe alfabe çevirisinde %75 doğruluk oranına eriştiler

Osmanlıca evrakların günümüz Türkçesine çevrilmesi için birden fazla çalışma yürüttüklerini söyleyen Dr. İshak DÖLEK ise, “Osmanlıca OCR sürecinin yanı sıra Osmanlıca-Türkçe alfabe çevirisi, Osmanlıcadan günümüz Türkçesine lisan çevirisi, rika OCR yani Osmanlıca el yazısının OCR ile fotoğraftan metine dönüştürülmesi üzere başka projelerde de çalışmaların devam ettiğini” söyledi. “Örneğin Arapça tabanlı Osmanlı alfabesindeki Osmanlıca bir metni Latin tabanlı Türk alfabesine dönüştüren alfabe çevirisinde %75’lik bir doğruluk oranına eriştik. Alfabe çevirisi uygulamamız hala Internette hizmet veren tek uygulamadır” dedi.

Alfabe çevirisini 3 bin söz ve 23 bin harften oluşan data kümesiyle test ettiler

Dr. İshak DÖLEK açıklamasının devamında: “Osmanlıca nesih sınırında yazılmış 21 sayfa 3 bin söz ve 23 bin harften oluşan yepyeni bir Osmanlıca bilgi seti ile test edilen OCR uygulamasında yüzde 96 muvaffakiyet elde ettik. Yani her 100 adet harfin 96 tanesi uygulama tarafından hakikat olarak tanındı ki bu şimdiye kadar elde edilmiş en yüksek doğruluk oranı oldu. Bu testlerde uygulamamızı dördü yurt dışından birisi yurt içinden olmak üzere beş farklı OCR uygulamasıyla karşılaştırdık ve sonuçları memleketler arası bir konferansta bildiri ve mecmuada makale formunda yayınladık. Ar-Ge faaliyetlerine devam ettiğimiz uygulamamızın toplumsal bilimlerde yapacağı katkıdan ötürü memnunuz. Şu ana kadar Osmanlica.com adresindeki OCR uygulamamızı 20 binden fazla, alfabe çevirisi uygulamamızı da 100 binden fazla kullanıcı denedi. Bu sayılar her gün artmaya devam ediyor. Bu durum bizi daha da motive ediyor” tabirlerini kullandı.

Bunlar da hoşunuza gidebilir...

Popüler Yazılar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir