14 Ocak 2015 Çarşamba

Elektronik Sözlük Oluşturma ve Düzenleme (Babylon, Stardict, Kindle ve diğer formatlar)

Değerli dostlar,

Bilgisayar ve teknoloji, hayatımıza her gün biraz daha giriyor. Bunun yararları, zararları bir tarafa; dil öğrenme konusunda belli oranda kolaylık getirdiği bir gerçek. Bu kolaylık ise, belli bir ölçüde elektronik ve dijital sözlüklerin hayatımıza girmesi sayesinde gerçekleşiyor. Tamam; kitaba dokunmak, sayfalarını karıştırmak, aradığın kelimeyi maddeler arasında aramak bulmak belki güzel bir duygu ama çağımız hız ve kolaylık çağı. Bundan dolayı sözlük kullanımı da artık dijital ortama taşınıyor.

Dijital sözlük uygulamalarının en gelişmiş olanı, bir pc programı olan Babylon Sözlük. Sözlükten ziyade ev gibi düşünülmüş olan bu uygulamanın hem kendi gelişmiş büyük sözlükleri var, hem de insanların kendi ürettiği sözlükleri kendi sistemine dahil ederek, (bildiğim kadarıyla) dünyanın en büyük sözlük veritabanı oluşturulmuş. Bu uygulamayı diğerlerinden ayıran en büyük özelliği ise, bir kelimeye tıklandığında, eğer o kelime bir kelime grubunda yer alıyorsa, o kelime grubunu tespit edip anlamlarını vermesi.

Bir diğer pratik sözlük uygulaması da Goldendict adlı uygulamadır. Babylon'un sözlüklerini de çalıştırabilen bu uygulama, diğer birçok sözlük sistemlerinin (Stardict vs) sözlüklerini de çalıştırmakta, fare ile üzerine gelinen kelimenin anlamını vermektedir.

Bir diğer elektronik sözlük türü de, e-kitap okuyucular (Kindle vb) için hazırlanmış olan sözlükler. Bunlar ise sadece o kitap okuyucularda çalışan sözlükler.

Bunların dışında, mesela İngilizce-Türkçe olarak hazırlanmış, bir kelimenin anlamına bakmak için o programı açıp, kelimeyi elle yazıp taratılan sözlükler var ki, bunlar pek de pratik değiller.

Babylon ve Kindle için ayrı ayrı (Dijital ortamdaki 3 sözlüğü birleştirerek) hazırladığım elektronik sözlük, dijital sözlüklere bir örnek: http://ahmet-baltaci.blogspot.com.tr/2015/01/en-buyuk-ucretsiz-franszca-turkce.html



Biz bu yazıda, var olan elektronik sözlükleri düzenlemeyi ve oluşturmayı (programlama bilgisine gerek olmadan, kolayca) öğreneceğiz. İlk olarak bize gerekli olan programları indirelim:

Python: https://www.python.org/download/releases/2.7/ (Buradan bilgisayarımıza göre olan formatı indirip kuruyoruz)
Pyglossary: https://drive.google.com/file/d/0B_FSPjps30K-RDF0bFRFTk9KS3c/view?usp=sharing (Pyglossary, bu dosyanın içindeki klasörü C'ye sürüklüyoruz)
Babylon Glossary Builder: http://www.babylon.com/products/glossary-builder.html (Babylon sözlüğü hazırlayacaksak)
Notepad++: http://notepad-plus-plus.org/ (Bildiğimiz microsoft notepad uygulaması değil)

Peşinen not: Düzenlemek istediğiniz sözlüklerin telif hakkı olabilir. Aman diyim.

Öncelikle yapacağımız şey, sözlüğümüzü iki sütunlu metin dosyası (Babylon için Excel dosyası, Stardict için txt) haline getirmektir (Zaten elimizde varsa bunu kullanabiliriz). (Eğer sözlüğümüzün bir kelimenin farklı yazılışları ve türevlerini de içermesini istiyorsak, kelimenin türevlerini içeren üçüncü sütunu da ekleyebiliriz. Şu kadarı var ki bu [bildiğim kadarıyla] sadece Babylon için geçerli ve benim pek de önermediğim bir yol. Onun yerine, farklı türevleri de madde başı haline getirip, maddelerin içine hangi kelimenin türevi olduğunu yazmak daha kullanışlı bir metod. Bundan dolayı biz yöntemimizi anlatırken iki sütunlu metinler üzerinden gideceğiz):

Python'u kurduktan ve Pyglossary klasörünü C'ye kopyaladıktan sonra, düzenlemek istediğimiz sözlük dosyasını (formatı farketmiyor) Pyglossary klasörünün içine (dosya adını türkçe karakterlerden arındırarak) kopyalıyoruz. Sonra pyglossary.bat dosyasını açıyoruz. Üstte "Read from format" yazan yerin sağındaki "Browse"a tıklıyoruz. Program klasörünün içine kopyaladığımız dosyayı ve "Read from format"tan, düzenlemek istediğimiz sözlük formatını seçiyoruz (genelde otomatik seçiyor ama siz yine de kontrol edin). Ardından Load'a tıklıyoruz. Sonra, "Write to Format"tan, çıktı formatını (eğer düzenlemeden çevireceksek direkt almak istediğimiz sözlük formatını, yoksa) "Tabfile (txt, dic)" seçip "Convert"e tıklıyoruz. Çıktı dosyası yine Pyglossary klasörünün içinde olacaktır.

Bu işlem, bize sözlük dosyasını, düzenlenebilir iki sütunlu metin halinde verecektir. Biz sonra bu metni Excel'e yapıştırıp istediğimiz gibi düzenleyip geri tekrar bir txt dosyasına yapıştırabiliriz.

Eğer düzenlemek istediğimiz sözlüğün içinde html kodları varsa ve çıktı formatımız (Kindle mobi gibi) html kodlarını kabul etmiyorsa, dosyamızı bu kodlardan kurtarmamız gerekir (yoksa sözlüğümüzde <font color="#007000"> gibi ifadeler çıkar). Bu da şu yöntemle yapılır:

Dosyamızı Notepad++ ile açıyoruz. Ara>Değiştir'i açıyoruz, Düzenli İfade'yi seçiyoruz:
"Aranan" kısmına:  [<].*?> yazıp, "Değiştir" kutusunu boş bırakıp "Tümünü değiştir" diyip kaydediyoruz.

Dosyamızda gerekli düzenlemeleri yaptıktan sonra;

Kindle http://ahmet-baltaci.blogspot.com/2015/01/kindle-icin-sozluk-yapmak.html


Stardict (ifo) ve Babylon (bgl) formatları html kodlarını tanıdığı için, kod temizleme işini yapmamıza gerek yok. (Babylon'un sözlük dosyaları http://www.babylon.com/free-dictionaries/ adresinden, Stardict sözlük dosyaları ise Google'da yüzlerce siteden bulunabilir.) Dosyamızı Pyglossary'de "Tabfile (txt, dic)" komutuyla txt dosyası haline getirdikten sonra excel'e kopyalayıp, gerekli düzenlemeleri yapıp geri bir txt dosyasına kaydediyoruz. (Utf-8 kodlamasıyla kaydedilmeli. Bu ise şöyle yapılır: Dosya Not Defteri programında açılır. Dosya>Farklı kaydet> yaptıktan sonra dosya kodlama UTF-8 olarak seçilir ve kaydedilir.)


Babylon

Hazırladığımız txt dosyasının içeriği, bir excel dosyasına yapıştırılır ve kaydedilir. Babylon Glossary Builder açılır, Next> tıklanır. Bu sayfada bizce önemli olan:

Source Language: Sözlüğün hangi dilden çevirdiği
Target Language: Sözlüğün hangi dile çevirdiği

anlamlarına gelir. Bu sayfadaki bilgiler de düzenlendikten sonra sağ altta "Advanced"e tıklanır. "Use UTF-8 encoding" seçeneği işaretlenir. OK'e tıklanır. Tekrar Next>e tıklanır. Data Sources>Excel Worksheet seçilir. Excel file>Browse'a tıklanır. Hazırlamış olduğumuz excel dosyası seçilir. Next^'e tıklanır.
Term Column: Maddelerin bulunduğu sütun seçilir. Advanced Styling'e tıklanır. "Show column names in definition" seçeneği temizlenir. Definition Columns: Burada Change'e tıklanır, sadece maddelerin anlamlarının bulunduğu sütun seçilir.  Tekrar Next>Build. Sözlüğümüz hazır. Karşımıza çıkan soruya evet cevabını verirsek sözlüğümüz kendi Babylon uygulamamıza da yüklenmiş olur.


Stardict

Yukarda anlattığımız, herhangi bir formattaki sözlüğü txt dosyasına çevirme işlemi gibi yapılır. Sadece çıktı formatı "stardict.ifo" seçilir. İşlem sonunda oluşturulan, işlem yaptığımız txt dosyasıyla aynı adı taşıyan ama uzantısı ifo, dict ve idx olan dosyalar bizim sözlük dosyalarımızdır.

Diğer Formatlar

Pyglossary programında istediğiniz çıktı formatını seçerek yapabilirsiniz.

8 yorum:

  1. fransızca sözlük harika benzer yöntemle kendi ispanyolca sözlüğümü yazmayı deneyeceğim.saygılarımla

    YanıtlaSil
  2. Ahmet bey, mrb
    Ben kendi kindle icin sozluklerimi farkli sekilde yaptim: baylon sozluklerini html haline getirip ordan da mobipocker creator ile kindle ile uyumlu sozluklerimi yaptim.
    Benim elimde pdf formatinda bir sozluk daha var.Bunda html formati elde edemedigim icin(sadece duz yazi var, arka planda html kodlari cikmiyor) bu anlattigim sekilde sozluk yapamiyorum. sizin dediginiz sekilde yapmak istedim ama pyglossary.bat dosyasini bulamadim. Kontrol edebilir misiniz acaba..
    Ayrica duz yalin pdf dosyasindan(txt dosyasina donusturdugumde html kodlari gorunmeyen bir dosyadan) nasil sozluk yapilir, anlatmaniz mumkun mudur?

    YanıtlaSil
  3. Ahmet bey, mrb
    Ben kendi kindle icin sozluklerimi farkli sekilde yaptim: baylon sozluklerini html haline getirip ordan da mobipocker creator ile kindle ile uyumlu sozluklerimi yaptim.
    Benim elimde pdf formatinda bir sozluk daha var.Bunda html formati elde edemedigim icin(sadece duz yazi var, arka planda html kodlari cikmiyor) bu anlattigim sekilde sozluk yapamiyorum. sizin dediginiz sekilde yapmak istedim ama pyglossary.bat dosyasini bulamadim. Kontrol edebilir misiniz acaba..
    Ayrica duz yalin pdf dosyasindan(txt dosyasina donusturdugumde html kodlari gorunmeyen bir dosyadan) nasil sozluk yapilir, anlatmaniz mumkun mudur?

    YanıtlaSil
  4. PDF dosyanızı görmem gerekiyor. Facebook.com/ahmetbaltaci88

    YanıtlaSil
  5. İyi Günler Ahmet Bey;
    Easywords adlı programı kurum kullanıyorum. Elimde de önceden kendim hazırladığım excel kelime dosyası var. Bunu csv formatında Easywords programına kurmak istiyorum. xml formatınıda denetim. Bi türlü yapamadım nasıl olacak yardımcı olursanız sevinirim

    YanıtlaSil
  6. Easywords adlı programı hiç kullanmadım. Bana face adresimden ulaşırsanız beraber bakarız verilerinize.

    YanıtlaSil
  7. Güzel bir anlatım olmuş tşkrler. Ben de başka bir şey yapmak istiyorum.
    BGL dosyasını excel dosyasına dönüştürmek istiyorum.
    Bunun en kısa yolu nedir?

    YanıtlaSil