Dil Modellerinin Ses ile Anlam İlişkilendirmesi: Sesçil Simgecilik Üzerine Çok Modelli Bir İnceleme

Sesçil Simgecilik Nedir?
Sesçil simgecilik, fonetik biçimler ile anlamları arasındaki keyfi olmayan ilişkileri ifade eden dilbilimsel bir kavramdır. Bu çalışmada, Çok Modelli Büyük Dil Modellerinin (ÇMBDM'ler) dil seslerini nasıl yorumladığını araştırıyoruz.
Çok Modelli Büyük Dil Modellerinin Performansı
Çalışmamızda, ÇMBDM'lerin 25'e kadar semantik boyut (örneğin keskin vs. yuvarlak) üzerindeki fonetik ikonisiteyi nasıl işlediğini inceledik. Modellerin katmanlı bilgi işleme süreçlerini, fonem düzeyindeki dikkat kesir puanlarını ölçerek gözlemledik.
LEX-ICON Veri Kümesi
Bu amaçla, 4 doğal dil (İngilizce, Fransızca, Japonca, Korece) ve 2.930 sistematik olarak oluşturulmuş sözde-kelimeden oluşan 8.052 kelimelik kapsamlı bir LEX-ICON veri kümesi sunduk. Bu veri kümesi, hem metin hem de ses modallikleri üzerinde uygulanan semantik özelliklerle etiketlenmiştir.
Temel Bulgular
Çalışmamızın temel bulguları şunlardır:
- ÇMBDM'lerin, mevcut dilbilimsel araştırmalarla uyumlu fonetik sezgileri
- Fonosemantik dikkat kalıplarının, modellerin simgesel fonemler üzerindeki odağını vurgulaması
Sonuç
Sonuçlarımız, yapay zeka ve bilişsel dilbilim alanlarını birleştirerek, ÇMBDM'lerin yorumlanabilirliği bağlamında fonetik simgeciliğin ilk kapsamlı, nicel analizlerini sunmaktadır.