Dil Modelleri Ses ile Anlam İlişkisi Kuruyor mu? Ses Sembolizmi Üzerine Çok Modelli Bir Çalışma
Dil Modelleri Ses ile Anlam İlişkisi Kuruyor mu?
Ses sembolizmi, fonetik formlar ile anlamları arasındaki keyfi olmayan ilişkileri ifade eden dilbilimsel bir kavramdır. Bu, Çok Modelli Büyük Dil Modellerinin (MLLMs) insani dillerdeki işitsel bilgiyi nasıl yorumladığına dair ilgi çekici bir sınama olabilir. Metinsel (yazım ve IPA) ve işitsel girdilerin 25'e kadar semantik boyut (örn. keskin vs. yuvarlak) üzerindeki fonetik ikonikliği konusundaki performanslarını inceliyor, modellerin katmanlı bilgi işleme süreçlerini de fonem düzeyindeki dikkat kesir puanlarını ölçerek gözlemliyoruz.
LEX-ICON: Kapsamlı Taklit Kelime Veri Seti
Bu amaçla, İngilizce, Fransızca, Japonca ve Korece olmak üzere dört doğal dilden 8.052 kelime ve sistematik olarak oluşturulmuş 2.930 sahte kelimeden oluşan, metin ve ses modallikleri üzerinde uygulanmış semantik özelliklerle etiketlenmiş kapsamlı bir LEX-ICON veri seti sunuyoruz.
Anahtar Bulgular
Temel bulgularımız şunlardır:
- MLLMlerin, mevcut dilbilimsel araştırmalarla uyumlu fonetik sezgileri birden fazla semantik boyutta
- Fonosemantik dikkat örüntüleri, modellerin ikonik fonemler üzerinde yoğunlaştığını vurguluyor
Bu sonuçlar, yapay zeka ve bilişsel dilbilim alanlarını birbirine bağlıyor ve MLLMlerin yorumlanabilirliği açısından fonetik ikonikliğin ilk kapsamlı, nicel analizlerini sunuyor.
Kaynaklar ve Referanslar
Sonuç
Bu çalışma, dil modellerinin ses ile anlam arasındaki ilişkileri nasıl yorumladığına dair önemli bulgular sunuyor. Sonuçlar, yapay zeka ve dilbilim arasındaki bağlantıları güçlendirerek, dil modellerinin fonetik ikoniklik konusundaki yorumlanabilirliğine ışık tutuyor.