Plazma Fiziği Makalelerinde İç İçe Geçmiş Varlık Tanıma

Plazma Fiziği Makalelerinde İç İçe Geçmiş Varlık Tanıma
Doğal dil işlemenin önemli bir görevi olan Varlık Tanıma (NER), yapısöküm edilmiş metinlerden kilit varlıkları tanımlamayı ve çıkarmayı amaçlar. Bu çalışmada, plazma fiziği araştırma makalelerindeki karmaşık ve bağlama duyarlı içeriği çıkarmak için NER'in yeni bir uygulamasını sunuyoruz.
Plazma fiziği makaleleri genellikle çıkarılması gereken oldukça karmaşık ve bağlama dayalı içerik barındırır. Bu içeriği çıkarmak, örneğin gelişmiş arama işlevlerini desteklemek için önemlidir. Biz de BERT-CRF tabanlı hafif bir yaklaşım önererek plazma fiziği metinlerinden iç içe geçmiş varlıkları çıkarmayı amaçlıyoruz.
Veri Kümesi ve Model Geliştirme
İlk olarak, plazma fiziği alanına özgü 16 sınıftan oluşan bir veri kümesi oluşturduk. Ardından, her bir varlık türünü bağımsız BERT-CRF modelleriyle tanıma yaklaşımını değerlendirdik. Son olarak, model performansını artırmak için sistematik bir hiperparametri ayarlama süreci entegre ettik.
Sonuçlar ve Gelecek Çalışmalar
Çalışmamız, plazma fiziği alanındaki varlık tanıma çalışmalarına katkıda bulunuyor ve araştırmacıların bilimsel literatürü daha iyi anlamasını ve analiz etmesini destekliyor. Gelecekte, daha gelişmiş derin öğrenme teknikleri kullanarak modelimizi iyileştirmeyi ve yöntemimizi diğer bilimsel alanlara uyarlamayı planlıyoruz.