Yapay Zekalı Uygulama Oluşturma Sistemlerinin İnsan Odaklı Değerlendirilmesi

Yapay Zekalı Uygulama Oluşturma Sistemleri Değerlendirildi
Doğal dil komutlarından tam yığın web uygulamaları oluşturabilen yapay zekalı sistemler ('komuttan ürüne') yazılım geliştirmede önemli bir dönüşüm temsil ediyor. Ancak bu sistemlerin değerlendirilmesi zorlu bir konu, çünkü görsel kalite, işlevsel doğruluk ve kullanıcı güveni sıklıkla birbiriyle uyumlu değil. Sonuç olarak, mevcut 'komuttan ürüne' araçlarının gerçekçi, insan odaklı değerlendirme ölçütlerine göre nasıl karşılaştıkları belirsiz.
İnsan Odaklı Bir Değerlendirme Çerçevesi
Bu makalede, 'komuttan ürüne' sistemlerini değerlendirmek için insan odaklı bir kıyaslama çerçevesi sunuyoruz ve üç yaygın platformu (Replit, Bolt, Firebase Studio) geniş kapsamlı bir karşılaştırmalı çalışmayla inceliyoruz. 96 farklı web uygulaması komutunu kullanarak 288 benzersiz uygulama örneği oluşturduk ve bunları 205 katılımcının yer aldığı büyük ölçekli bir değerlendirme çalışmasında test ettik.
Firebase Studio Öne Çıkıyor
Sonuçlarımız, bu sistemlerin birbirinin yerine kullanılamayacağını gösteriyor: Firebase Studio, kullanım kolaylığı, güven, görsel çekicilik ve uygunluk açısından tüm rakiplerini geride bırakıyor. Bolt, görsel çekicilik konusunda rekabetçi performans sergilerken, kullanılabilirlik ve güven açısından Firebase'in gerisinde kalıyor. Replit ise çoğu ölçütte her iki rakibinin de gerisinde kaldı.
Gelecek İçin Çıkarımlar
Bulgularımız, 'komuttan ürüne' sistemlerindeki görsel kalite ile işlevsel güvenilirlik arasındaki süregelen açığı vurguluyor ve etkileşimli, görev tabanlı değerlendirmenin gerekliliğini gösteriyor. Çalışmamızın sonuçları, bu alandaki araştırmalara ve uygulamalara yol gösterici olacak.