İngiltere’deki University College London’dan araştırmacılar, yapay zekaların mantıksal akıl yürütme konusundaki yeteneklerini test etmek amacıyla yedi farklı modeli insan muhakemesini değerlendirmek için klasik testlere tabi tuttu.
Araştırma sonuçlarına göre, en iyi performans gösteren yapay zekaların bile mantıksız olduğu ve basit hatalara yatkın olduğu görüldü. Araştırmacılar, bu modellerin insanlarla aynı şekilde mantıksız olmadığını belirtse de, bazılarının mantık sorularını “etik gerekçelerle” yanıtlamayı reddettiğini ortaya çıkardılar.
UCL’de doktora öğrencisi Olivia Macmillan-Scott, araştırmanın sonuçları üzerine yapay zekaların henüz insanlar gibi düşünmediğini belirtti. Test edilen yapay zekalar genellikle ne rasyonel ne de insana benzer yanıtlar verdi.
Yapay zekalar arasında en yüksek doğruluk oranına sahip olan ChatGPT, 12 görevin tamamında yüzde 69,2 oranında doğru ve insani mantıkla yanıt vererek öne çıktı. En kötü performans ise Meta’nın Llama 2 7b modelinden geldi.
Araştırmacılar, yapay zeka modellerinin farklı görevlerde farklı performanslar sergilediğini belirterek, bu sonuçların diplomasi veya tıp gibi kritik uygulamalarda nasıl bir etkiye sahip olabileceğini vurguladılar.
Reklam & İletişim [email protected]