Yapay zeka teknolojilerinin gelişmesiyle birlikte, son vakitlerde birçok sohbet botu ortaya çıktı.
Peki ChatGPT ve Google Gemini üzere yapay zeka takviyeli sohbet botları ne kadar hakikat karşılıklar veriyor?
University College London’dan araştırmacılar, en güzel yedi yapay zeka aracını insan muhakemesini test etmek için tasarlanmış bir dizi klasik teste tabi tuttu.
Yapay zeka botları mantıksız ve yanlış yanıtlar veriyor
En güzel performans gösteren yapay zekaların bile mantıksız olduğu ve kolay yanılgılara yatkın olduğu görüldü. Birçok model, soruların yarısından birçoklarında yanlış cevap verdi.
Araştırmacılar, bu modellerin beşerlerle tıpkı biçimde mantıksız olmadığını, hatta kimilerinin mantık sorularını “etik gerekçelerle” yanıtlamayı reddettiğini ortaya çıkardı.
Araştırmacılar; ChatGPT, Meta’nın Llama botu, Claude 2 ve Google Gemini üzere birçok yapay zekayı test etti.
Modellerden tekrar tekrar, insanların muhakeme yeteneklerini test etmek için tasarlanan 12 klasik mantık sorusuna cevap vermeleri istendi.
Araştırmacılar, yapay zekanın reaksiyonlarının çoğunlukla ne rasyonel ne de beşere misal olduğunu ortaya çıkardı.
Yapay zekaların başı karıştı
Meta’nın Llama modeli, bir soruda daima olarak sesli harfleri ünsüz harflerle karıştırdı. Bu nedenle mantığı hakikat olsa bile yanlış yanıtlar verdi.
Sorular büsbütün suçsuz olsa da yapay zeka sohbet robotları, etik nedenlerle çok sayıda soruya karşılık vermedi.
Araştırmacılar, bunun muhafaza özelliklerinin yanlış çalışması ve çok dikkatli olmanın bir sonucu olduğunu argüman ediyor.
En gerçek karşılık veren ChatGPT oldu
En makûs performans gösteren model ise yüzde 77,5’lik yanılgı oranıyla Meta’nın Llama 2 7b modeli olarak kayıtlara geçti.