OpenAI, gelecekteki yapay zeka modellerinin olumsuz etkilerini değerlendirmek için "MLE-bench" adı verilen yeni bir AGI ölçütü tasarladı. Bu ölçüt, yapay zeka sistemlerinin kendi kendini geliştirme yeteneklerini test eden 75 zorlu görev içeriyor ve bu testlerin gerçek dünyadaki pratik karşılıkları da göz önünde bulunduruluyor.
Kaynak: DonanımHaber