btbilgi

Yapay zeka çalışmalarını sürdüren teknoloji devlerinden Microsoft, bilgisayarlara konuşmayı öğretmeye çalışan araştırmacılar için bir veri seti yayınladı. Microsoft Makine Öğrenme ve Kavrama (Microsoft Machine Reading Comprehension – MS MARCO) ismindeki veri seti, 100 bin İngilizce soru ve cevaptan oluşuyor.

Seti yayınlayan bölümün program yöneticisi Rangan Majumder, bu veri seti ile yapay zeka konusunda çalışan başka firmalarla işbirliği kapılarını açmak niyetinde olduklarını açıkladı. MS MARCO setindeki sorular, firmanın arama motoru Bing’e ve sanal asistanı Cortana’ya yönlendirilen sorulardan derlenmiş. Cevaplar ise online arama sonuçlarından derlenmiş ve insan görevliler tarafından doğruluğu kontrol edilmiş.

MS MARCO veri seti derin makine öğrenme alanında çalışan kişilere ücretsiz açılmış durumda. Fakat ticari olarak kullanılması yasaklanmış. Firma daha önce de yapay zeka öğrenme alanında kullanılmak üzere, ImageNet için hazırlanmış benzer bir veri setini kullanıma açmıştı. ImageNet, makinelere imajları öğrenme konusunda veri sağlayacak bir veritabanı. Bu veritabanında belli kavram setlerine bağlı binlerce imaj ve beraberlerindeki anahtar kelimeler bulunuyor. Firma ImageNet ve benzeri sistemleri, Azure bulut platformu ve Office yazılımı gibi servislerini geliştirmek için kullanıyor.

MS MARCO veri seti ile ilgili ayrıntılı bilgiler, yapım ekibinin yayınladığı dokümantasyonda mevcut. Ekip ayrıca veri seti ile geliştirilmiş makine öğrenme örneklerini test etmek için de bir yazılım hazırladığını açıkladı. Majumder yaptığı açıklamada test yazılımının tamamlanınca kullanıcılara sunulacağını belirtti.

Yorumlar
btbilgi
PAYLAŞ
blank
xTRlarge, Türkiye'nin (TR) üretici ve yenilikçi potansiyelini sergilemek; farklı bakış açılarını, yeni tarzları, x sayıda yeni değeri, girişimi, fikri yansıtmak; teknolojiden doğaya, iş yönetiminden tasarıma, insana dair faaliyetlerin en geniş ufkunu sizlerle mümkün olduğu kadar geniş 'large" paylaşabilmek için yola çıktı. Geleceğe inancı olanlarla birlikte mesafe katetmeyi planlıyor.