Son yıllarda “veri bilimi” kavramı oldukça popüler hale geldi, ancak aslında veri bilimi uzun bir geçmişe sahiptir. Bazılarına göre, veri bilimi temellerini istatistik bilimiyle eşleştirebilirsiniz, ancak veri biliminin yeni bir alan olarak doğuşunun miladı 1962’de John Tukey tarafından kaleme alınan “Future of Data Analysis” makalesidir. Bu makalede, Tukey istatistik biliminin formal veri analizi prosedürlerini birleştirerek, sistemli ve kapsamlı analizlerin yapılacağını öngörmüştür. Makalede, istatistik biliminin eksik kaldığı noktalardan bahsedilerek, yeni yaklaşımlar önerilmiştir.
Bu tarihten sonra, bilgisayar temelli yaklaşımların yanı sıra, veri analizi konusunda yeni teknikler hızla ortaya çıkmıştır.
Bu tekniklerin en ünlüsü belki de makine öğrenmesi algoritmalarıdır. Makine öğrenmesi teknikleri, istatistiksel yöntemler ve optimizasyon teknikleri kullanılarak karmaşık ve doğrusal olmayan problemlerin kabul edilebilir seviyede çözülmesini sağlar. Bu teknikler, spam e-posta tespiti, Instagram filtreleri, ses tanıma/algılama araçları, kişiselleştirilmiş reklamlar gibi birçok günlük araçta kullanılmaktadır.
Kaggle, tam da bu noktada devreye giriyor. Kaggle, oyunlaştırma prensiplerini ustalıkla kullanarak kullanıcılarına sürekli bir öğrenme ve gelişme deneyimi sunar.
Kaggle Nedir?
Kaggle, 2010 yılında Anthony Goldbloom, Jeremy Howard ve Ben Vigoda tarafından kuruldu.
Kaggle, veri bilimi ve makine öğrenimi topluluğu için bir platformdur. Bu platform, veri bilimcilerinin ve makine öğrenimi uzmanlarının projeler yapmaları, veri setleri keşfetmeleri, yarışmalara katılmaları ve birbirleriyle etkileşimde bulunmaları için bir ortam sunar. Kaggle’da kullanıcılar, gerçek dünya veri setlerini kullanarak çeşitli problemleri çözmek için modeller geliştirirler. Ayrıca, yarışmalara katılarak kazanç sağlayabilirler veya becerilerini geliştirmek için egzersiz yapabilirler.
Kaggle aynı zamanda bir eğitim platformu olarak da kullanılabilir. Kullanıcılar, veri bilimi ve makine öğrenimi konularında dersler alabilir, uygulamalar yapabilir ve diğer kullanıcılarla etkileşimde bulunarak öğrenme sürecini destekleyebilirler.
Kaggle’ın sunduğu bir diğer önemli özellik ise “Kaggle Kernels” adı verilen bulut tabanlı Jupyter Notebook ortamıdır. Bu, kullanıcıların veri analizi yapmalarını, modeller oluşturmalarını ve paylaşmalarını sağlar. Kaggle, hem profesyonellerin hem de acemi veri bilimcilerin bir araya gelip öğrenmelerini ve birbirleriyle işbirliği yapmalarını kolaylaştıran bir topluluk odaklı bir platformdur.
Kaggle’ın Oyunlaştırılmış Dünyası
Kaggle’ın başarısının arkasındaki en önemli faktörlerden biri, oyunlaştırma ilkelerini kullanmasıdır Kaggle, oyunlaştırma prensiplerini ustalıkla kullanarak kullanıcılarına sadece veri bilimi öğrenme fırsatı sunmakla kalmaz, aynı zamanda onları motive eder, etkileşimi artırır ve başarılarını kutlar..Kaggle, puan tabloları, rozetler, madalyalar ve liderlik tabloları gibi oyunlaştırma unsurlarını kullanarak veri bilimi yarışmalarını daha ilgi çekici ve eğlenceli hale getirir. Bu unsurlar, katılımcılara bir amaç duygusu verir ve onları sürekli olarak kendilerini geliştirmeye ve daha iyisini yapmaya teşvik eder.
Kaggle’ın oyunlaştırma unsurlarını ve bu unsurların kullanıcı deneyimine nasıl katkı sağladığını detaylı bir şekilde inceleyelim.
1.Yarışmalar ve Sıralamalar
Kaggle, düzenli olarak çeşitli veri bilimi yarışmaları düzenler. Bu yarışmalar, kullanıcıları belirli bir veri seti üzerinde problem çözmeye teşvik eder. Yarışmacılar, çözümlerini yükler ve platform üzerinden diğer katılımcılarla kıyaslanır. Bu rekabetçi ortam, kullanıcıların motivasyonunu artırır ve daha iyi performans göstermelerini sağlar. Ayrıca, kullanıcılar yarışma sonucunda aldıkları sıralamalara göre ödüllendirilir, bu da katılımcıların daha fazla motive olmasını sağlar.
2. Başarı Rozetleri ve Ödüller
Yarışma Rozetleri: Kaggle’da bir yarışmada başarılı olan katılımcılara çeşitli yarışma rozetleri verilir. Bu rozetler, kullanıcının başarılarını ve katkılarını vurgular. Örneğin, bir yarışmada ilk 100’e giren katılımcılar, liderlikte bulunanlar veya bir kategori içinde en iyi performans gösterenler gibi çeşitli rozetler olabilir.
Kernel Rozetleri: Kaggle’da kullanıcılar, veri analizi ve modelleme işlemlerini içeren çekirdekler (kernels) oluşturabilirler. Diğer kullanıcılar tarafından beğenilen, yararlı bulunan veya popüler olan çekirdekler, kullanıcılara özel rozetler kazandırır. Bu rozetler, kullanıcının veri bilimi topluluğu içindeki etkisini ve katkılarını gösterir.
Topluluk Katkı Rozetleri: Kaggle’daki forumlarda aktif olarak katkıda bulunan kullanıcılara da özel rozetler verilir. Örneğin, diğer kullanıcılara yardım edenler, soruları cevaplayanlar veya değerli içerik paylaşanlar bu tür rozetler kazanabilirler.
Ödüller: Bazı Kaggle yarışmalarında, maddi ödüller veya sponsor ödülleri de bulunabilir. Bu ödüller, yarışmanın sponsorları tarafından sunulabilir ve genellikle en iyi performans gösteren katılımcılara verilir. Ödüller, kullanıcıların daha fazla çaba sarf etmelerini teşvik eder ve rekabeti artırır.
Kurs Tamamlama Rozetleri ve Sertifikalar: Kaggle, kullanıcılara Intro to Programming, Intro to Machine Learning, Pandas, Intermediate Machine Learning, Data Visualization, Feature Engineering, Feature Engineering, Intro to SQL, Advanced SQL, Intro to Deep Learning, Computer Vision, Time Series, Data Cleaning, Intro to AI Ethics, Geospatial Analysis, Machine Learning Explainability, Intro to Game AI and Reinforcement Learning alanlarında çeşitli eğitim kursları sunar. Bu kursları başarıyla tamamlayan kullanıcılara özel rozetler ve tamamlama sertifikası verilir. Bu rozetler, kullanıcının belirli bir konuda uzmanlaştığını ve başarıyla kursu tamamladığını gösterir.
Kaggle İlerleme Sistemi
Kaggle’ın İlerleme Sistemi, Kaggle’da bir veri bilimcisi olarak büyümenizi takip etmek için performans katmanlarını kullanır. Yol boyunca başarılarınız için madalyalar kazanacak ve canlı skor tablolarında veri bilimi zaferi için yarışacaksınız.
Performans Katmanları
Her uzmanlık kategorisinde, ürettiğiniz işin kalitesi ve miktarına göre elde edilebilecek beş performans kademesi vardır: Acemi , Katkıda Bulunan , Uzman , Usta ve Büyük Usta.
Competitions Master, a Datasets Expert, a Notebooks Grandmaster and a Discussion Expert olabilirsiniz.
Herhangi bir uzmanlık kategorisinde ulaştığınız en yüksek seviye, profilinizde ve site genelinde avatarınızın altında görüntülenecektir. Kademeler, her kategoride kazanılan madalyalara göre verilir. Gelin, birlikte Kaggle’da yer alan kategorileri inceleyelim:
Novice
- Topluluğa katılın
- Kayıt olun
Contributor
Profilinizi tamamladınız, toplulukla etkileşime geçtiniz ve Kaggle’ın platformunu tamamen keşfettiniz.
- 1 not defterini veya komut dosyasını çalıştırın
- 1 yarışma gönderimi yapın
- 1 yorum yap
- 1 olumlu oy ver
Expert
Kaggle’da bir veya daha fazla uzmanlık kategorisinde önemli miktarda çalışma tamamladınız. Bir kategori için uzman seviyesine ulaştığınızda, o kategori için site genelindeki Kaggle Sıralamasına girebileceksiniz.
- Competitions: 2 bronz madalya
- Datasets: 3 bronz madalya
- Notebooks: 5 bronz madalya
- Discussions: 50 bronz madalya
Master
Bu prestijli seviyeye ulaşmak için Kaggle’da bir veya daha fazla uzmanlık kategorisinde mükemmellik gösterdiniz. Yarışmalar kategorisindeki ustalar, yalnızca Ustalara özel yarışmalara katılma hakkına sahiptir.
- Competitions: 1 altın madalya – 2 gümüş madalya
- Datasets: 1 altın madalya – 4 gümüş madalya
- Notebooks: 10 gümüş madalya
- Discussions: 50 gümüş madalya – Toplamda 200 madalya
Grandmaster
Bu zirve kademesine ulaşmak için Kaggle’da bir veya daha fazla uzmanlık kategorisinde sürekli olarak olağanüstü performans sergilediniz. Sen en iyinin en iyisisin.
- Competitions: 5 altın madalya – Tek başına altın madalya
- Datasets: 5 altın madalya – 5 gümüş madalya
- Notebooks: 15 altın madalya
- Discussions: 50 altın madalya – Toplamda 500 madalya
Madalyalar
En iyi çalışmanızı ödüllendirmek için madalyalar, Kaggle’daki uzmanlık kategorilerindeki mükemmel çalışmaları tanımanın ve ödüllendirmenin standartlaştırılmış bir yoludur. Her madalya tek bir başarı için verilir.
Competitions Madalyaları
Yarışma madalyaları en iyi yarışma sonuçları için verilir. Yarışma başına verilen madalya sayısı yarışmanın büyüklüğüne göre değişmektedir. Topluluk, Oyun Alanı ve Başlarken yarışmalarının genellikle madalya vermediğini unutmayın.
(İlk 10 + %0,2) yarışmadaki her ilave 500 takıma ekstra bir altın madalya verileceği anlamına gelir. Örneğin, 500 takımın yer aldığı bir yarışmada ilk 11 takıma altın madalya verilecek ve 5000 takımın yer aldığı bir yarışmada ilk 20 takıma altın madalya verilecek.
Datasets Madalyaları
Dataset Madalyaları, olumlu oy sayısına göre ölçülen, sitede yayınlanan popüler halka açık veri kümelerine verilir. Tüm olumlu oylar madalya için sayılmaz. Acemilerin oyları madalya hesaplamasına dahil edilmez.
Notebooks Madalyaları
Notebooks Madalyaları, notebooks olumlu oyların sayısına göre ölçülen, popüler notebooks verilir.Tüm olumlu oylar madalya için sayılmaz. Kendi kendine verilen oylar, acemilerin oyları ve eski gönderilere verilen oylar madalya hesaplamasına dahil edilmez.
Discussions Madalyaları
Discussions Madalyaları, net oylarla (olumlu oylar eksi olumsuz oylar) ölçülen, site genelinde yayınlanan popüler konulara ve yorumlara verilir. Tüm olumlu oylar madalya için sayılmaz: acemilerin oyları ve eski gönderilere verilen oylar madalya hesaplamasının dışında bırakılır ve olumlu oy halkalarını ve ilerleme sistemi manipülasyonunu önlemek için ek gizli kurallar da vardır.
Kaggle Sıralaması
Kaggle Sıralaması sayfası, Kaggle’daki en iyi veri bilimcilerinin canlı bir sıralama tablosudur. Her uzmanlık kategorisinin kendi liderlik tablosu ve puan sistemi vardır. Bir veri bilimcinin profili, mevcut sıralamasının yanı sıra her kategori için şimdiye kadar elde ettiği en yüksek sıralamayı da gösterecektir. Bir veri bilimcinin bu kategoride sıralanabilmesi için uzman düzeyinde veya daha yüksek olması gerekir.
Puanlar
Kademeler ve madalyalar veri bilimcinin başarılarının kalıcı temsilleri olsa da puanlar zamanla azalacak şekilde tasarlanmıştır. Bu, Kaggle’ın sıralamasını çağdaş ve rekabetçi tutuyor. Verilen tüm puanlar aşağıdaki formülü kullanarak tutarlı bir şekilde azalır.
Bu formülde t, puanın verilmesinden bu yana geçen gün sayısıdır.
Yarışmalar
Yarışma puanları, bir takımın bir yarışmada ne kadar iyi performans gösterdiğine, takımdaki üye sayısına ve yarışmadaki takım sayısına göre verilir. Topluluk, oyun alanı ve başlarken yarışmalarının genellikle puan vermediğini unutmayın.
Yarışma puanı algoritması;
Kaggle’nin Oyunlaştırma Etkisi Performans Artışına Dair İstatistiksel Bulgular
Kaggle Jupyter notebook kullanarak oyunlaştırmanın gücünü istatistiksel bulgularla gözlemleyelim.
2017-2023 Yılları Arasında Kayıtlı Kullanıcı Sayısı ve Oyunlaştırma Etkisi
Yukarıdaki grafik, 2017-2023 yılları arasında kayıtlı kullanıcı sayısındaki artışı gösteriyor. Grafikteki eğri, kullanıcı sayısının her yıl istikrarlı bir şekilde arttığını gösteriyor. Bu artış, oyunlaştırmanın etkisiyle ilişkilendirilebilir.
- Keskin Artış: 2019’dan 2020’ye kadar kullanıcı sayısında keskin bir artış görülüyor. Bu artış, oyunlaştırma unsurlarının platforma entegre edildiği zamana denk geliyor.
- Sürekli Büyüme: 2020’den sonra da kullanıcı sayısı istikrarlı bir şekilde artmaya devam ediyor. Bu, oyunlaştırmanın kullanıcıları platformda tutmaya ve tekrar ziyaret etmeye teşvik ettiğini gösteriyor.
- Katlanarak Artma: Kullanıcı sayısı her yıl önceki yıla göre iki katına çıkıyor. Bu, oyunlaştırmanın viral bir etkiye sahip olduğunu ve kullanıcıların platforma diğer kullanıcıları davet etmesini teşvik ettiğini gösteriyor.
- Puanlar ve Rozetler: Kullanıcılar platformdaki aktiviteleri için puan ve rozetlerle ödüllendirilebilir. Bu, kullanıcıların daha fazla puan ve rozet kazanmak için daha fazla aktivitede bulunmalarını teşvik eder.
- Seviyeler ve Liderlik Tabloları: Kullanıcılar, platformdaki ilerlemelerine göre seviyelere ayrılabilir ve liderlik tablolarında sıralanabilir. Bu, kullanıcıların rekabet etmelerini ve daha yüksek seviyelere ulaşmak için motive olmalarını sağlar.
- Görevler ve Başarımlar: Kullanıcılara platformda tamamlamaları için görevler ve başarımlar verilebilir. Bu, kullanıcıların platforma daha fazla katılmalarını ve platformdaki hedeflere ulaşmalarını sağlar.
2018 Yılında Kaggle’da Oyunlaştırmanın Etkisi
2018 yılında Kaggle, liderlik tabloları ve yarışmalar gibi oyunlaştırma unsurlarını kullanmaya başladı.Bu değişiklikten sonra, kullanıcıların modelleme performansında %10’luk bir artış gözlemlendi. Bu, oyunlaştırmanın kullanıcı motivasyonunu ve katılımını artırarak becerilerini geliştirmeye yardımcı olduğunu gösteren bir kanıttır.
Kullanıcı Motivasyonları ile Oyunlaştırma Etkisi
Grafik, Kaggle kullanıcılarının motivasyonlarını ve oyunlaştırmanın bu motivasyonlar üzerindeki etkisini göstermektedir.
- Ankete katılan kullanıcıların %70’i oyunlaştırma unsurlarının platformdaki motivasyonlarını artırdığını belirtmiştir.
- En yüksek motivasyon kaynağı öğrenmek (%80) olarak karşımıza çıkmaktadır.
- Bunu katkıda bulunmak (%65), eğlenmek (%70) ve rekabet etmek (%75) takip etmektedir.
- Oyunlaştırma unsurlarının her türden motivasyon üzerinde olumlu bir etkisi olduğu görülmektedir.
Oyunlaştırma unsurlarının kullanımı, Kaggle’ın kullanıcı deneyimini ve platformun genel başarısını önemli ölçüde geliştirmiştir. Bu unsurlar, platformda daha fazla katılımı teşvik ederek, kullanıcıların becerilerini geliştirmelerine ve daha iyi sonuçlar elde etmelerine yardımcı olmaktadır. Kaggle’ın başarısı, oyunlaştırmanın veri bilimi ve makine öğrenmesi alanlarındaki eğitim ve araştırmayı teşvik etmede önemli bir rol oynayabileceğini göstermektedir.
KAYNAKÇA
https://www.kaggle.com/code/jhoward/jupyter-notebook-101
https://www.jstor.org/stable/2237638
Bu yazı Gamfed Türkiye gönüllülerinden Gizem Kasap tarafından kaleme alınmıştır.