Veri Madenciliği Dersi 5. Ünite Sorularla Öğrenelim

Açıköğretim ders notları öğrenciler tarafından ders çalışma esnasında hazırlanmakta olup diğer ders çalışacak öğrenciler için paylaşılmaktadır. Sizlerde hazırladığınız ders notlarını paylaşmak istiyorsanız bizlere iletebilirsiniz.

Açıköğretim derslerinden Veri Madenciliği Dersi 5. Ünite Sorularla Öğrenelim için hazırlanan  ders çalışma dokümanına (ders özeti / sorularla öğrenelim) aşağıdan erişebilirsiniz. AÖF Ders Notları ile sınavlara çok daha etkili bir şekilde çalışabilirsiniz. Sınavlarınızda başarılar dileriz.

İlişki Kuralları

1. Soru

İlişki kuralları nedir?

Cevap

Büyük veri kümeleri içerisinde belirli veriler arasındaki ilişkileri bulan ve olayların birlikte gerçekleşme ihtimallerini geçmiş verileri analiz edip ortaya koyarak geleceğe yönelik çalışmaları destekleyen veri madenciliği yöntemine ilişki kuralları denilmektedir.


2. Soru

Bir ilişki kuralının güven değeri nedir?

Cevap

A?B şeklindeki bir ilişki kuralının güven değeri, aslında A’yı içeren işlemlerin aynı zamanda B’yi de içerme olasılığıdır yani P(B-A)koşullu olasılığıdır. Yani A bilindiğinde B’nin ortaya çıkma olasılığıdır.


3. Soru

Güçlü kural nedir?

Cevap

Belirlenen destek ve güven eşik değerleri üzerinde destek ve güven değerine sahip ilişki kuralına güçlü kural denir.


4. Soru

Apriori algoritmasının temel yaklaşımı nedir?

Cevap

Apriori algoritmasının temel yaklaşımı, “Eğer k nesneden oluşan nesne setleri kümesi en küçük destek kriterini sağlıyorsa, bu kümenin alt kümeleri de en küçük destek kriterini sağlar.” şeklindedir.


5. Soru

R’da apriori() fonksiyonu ile veri dönüşümü için kullanılması gereken komut nedir?

Cevap

apriori() ile veri girişi standart veri girişlerinden herhangi birisi ile yapılabilir. Ancak girilen verinin apriori() fonksiyonu ile işlenebilmesi için işlemlerden oluşan veritabanı formatına dönüştürülmesi gerekir. Veri dönüşümü için help(“transactions”) komutundan yararlanılabilir.


6. Soru

İlişki kuralları hangi sektörlerde kullanılmaktadır?

Cevap

Genel olarak ilişki kuralları sayesinde büyük miktarlardaki veriler arasından ilginç birliktelik örüntüleri keşfedilerek karar verme, pazarlama ve iş yönetimi vb. gibi konularda birçok fayda sağlanmaktadır. İlişki kuralları; ekonomi, eğitim, e-ticaret, pazarlama, iletişim ve sağlık gibi birçok sektörde geniş kullanıma sahip veri madenciliğinin özel bir uygulama alanıdır.


7. Soru

Bir ilişki kuralının destek değeri nedir?

Cevap

Bir ilişki kuralının destek değeri, o kuralın öncül (A) ve sonuç (B) kısmındaki nesne setlerinin birlikte gözlenme olasılığıdır ve P(A?B) şeklinde ifade edilir.


8. Soru

Destek-bazlı budama (support based pruning) nedir?

Cevap

Destek Bazlı Budama Özelliği, Apriori özelliğinin aksine, “Eğer bir alt küme sık görülen nesne kümesi değil ise, onun bütün üst kümeleri de sık görülen nesne kümesi değildir” temel yaklaşımına sahiptir. Böylece belirlenen destek eşik değerini geçemeyen az elemanlı kümelerin üst kümeleri de destek eşik değerini geçemeyeceği için değerlendirme dışı bırakılır. Bu yönteme destek-bazlı budama (support based pruning) denir.


9. Soru

Bir ilişki kuralının gücü nasıl ölçülebilir?

Cevap

Nesneler kümesindeki nesne sayısı arttıkça oluşturulabilecek ilişki kuralı sayısı katlanarak artmaktadır. Dolayısıyla elde edilecek çok sayıda ilişki kuralı içerisinden bir eleme yapmak gerekir. Bu sebepten ötürü, oluşturulabilecek olası tüm kurallar içerisinden işe yarayacak bilgiyi üretecek kural(lar)ı belirleyebilmek için, önem ve ilginin çeşitli ölçümleri üzerine kısıtlamalar konulabilir. Bu kısıtlamalar içerisinde en çok kullanılanlar ise belirlenecek destek ve güven eşik değerleridir. Oluşturulabilecek tüm kurallar içerisinden bir eleme yapabilmek için her bir kuralın ne kadar güçlü olduğunun belirlenmesi gerekir. Bir ilişki kuralının gücü, o kural için hesaplanacak destek ve güven değerleri ile ölçümlenebilir.


10. Soru

İlişki analizinin amacı nedir?

Cevap

İlişki analizinin amacı, elde edilecek birçok kural içerisinden belirlenen destek ve güven eşik değerlerini sağlayan kuralların seçilmesidir.


11. Soru

İlginç kural nedir?

Cevap

Bir alışveriş veritabanından oluşturulacak ilişki kuralları arasından işe yarayacak bilgiyi üretmek amacıyla kullanılacak ilişki kuralı ilginç kural olarak tanımlanabilir. Bir ilişki kuralının ilginç kural olarak değerlendirilebilmesi için,

olması gerekir.


12. Soru

R’da apriori() fonksiyonunun temel parametreleri nelerdir?

Cevap

apriori() fonksiyonunun temel parametreleri ilişki kurallarının oluşturulabilmesi için elde edilen tüm işlemleri (alışverişleri) barındıran veri değişkenini ifade eden data ve özellikle destek ve güven eşik değerleri vb. kısıtlamalara ilişkin eşik değerlerinin belirlendiği parameter’dır.


13. Soru

İlginç kuralların belirlenebilmesi amacıyla kullanılan objektif ölçütler nelerdir?

Cevap

İlginç kuralların belirlenebilmesi amacıyla kullanılan başlıca objektif ölçütler destek ve güven ölçütleridir. İlişki kurallarının elenerek sayılarının azaltılmasında çoğu zaman destek ve güven temel ölçütleri yeterli olmasına karşın bazı durumlarda yapılan eleme sonucunda elde edilen kural sayısı da arzu edilenden fazla olabilir. Bu gibi durumlarda ilave ölçütlere gereksinim duyulur. Bu amaçla geliştirilen birçok ölçüt mevcuttur. Bu ölçütler içerisinde en yaygın kullanılanı öncül ve sonuç nesne setleri arasındaki korelasyonu hesaba katan kaldıraç ölçütüdür.


14. Soru

Kaldıraç değeri nedir?

Cevap

İlişki kuralı oluşturmak için kullanılan algoritmalarının hepsi ilişki kuralı oluşturmada destek ve güven eşik değerlerini kullanır. Belirlenen destek ve güven eşik değerleri, güçlü olmayan birçok kuralın gereksiz yere elde edilmesini engellemesine rağmen, bazı durumlarda değerlendirilmesi gereken güçlü kural sayısı yine de fazla olabilmektedir. Böyle durumlarda ortaya çıkan güçlü kurallar içerisinden bir seçim yapabilmek ya da güçlü kuralları önem sırasına göre sıralamak ve problemin amacına en uygun ilişki kuralını belirleyebilmek için ilave kısıtlamalar kullanmak gerekmektedir. Bunlar içerisinden en çok kullanılan ölçüt ise, öncül(A) ve sonuç(B) nesne setleri arasındaki ilişkinin(korelasyonun) belirlenmesi temeline dayanarak hesaplanan kaldıraç(lift) değeridir. Kaldıraç değeri, öncül (A) nesne setinin gözlendiği durumlarda sonuç(B) nesne setinin olasılığındaki değişim hakkında bilgi verir.


15. Soru

İlişki kuralı belirleme aşamaları nelerdir?

Cevap

Genel olarak, bir ilişki kuralı oluşturmak iki temel adımdan oluşan bir süreçtir.


16. Soru

İlişki kuralı oluşturabilmek için geliştirilen algoritmalar nelerdir?

Cevap

Etkin bir şekilde bir ilişki kuralı oluşturabilmek için zaman içerisinde AIS, SETM, Apriori, Eclat ve FP-Growth gibi birçok algoritma geliştirilmiştir. Geliştirilen bu algoritmalar arasında en temel ve en çok kullanılan algoritma Apriori algoritmasıdır.


17. Soru

Pazar sepeti analizi nedir?

Cevap

İlişki kuralları, aynı işlem içinde çoğunlukla beraber görülen nesneleri içeren kurallardır. Herhangi bir ürün alırken, bu ürünün yanında başka bir ürün ya da ürünlerin satın alınması, bu ürünler arasındaki bağlantıyı ifade eder. Bu tür bağlantıların ortaya çıkarılması ve bunun bir kural olarak değerlendirilmesi ise ilişki analizi ile mümkün olmaktadır. Literatürde bu türden çalışmalara “pazar sepeti analizi” denilmektedir. Pazar sepeti analizi, müşterilerin alışveriş alışkanlıklarının veritabanındaki bilgiler aracılığı ile ortaya çıkartılması işlemidir.


18. Soru

Pazar sepeti analizinde işlem ve nesne kavramları neyi ifade etmektedir?

Cevap

Pazar sepeti analizinde müşterilerin alışverişlerinde aldıkları her bir ürün nesne, içerisinde birçok nesneyi yani ürünü barındıran her bir alışveriş ise işlem olarak ifade edilir.


19. Soru

Destek eşik değerinin işlevi nedir?

Cevap

İlginç kural elde edebilmek için ilk eleme işlemi, hesaplanan destek değerleri üzerinden yapılır. Bu elemeyi yapabilmek için ise önceden bir destek eşik değerinin belirlenmiş olması gerekmektedir. Belirlenecek destek eşik değeri, tüm nesne setleri içerisinden bu destek eşik değerinden daha küçük destek değerine sahip nesne setlerinin elenmesini sağlar


20. Soru

Sık görülen nesne seti nedir?

Cevap

Belirlenen destek eşik değerine eşit veya daha büyük destek değerine sahip nesne setinesık görülen nesne seti denir.


1. Soru

İlişki kuralları nedir?

Cevap

Büyük veri kümeleri içerisinde belirli veriler arasındaki ilişkileri bulan ve olayların birlikte gerçekleşme ihtimallerini geçmiş verileri analiz edip ortaya koyarak geleceğe yönelik çalışmaları destekleyen veri madenciliği yöntemine ilişki kuralları denilmektedir.

2. Soru

Bir ilişki kuralının güven değeri nedir?

Cevap

A?B şeklindeki bir ilişki kuralının güven değeri, aslında A’yı içeren işlemlerin aynı zamanda B’yi de içerme olasılığıdır yani P(B-A)koşullu olasılığıdır. Yani A bilindiğinde B’nin ortaya çıkma olasılığıdır.

3. Soru

Güçlü kural nedir?

Cevap

Belirlenen destek ve güven eşik değerleri üzerinde destek ve güven değerine sahip ilişki kuralına güçlü kural denir.

4. Soru

Apriori algoritmasının temel yaklaşımı nedir?

Cevap

Apriori algoritmasının temel yaklaşımı, “Eğer k nesneden oluşan nesne setleri kümesi en küçük destek kriterini sağlıyorsa, bu kümenin alt kümeleri de en küçük destek kriterini sağlar.” şeklindedir.

5. Soru

R’da apriori() fonksiyonu ile veri dönüşümü için kullanılması gereken komut nedir?

Cevap

apriori() ile veri girişi standart veri girişlerinden herhangi birisi ile yapılabilir. Ancak girilen verinin apriori() fonksiyonu ile işlenebilmesi için işlemlerden oluşan veritabanı formatına dönüştürülmesi gerekir. Veri dönüşümü için help(“transactions”) komutundan yararlanılabilir.

6. Soru

İlişki kuralları hangi sektörlerde kullanılmaktadır?

Cevap

Genel olarak ilişki kuralları sayesinde büyük miktarlardaki veriler arasından ilginç birliktelik örüntüleri keşfedilerek karar verme, pazarlama ve iş yönetimi vb. gibi konularda birçok fayda sağlanmaktadır. İlişki kuralları; ekonomi, eğitim, e-ticaret, pazarlama, iletişim ve sağlık gibi birçok sektörde geniş kullanıma sahip veri madenciliğinin özel bir uygulama alanıdır.

7. Soru

Bir ilişki kuralının destek değeri nedir?

Cevap

Bir ilişki kuralının destek değeri, o kuralın öncül (A) ve sonuç (B) kısmındaki nesne setlerinin birlikte gözlenme olasılığıdır ve P(A?B) şeklinde ifade edilir.

8. Soru

Destek-bazlı budama (support based pruning) nedir?

Cevap

Destek Bazlı Budama Özelliği, Apriori özelliğinin aksine, “Eğer bir alt küme sık görülen nesne kümesi değil ise, onun bütün üst kümeleri de sık görülen nesne kümesi değildir” temel yaklaşımına sahiptir. Böylece belirlenen destek eşik değerini geçemeyen az elemanlı kümelerin üst kümeleri de destek eşik değerini geçemeyeceği için değerlendirme dışı bırakılır. Bu yönteme destek-bazlı budama (support based pruning) denir.

9. Soru

Bir ilişki kuralının gücü nasıl ölçülebilir?

Cevap

Nesneler kümesindeki nesne sayısı arttıkça oluşturulabilecek ilişki kuralı sayısı katlanarak artmaktadır. Dolayısıyla elde edilecek çok sayıda ilişki kuralı içerisinden bir eleme yapmak gerekir. Bu sebepten ötürü, oluşturulabilecek olası tüm kurallar içerisinden işe yarayacak bilgiyi üretecek kural(lar)ı belirleyebilmek için, önem ve ilginin çeşitli ölçümleri üzerine kısıtlamalar konulabilir. Bu kısıtlamalar içerisinde en çok kullanılanlar ise belirlenecek destek ve güven eşik değerleridir. Oluşturulabilecek tüm kurallar içerisinden bir eleme yapabilmek için her bir kuralın ne kadar güçlü olduğunun belirlenmesi gerekir. Bir ilişki kuralının gücü, o kural için hesaplanacak destek ve güven değerleri ile ölçümlenebilir.

10. Soru

İlişki analizinin amacı nedir?

Cevap

İlişki analizinin amacı, elde edilecek birçok kural içerisinden belirlenen destek ve güven eşik değerlerini sağlayan kuralların seçilmesidir.

11. Soru

İlginç kural nedir?

Cevap

Bir alışveriş veritabanından oluşturulacak ilişki kuralları arasından işe yarayacak bilgiyi üretmek amacıyla kullanılacak ilişki kuralı ilginç kural olarak tanımlanabilir. Bir ilişki kuralının ilginç kural olarak değerlendirilebilmesi için,

olması gerekir.

12. Soru

R’da apriori() fonksiyonunun temel parametreleri nelerdir?

Cevap

apriori() fonksiyonunun temel parametreleri ilişki kurallarının oluşturulabilmesi için elde edilen tüm işlemleri (alışverişleri) barındıran veri değişkenini ifade eden data ve özellikle destek ve güven eşik değerleri vb. kısıtlamalara ilişkin eşik değerlerinin belirlendiği parameter’dır.

13. Soru

İlginç kuralların belirlenebilmesi amacıyla kullanılan objektif ölçütler nelerdir?

Cevap

İlginç kuralların belirlenebilmesi amacıyla kullanılan başlıca objektif ölçütler destek ve güven ölçütleridir. İlişki kurallarının elenerek sayılarının azaltılmasında çoğu zaman destek ve güven temel ölçütleri yeterli olmasına karşın bazı durumlarda yapılan eleme sonucunda elde edilen kural sayısı da arzu edilenden fazla olabilir. Bu gibi durumlarda ilave ölçütlere gereksinim duyulur. Bu amaçla geliştirilen birçok ölçüt mevcuttur. Bu ölçütler içerisinde en yaygın kullanılanı öncül ve sonuç nesne setleri arasındaki korelasyonu hesaba katan kaldıraç ölçütüdür.

14. Soru

Kaldıraç değeri nedir?

Cevap

İlişki kuralı oluşturmak için kullanılan algoritmalarının hepsi ilişki kuralı oluşturmada destek ve güven eşik değerlerini kullanır. Belirlenen destek ve güven eşik değerleri, güçlü olmayan birçok kuralın gereksiz yere elde edilmesini engellemesine rağmen, bazı durumlarda değerlendirilmesi gereken güçlü kural sayısı yine de fazla olabilmektedir. Böyle durumlarda ortaya çıkan güçlü kurallar içerisinden bir seçim yapabilmek ya da güçlü kuralları önem sırasına göre sıralamak ve problemin amacına en uygun ilişki kuralını belirleyebilmek için ilave kısıtlamalar kullanmak gerekmektedir. Bunlar içerisinden en çok kullanılan ölçüt ise, öncül(A) ve sonuç(B) nesne setleri arasındaki ilişkinin(korelasyonun) belirlenmesi temeline dayanarak hesaplanan kaldıraç(lift) değeridir. Kaldıraç değeri, öncül (A) nesne setinin gözlendiği durumlarda sonuç(B) nesne setinin olasılığındaki değişim hakkında bilgi verir.

15. Soru

İlişki kuralı belirleme aşamaları nelerdir?

Cevap

Genel olarak, bir ilişki kuralı oluşturmak iki temel adımdan oluşan bir süreçtir.

16. Soru

İlişki kuralı oluşturabilmek için geliştirilen algoritmalar nelerdir?

Cevap

Etkin bir şekilde bir ilişki kuralı oluşturabilmek için zaman içerisinde AIS, SETM, Apriori, Eclat ve FP-Growth gibi birçok algoritma geliştirilmiştir. Geliştirilen bu algoritmalar arasında en temel ve en çok kullanılan algoritma Apriori algoritmasıdır.

17. Soru

Pazar sepeti analizi nedir?

Cevap

İlişki kuralları, aynı işlem içinde çoğunlukla beraber görülen nesneleri içeren kurallardır. Herhangi bir ürün alırken, bu ürünün yanında başka bir ürün ya da ürünlerin satın alınması, bu ürünler arasındaki bağlantıyı ifade eder. Bu tür bağlantıların ortaya çıkarılması ve bunun bir kural olarak değerlendirilmesi ise ilişki analizi ile mümkün olmaktadır. Literatürde bu türden çalışmalara “pazar sepeti analizi” denilmektedir. Pazar sepeti analizi, müşterilerin alışveriş alışkanlıklarının veritabanındaki bilgiler aracılığı ile ortaya çıkartılması işlemidir.

18. Soru

Pazar sepeti analizinde işlem ve nesne kavramları neyi ifade etmektedir?

Cevap

Pazar sepeti analizinde müşterilerin alışverişlerinde aldıkları her bir ürün nesne, içerisinde birçok nesneyi yani ürünü barındıran her bir alışveriş ise işlem olarak ifade edilir.

19. Soru

Destek eşik değerinin işlevi nedir?

Cevap

İlginç kural elde edebilmek için ilk eleme işlemi, hesaplanan destek değerleri üzerinden yapılır. Bu elemeyi yapabilmek için ise önceden bir destek eşik değerinin belirlenmiş olması gerekmektedir. Belirlenecek destek eşik değeri, tüm nesne setleri içerisinden bu destek eşik değerinden daha küçük destek değerine sahip nesne setlerinin elenmesini sağlar

20. Soru

Sık görülen nesne seti nedir?

Cevap

Belirlenen destek eşik değerine eşit veya daha büyük destek değerine sahip nesne setinesık görülen nesne seti denir.