Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Makine Öğrenimi Sözlüğü: Kümeleme

Bu sayfada gruplandırma ile ilgili terimler yer almaktadır. Tüm terimler için burayı tıklayın.

A

birleştirme kümeleme

#clustering

Hiyerarşik kümelenme konusuna bakın.

C

kütle merkezi

#clustering

K-ortalama veya k-orta algoritması tarafından belirlenen bir kümenin merkezi. Örneğin, k 3 ise k-ortalama veya k-ortalama algoritması 3 ağırlık merkezi bulur.

Daha fazla bilgi için Küme oluşturma kursundaki Küme oluşturma algoritmaları bölümüne bakın.

merkeze dayalı kümeleme

#clustering

Verileri hiyerarşik olmayan kümelere ayıran bir kümeleme algoritması kategorisi. K-ortalama, ağırlık merkezine dayalı en yaygın kümeleme algoritmasıdır.

Hiyerarşik kümeleme algoritmalarıyla karşılaştırın.

Daha fazla bilgi için Küme oluşturma kursundaki Küme oluşturma algoritmaları bölümüne bakın.

kümeleme

#clustering

Özellikle gözetimsiz öğrenme sırasında ilgili örneklerin gruplandırılması Tüm örnekler gruplandırıldıktan sonra, bir kullanıcı isteğe bağlı olarak her kümeye anlam verebilir.

Birçok küme oluşturma algoritması vardır. Örneğin, k-ortalama algoritması, örnekleri aşağıdaki şemada gösterildiği gibi bir orta noktaya olan yakınlıklarına göre kümeler hâlinde toplar:

X ekseninin ağaç genişliği, y ekseninin ise ağaç yüksekliği olarak etiketlendiği iki boyutlu bir grafik. Grafikte iki merkez noktası ve birkaç düzine veri noktası bulunur. Veri noktaları, yakınlıklarına göre sınıflandırılır. Yani bir merkez noktaya en yakın veri noktaları 1. küme, diğer merkez noktaya en yakın veri noktaları ise 2. küme olarak kategorize edilir.

Ardından, gerçek bir araştırmacı kümeleri inceleyebilir ve örneğin 1. kümeyi "cüce ağaçlar", 2. kümeyi ise "tam boy ağaçlar" olarak etiketleyebilir.

Bir başka örnek olarak, bir örneğin merkez noktaya olan uzaklığına dayalı bir küme oluşturma algoritmasını ele alalım. Bu algoritma aşağıdaki şekilde gösterilmiştir:

Onlarca veri noktası, neredeyse bir dart tahtasının ortasındaki delikler gibi iç içe geçmiş çemberler halinde düzenlenir. Veri noktalarının en içteki halkası 1. grup, ortadaki halkası 2. grup ve en dıştaki halkası 3. grup olarak sınıflandırılır.

Daha fazla bilgi için Gruplandırma kursuna bakın.

D

Bölme kümeleme

#clustering

Hiyerarşik kümelenme konusuna bakın.

H

hiyerarşik kümeleme

#clustering

Küme ağacı oluşturan kümelenme algoritmaları kategorisi. Hiyerarşik kümeleme, botanik sınıflandırmaları gibi hiyerarşik veriler için çok uygundur. İki tür hiyerarşik küme oluşturma algoritması vardır:

Toplayıcı küme oluşturma, her örneği önce kendi kümesine atar ve hiyerarşik bir ağaç oluşturmak için en yakın kümeleri iteratif olarak birleştirir.
Bölünme kümelenmesi, önce tüm örnekleri tek bir kümede gruplandırır, ardından kümeyi iteratif olarak hiyerarşik bir ağaca böler.

Merkez noktaya dayalı küme oluşturma ile karşılaştırın.

Daha fazla bilgi için Küme oluşturma kursundaki küme oluşturma algoritmaları bölümüne bakın.

K

k-ortalama

#clustering

Gözetimli öğrenmede örnekleri gruplandıran popüler bir kümeleme algoritması. K-ortalama algoritması temel olarak aşağıdakileri yapar:

En iyi k merkez noktasını (merkez noktaları olarak bilinir) iteratif olarak belirler.
Her örneği en yakın merkez noktaya atar. Aynı merkez noktaya en yakın örnekler aynı gruba aittir.

K-ortalama algoritması, her bir örnekten en yakın merkez noktasına olan mesafelerin kümülatif kare değerini en aza indirmek için merkez noktası konumlarını seçer.

Örneğin, köpek boyunun köpek genişliğine göre gösterildiği aşağıdaki grafiği inceleyin:

Birkaç düzine veri noktası içeren Kartezyen nokta grafiği.

k=3 ise k-ortalama algoritması üç merkez belirler. Her örnek, en yakın merkez noktasına atanır. Böylece üç grup elde edilir:

Üç ağırlık merkezinin eklenmesi dışında önceki görseldekiyle aynı Kartezyen nokta kümesi.
Önceki veri noktaları üç farklı gruba ayrılır. Her grup, belirli bir merkeze en yakın veri noktalarını temsil eder.

Bir üreticinin, köpekler için küçük, orta ve büyük kazak bedenlerinin ideal ölçülerini belirlemek istediğini varsayalım. Üç kütle merkezi, ilgili kümedeki her köpeğin ortalama yüksekliğini ve ortalama genişliğini tanımlar. Bu nedenle, üreticinin kazak bedenlerini bu üç merkez noktasına göre belirlemesi gerekir. Bir kümenin ağırlık merkezinin genellikle kümedeki bir örnek olmadığını unutmayın.

Önceki görsellerde, yalnızca iki özelliği (yükseklik ve genişlik) olan örnekler için k-ortalama gösterilmektedir. K-ortalamaların, örnekleri birçok özellikte gruplandırabileceğini unutmayın.

Daha fazla bilgi için Küme oluşturma kursundaki K-ortalama küme oluşturma nedir? başlıklı makaleyi inceleyin.

k-ortanca

#clustering

K-ortalama ile yakından ilişkili bir kümeleme algoritması. Bu iki yöntem arasındaki pratik fark şu şekildedir:

K-ortalamalarda, bir merkez adayı ile örneklerinin her biri arasındaki mesafenin karelerinin toplamı en aza indirilerek merkezler belirlenir.
K-ortalama yönteminde, merkez nokta adayları ile örnekleri arasındaki mesafelerin toplamı en aza indirilerek merkez noktalar belirlenir.

Mesafe tanımlarının da farklı olduğunu unutmayın:

k-ortalama, ağırlık merkezi ile bir örnek arasındaki Öklid uzaklığını temel alır. (İki boyutta Öklid mesafesi, hipotenüsü hesaplamak için Pisagor teoreminin kullanılması anlamına gelir.) Örneğin, (2,2) ile (5,-2) arasındaki k-ortalama mesafe şöyle olur:

$$ {\text{Euclidean distance}} = {\sqrt {(2-5)^2 + (2--2)^2}} = 5 $$

k-median, merkez nokta ile bir örnek arasındaki Manhattan uzaklığına dayanır. Bu mesafe, her boyuttaki mutlak deltaların toplamıdır. Örneğin, (2,2) ile (5,-2) arasındaki k-median mesafesi şöyle olur:

$$ {\text{Manhattan distance}} = \lvert 2-5 \rvert + \lvert 2--2 \rvert = 7 $$

S

benzerlik ölçümü

#clustering

#Metric

Gruplandırma algoritmalarında, iki örneğin birbirine ne kadar benzediğini (ne kadar benzer olduğunu) belirlemek için kullanılan metrik.

eskiz

#clustering

Gözetimsiz makine öğrenimi'nde, örnekler üzerinde ön bir benzerlik analizi yapan bir algoritma kategorisidir. Çizim algoritmaları, benzer olma olasılığı yüksek noktaları tespit etmek ve ardından bunları gruplara ayırmak için yerelliğe duyarlı bir karma işlevi kullanır.

Taslak oluşturma, büyük veri kümelerinde benzerlik hesaplamaları için gereken hesaplamayı azaltır. Veri kümesindeki her bir örnek çifti için benzerliği hesaplamak yerine, yalnızca her gruptaki her nokta çifti için benzerliği hesaplarız.

T

zaman serisi analizi

#clustering

Zamansal verileri analiz eden makine öğrenimi ve istatistik alt alanı. Sınıflandırma, kümelendirme, tahmin ve anormallik algılama dahil olmak üzere birçok makine öğrenimi sorunu zaman serisi analizi gerektirir. Örneğin, geçmiş satış verilerine göre kışlık montların gelecekteki satışlarını aya göre tahmin etmek için zaman serisi analizini kullanabilirsiniz.

U

gözetimsiz makine öğrenimi

#clustering

#fundamentals

Genellikle etiketlenmemiş bir veri kümesinde kalıpları bulmak için bir model eğitme.

Gözetimli olmayan makine öğreniminin en yaygın kullanımı, verileri benzer örneklerden oluşan gruplara kümelendirmektir. Örneğin, gözetimsiz bir makine öğrenimi algoritması, şarkıları müziğin çeşitli özelliklerine göre gruplandırabilir. Elde edilen kümeler, diğer makine öğrenimi algoritmalarının (ör. müzik önerisi hizmeti) girişi olabilir. Yararlı etiketler az sayıda olduğunda veya hiç olmadığında kümeleme yardımcı olabilir. Örneğin, kötüye kullanım ve sahtekarlık gibi alanlarda kümeler, kullanıcıların verileri daha iyi anlamasına yardımcı olabilir.

Denetimli makine öğrenimiyle karşılaştırın.

Ek notlar için simgeyi tıklayın.

Gözetimli olmayan makine öğreniminin bir başka örneği de ana bileşenler analizi (PCA)'dir. Örneğin, milyonlarca alışveriş sepetinin içeriğini içeren bir veri kümesine PCA uygulanması, limon içeren alışveriş sepetlerinde sıklıkla antiasitlerin de bulunduğunu gösterebilir.

Daha fazla bilgi için Makine Öğrenimi'ne Giriş kursunda Makine Öğrenimi nedir? başlıklı makaleyi inceleyin.

Makine Öğrenimi Sözlüğü: Kümeleme Koleksiyonlar ile düzeninizi koruyun İçeriği tercihlerinize göre kaydedin ve kategorilere ayırın.

A

birleştirme kümeleme

C

kütle merkezi

merkeze dayalı kümeleme

kümeleme

D

Bölme kümeleme

H

hiyerarşik kümeleme

K

k-ortalama

k-ortanca

S

benzerlik ölçümü

eskiz

T

zaman serisi analizi

U

gözetimsiz makine öğrenimi

Ek notlar için simgeyi tıklayın.

Makine Öğrenimi Sözlüğü: Kümeleme