Bu sayfada gruplandırma ile ilgili terimler yer almaktadır. Tüm terimler için burayı tıklayın.
A
birleştirme kümeleme
Hiyerarşik kümelenme konusuna bakın.
C
kütle merkezi
K-ortalama veya k-orta algoritması tarafından belirlenen bir kümenin merkezi. Örneğin, k 3 ise k-ortalama veya k-ortalama algoritması 3 ağırlık merkezi bulur.
Daha fazla bilgi için Küme oluşturma kursundaki Küme oluşturma algoritmaları bölümüne bakın.
merkeze dayalı kümeleme
Verileri hiyerarşik olmayan kümelere ayıran bir kümeleme algoritması kategorisi. K-ortalama, ağırlık merkezine dayalı en yaygın kümeleme algoritmasıdır.
Hiyerarşik kümeleme algoritmalarıyla karşılaştırın.
Daha fazla bilgi için Küme oluşturma kursundaki Küme oluşturma algoritmaları bölümüne bakın.
kümeleme
Özellikle gözetimsiz öğrenme sırasında ilgili örneklerin gruplandırılması Tüm örnekler gruplandırıldıktan sonra, bir kullanıcı isteğe bağlı olarak her kümeye anlam verebilir.
Birçok küme oluşturma algoritması vardır. Örneğin, k-ortalama algoritması, örnekleri aşağıdaki şemada gösterildiği gibi bir orta noktaya olan yakınlıklarına göre kümeler hâlinde toplar:
Ardından, gerçek bir araştırmacı kümeleri inceleyebilir ve örneğin 1. kümeyi "cüce ağaçlar", 2. kümeyi ise "tam boy ağaçlar" olarak etiketleyebilir.
Bir başka örnek olarak, bir örneğin merkez noktaya olan uzaklığına dayalı bir küme oluşturma algoritmasını ele alalım. Bu algoritma aşağıdaki şekilde gösterilmiştir:
Daha fazla bilgi için Gruplandırma kursuna bakın.
D
Bölme kümeleme
Hiyerarşik kümelenme konusuna bakın.
H
hiyerarşik kümeleme
Küme ağacı oluşturan kümelenme algoritmaları kategorisi. Hiyerarşik kümeleme, botanik sınıflandırmaları gibi hiyerarşik veriler için çok uygundur. İki tür hiyerarşik küme oluşturma algoritması vardır:
- Toplayıcı küme oluşturma, her örneği önce kendi kümesine atar ve hiyerarşik bir ağaç oluşturmak için en yakın kümeleri iteratif olarak birleştirir.
- Bölünme kümelenmesi, önce tüm örnekleri tek bir kümede gruplandırır, ardından kümeyi iteratif olarak hiyerarşik bir ağaca böler.
Merkez noktaya dayalı küme oluşturma ile karşılaştırın.
Daha fazla bilgi için Küme oluşturma kursundaki küme oluşturma algoritmaları bölümüne bakın.
K
k-ortalama
Gözetimli öğrenmede örnekleri gruplandıran popüler bir kümeleme algoritması. K-ortalama algoritması temel olarak aşağıdakileri yapar:
- En iyi k merkez noktasını (merkez noktaları olarak bilinir) iteratif olarak belirler.
- Her örneği en yakın merkez noktaya atar. Aynı merkez noktaya en yakın örnekler aynı gruba aittir.
K-ortalama algoritması, her bir örnekten en yakın merkez noktasına olan mesafelerin kümülatif kare değerini en aza indirmek için merkez noktası konumlarını seçer.
Örneğin, köpek boyunun köpek genişliğine göre gösterildiği aşağıdaki grafiği inceleyin:
k=3 ise k-ortalama algoritması üç ağırlık merkezi belirler. Her örnek, en yakın merkez noktasına atanır. Böylece üç grup elde edilir:
Bir üreticinin, köpekler için küçük, orta ve büyük kazak bedenlerinin ideal ölçülerini belirlemek istediğini varsayalım. Üç kütle merkezi, ilgili kümedeki her köpeğin ortalama yüksekliğini ve ortalama genişliğini tanımlar. Bu nedenle, üreticinin kazak bedenlerini bu üç merkez noktasına göre belirlemesi gerekir. Bir kümenin ağırlık merkezinin genellikle kümedeki bir örnek olmadığını unutmayın.
Önceki görsellerde, yalnızca iki özelliği (yükseklik ve genişlik) olan örnekler için k-ortalama gösterilmektedir. K-ortalamaların, örnekleri birçok özellikte gruplandırabileceğini unutmayın.
k-ortanca
K-ortalama ile yakından ilişkili bir kümeleme algoritması. Bu iki yöntem arasındaki pratik fark şu şekildedir:
- K-ortalamaları yönteminde, bir merkez adayı ile örneklerinin her biri arasındaki mesafenin karelerinin toplamı en aza indirilerek merkezler belirlenir.
- K-ortalama yönteminde, merkez nokta adayları ile örnekleri arasındaki mesafelerin toplamı en aza indirilerek merkez noktalar belirlenir.
Mesafe tanımlarının da farklı olduğunu unutmayın:
- k-ortalama, ağırlık merkezi ile bir örnek arasındaki Öklid uzaklığını temel alır. (İki boyutta Öklid mesafesi, hipotenüsü hesaplamak için Pisagor teoreminin kullanılması anlamına gelir.) Örneğin, (2,2) ile (5,-2) arasındaki k-ortalama mesafe şöyle olur:
- k-median, merkez nokta ile bir örnek arasındaki Manhattan uzaklığına dayanır. Bu mesafe, her boyuttaki mutlak deltaların toplamıdır. Örneğin, (2,2) ile (5,-2) arasındaki k-median mesafesi şöyle olur:
S
benzerlik ölçümü
Gruplandırma algoritmalarında, iki örneğin birbirine ne kadar benzediğini (ne kadar benzer olduğunu) belirlemek için kullanılan metrik.
eskiz
Gözetimsiz makine öğrenimi'nde, örnekler üzerinde ön bir benzerlik analizi yapan bir algoritma kategorisidir. Çizim algoritmaları, benzer olma olasılığı yüksek noktaları tespit etmek ve ardından bunları gruplara ayırmak için yerelliğe duyarlı bir karma işlevi kullanır.
Taslak oluşturma, büyük veri kümelerinde benzerlik hesaplamaları için gereken hesaplamayı azaltır. Veri kümesindeki her bir örnek çifti için benzerliği hesaplamak yerine, yalnızca her gruptaki her nokta çifti için benzerliği hesaplarız.
T
zaman serisi analizi
Zamansal verileri analiz eden makine öğrenimi ve istatistik alt alanı. Sınıflandırma, kümelendirme, tahmin ve anormallik algılama dahil olmak üzere birçok makine öğrenimi sorunu zaman serisi analizi gerektirir. Örneğin, geçmiş satış verilerine göre kışlık montların gelecekteki satışlarını aya göre tahmin etmek için zaman serisi analizini kullanabilirsiniz.
U
gözetimsiz makine öğrenimi
Genellikle etiketlenmemiş bir veri kümesinde kalıpları bulmak için bir model eğitme.
Gözetimli olmayan makine öğreniminin en yaygın kullanımı, verileri benzer örneklerden oluşan gruplara kümelendirmektir. Örneğin, gözetimsiz bir makine öğrenimi algoritması, şarkıları müziğin çeşitli özelliklerine göre gruplandırabilir. Elde edilen kümeler, diğer makine öğrenimi algoritmalarının (ör. müzik önerisi hizmeti) girişi olabilir. Yararlı etiketler az sayıda olduğunda veya hiç olmadığında kümeleme yardımcı olabilir. Örneğin, kötüye kullanım ve sahtekarlık gibi alanlarda kümeler, kullanıcıların verileri daha iyi anlamasına yardımcı olabilir.
Denetimli makine öğrenimiyle karşılaştırın.