Clustering

NeuronDB provides multiple clustering algorithms for unsupervised learning.

K-Means

Partition data into k clusters:


CREATE TEMP TABLE kmeans_model AS
SELECT train_kmeans_model_id('data_table', 'features', 3, 100) AS model_id;

Faster version for large datasets:


SELECT train_minibatch_kmeans('data_table', 'features', 3, 100) AS model_id;

Density-based clustering:


SELECT train_dbscan('data_table', 'features', 0.5, 5) AS model_id;

Probabilistic clustering:


CREATE TEMP TABLE gmm_model AS
SELECT train_gmm_model_id('data_table', 'features', 3) AS model_id;


SELECT train_hierarchical_clustering('data_table', 'features', 3) AS model_id;

For detailed documentation on clustering algorithms, choosing parameters, evaluating clusters, and visualization, visit: