K-Means

O K-Means é um algoritmo de agrupamento que divide os dados em "K" grupos ou clusters. Ele começa selecionando K pontos, chamados de centróides, que são escolhidos aleatoriamente. Em seguida, cada ponto do conjunto de dados é atribuído ao centróide mais próximo. Após essa etapa, os centróides são atualizados para refletir a posição média de todos os pontos atribuídos a eles. Esse processo é repetido até que os centróides parem de mudar significativamente ou até atingir um número máximo de iterações. É amplamente usado por sua simplicidade, mas pode ter dificuldades com conjuntos de dados mais complexos, como aqueles com formas não esféricas ou tamanhos variados.

EXEMPLO DE USO

uses
  UKMeans;
  
procedure ExampleClustering;
begin
  ShowArray(KMeans('C:\Delphai\Delphai\Datasets\Iris-Clustering.csv', 3, 500, 42));
end;

GUIA DE CLASSES E MÉTODOS

  • function KMeans(aData: String; aK, aMaxIterations, aNumInitializations: Integer; aHasHeader : Boolean = True): TArray; ou

  • function KMeans(aData: TDataSet; aK, aMaxIterations, aNumInitializations: Integer): TArray; : define os grupos.

    • aData : caminho do arquivo CSV ou objeto TDataSet que contém os dados que serão usados para treinamento.

    • aK (Número de Clusters) : define a quantidade de agrupamentos desejados no conjunto de dados.

    • aMaxIterations (Número Máximo de Iterações) : limita o número de ciclos para ajustar clusters e centróides.

    • aNumInitializations (Número de Inicializações) : especifica quantas execuções com inicializações diferentes serão realizadas.

    • aHasHeader : indica se tem cabeçalho no arquivo.

Last updated