Mean Shift

O Mean Shift é um algoritmo de agrupamento que não requer especificar previamente o número de clusters. Ele funciona deslocando iterativamente cada ponto de dados em direção à região com maior densidade de pontos ao redor, calculada usando uma "janela" de raio definido. Ao final, os pontos que convergirem para a mesma região densa formam um cluster. Esse método é útil para detectar automaticamente o número de clusters e funciona bem com dados de forma variada, mas pode ser computacionalmente mais caro em conjuntos de dados grandes.

EXEMPLO DE USO

uses
  UMeanShift;
  
procedure ExampleClustering;
begin
  ShowArray(MeanShift('C:\Delphai\Delphai\Datasets\Iris-Clustering.csv', 0.2, 0.1));
end;

GUIA DE CLASSES E MÉTODOS

  • function MeanShift(aData : String; aBandwidth, aEpsilon : Double; aMaxIterations: Integer = 300; aHasHeader : Boolean = True): TArray; ou

  • function MeanShift(aData : TDataSet; aBandwidth, aEpsilon : Double; aMaxIterations: Integer = 300): TArray; : define os grupos.

    • aData : caminho do arquivo CSV ou objeto TDataSet que contém os dados que serão usados para treinamento.

    • aBandwidth (Largura de Banda) : determina o raio usado para definir a vizinhança de cada ponto durante o agrupamento.

    • aEpsilon (Tolerância de Convergência) : especifica o limite de diferença mínima para considerar que os centróides convergiram.

    • aMaxIterations (Número Máximo de Iterações) : define o número máximo de ciclos permitidos para ajustar os clusters e calcular os centróides.

    • aHasHeader : indica se tem cabeçalho no arquivo.

Last updated