Classificação
A base de dados para classificação é semelhante à para regressão, é uma tabela organizada onde cada linha representa uma amostra única e cada coluna contém informações específicas sobre essa amostra. O objetivo desse tipo de base é permitir que um modelo de IA aprenda a categorizar ou classificar cada amostra em um grupo ou classe específica.
ESTRUTURA
Linhas
Cada linha é uma amostra independente e representa algo será classificado.
Por exemplo, se você quer criar um modelo que identifique diferentes tipos de frutas, cada linha no dataset seria uma fruta específica.
Colunas de Propriedades (X)
Conhecidas como variáveis de entrada, usadas como base para o modelo fazer a predição. Também chamadas de "X".
Essas colunas contêm as informações que ajudam o modelo a tomar decisões.
Cada coluna é uma característica ou atributo que descreve a amostra.
Exemplos de características:
Peso de uma fruta (em gramas).
Tamanho da fruta (em cm).
Casca lisa ou rugosa (sim[1] ou não[0]).
Coluna de Classe (Y)
Esta é a variável de saída indica a classe ou categoria de cada amostra.
A classe é o que queremos que o modelo aprenda a prever. No caso de frutas, a classe será o nome do tipo de fruta, como "maçã", "banana" ou "laranja".
Essa coluna pode conter:
Strings: Por exemplo, "maçã", "banana", "laranja".
Números: Por exemplo, 1 = "maçã", 2 = "banana", 3 = "laranja".
EXEMPLO
Aqui está um exemplo de uma base de dados para classificar frutas com base em suas características:
150
6.5
1
Maçã
120
12
0
Banana
200
4.9
0
Laranja
180
29
0
Melancia
As colunas de propriedades (X) são: Peso (g), Cor, Tamanho, Casca Lisa.
A coluna de classe (Y) é: Tipo de Fruta.
Cada linha representa uma fruta específica, com suas características (peso, tamanho, etc.) e o tipo (classe) a que pertence.
IMPORTAÇÃO DE DADOS
Em todos os objetos do DelphAI é possível importar a base de dados por um arquivo CSV ou por um TDataset.
Por CSV:
O arquivo CSV deve conter o mesmo formato da tabela acima.
Exemplo de arquivo CSV:
Por Query:
A base de dados pode estar armazenado em um banco de dados relacional.
Exemplo de um select na tabela no banco:
Utilize uma query SQL para selecionar os dados:
REGRAS E DICAS PARA CRIAÇÃO DA BASE
Sem Dados Faltantes:
Cada célula deve ter um valor (não pode haver "buracos").
Tratamento de dados categóricos:
Os valores em todas as colunas devem estar no formato numérico.
Transforme valores como "cor" em colunas (ex.: Vermelho (0 ou 1), Amarelo(0 ou 1)) antes.
BASE DE DADOS DE EXEMPLO
É possível encontrar o exemplo do arquivo CSV no repositório oficial.
Last updated