Classificação

A base de dados para classificação é semelhante à para regressão, é uma tabela organizada onde cada linha representa uma amostra única e cada coluna contém informações específicas sobre essa amostra. O objetivo desse tipo de base é permitir que um modelo de IA aprenda a categorizar ou classificar cada amostra em um grupo ou classe específica.

ESTRUTURA

  1. Linhas

    • Cada linha é uma amostra independente e representa algo será classificado.

    • Por exemplo, se você quer criar um modelo que identifique diferentes tipos de frutas, cada linha no dataset seria uma fruta específica.

  2. Colunas de Propriedades (X)

    • Conhecidas como variáveis de entrada, usadas como base para o modelo fazer a predição. Também chamadas de "X".

    • Essas colunas contêm as informações que ajudam o modelo a tomar decisões.

    • Cada coluna é uma característica ou atributo que descreve a amostra.

    • Exemplos de características:

      • Peso de uma fruta (em gramas).

      • Tamanho da fruta (em cm).

      • Casca lisa ou rugosa (sim[1] ou não[0]).

  3. Coluna de Classe (Y)

    • Esta é a variável de saída indica a classe ou categoria de cada amostra.

    • A classe é o que queremos que o modelo aprenda a prever. No caso de frutas, a classe será o nome do tipo de fruta, como "maçã", "banana" ou "laranja".

    • Essa coluna pode conter:

      • Strings: Por exemplo, "maçã", "banana", "laranja".

      • Números: Por exemplo, 1 = "maçã", 2 = "banana", 3 = "laranja".

EXEMPLO

Aqui está um exemplo de uma base de dados para classificar frutas com base em suas características:

Peso (g)
Tamanho
Casca Lisa
Tipo de Fruta

150

6.5

1

Maçã

120

12

0

Banana

200

4.9

0

Laranja

180

29

0

Melancia

  • As colunas de propriedades (X) são: Peso (g), Cor, Tamanho, Casca Lisa.

  • A coluna de classe (Y) é: Tipo de Fruta.

Cada linha representa uma fruta específica, com suas características (peso, tamanho, etc.) e o tipo (classe) a que pertence.

IMPORTAÇÃO DE DADOS

Em todos os objetos do DelphAI é possível importar a base de dados por um arquivo CSV ou por um TDataset.

  1. Por CSV:

    • O arquivo CSV deve conter o mesmo formato da tabela acima.

    • Exemplo de arquivo CSV:

      ParamA,ParamB,ParamC,Result
      150,6.5,1,Maçã
      120,12,0,Banana
      200,4.9,0,Laranja
      180,29,0,Melancia
  2. Por Query:

    • A base de dados pode estar armazenado em um banco de dados relacional.

    • Exemplo de um select na tabela no banco:

      ParamA | ParamB | ParamC | Result
      -------|--------|--------|--------
      150    | 6.5    | 1      | Maçã
      120    | 12     | 0      | Banana
      200    | 4.9    | 0      | Laranja
      180    | 29     | 0      | Melancia
    • Utilize uma query SQL para selecionar os dados:

      SELECT * FROM Fruits;

REGRAS E DICAS PARA CRIAÇÃO DA BASE

  1. Sem Dados Faltantes:

    • Cada célula deve ter um valor (não pode haver "buracos").

  2. Tratamento de dados categóricos:

    • Os valores em todas as colunas devem estar no formato numérico.

    • Transforme valores como "cor" em colunas (ex.: Vermelho (0 ou 1), Amarelo(0 ou 1)) antes.

BASE DE DADOS DE EXEMPLO

É possível encontrar o exemplo do arquivo CSV no repositório oficial.

Last updated