Execução Científica

Capítulo 6: Metodologia Experimental e Engenharia de Dados

O Capítulo 6 estrutura o desenho metodológico da pesquisa, detalhando desde o processo de descoberta de conhecimento até a configuração rigorosa dos agentes de IA e dos ambientes físicos de teste.

6.1 Enquadramento Metodológico: O Processo KDD

Esta seção estabelece a base formal utilizada para guiar o tratamento de dados e o treinamento dos modelos da pesquisa. O estudo estrutura a sua metodologia sob a ótica do KDD (Knowledge Discovery in Databases), um processo não trivial de identificação de padrões válidos, novos, potencialmente úteis e compreensíveis a partir dos dados.

O fluxo de engenharia atua em cinco etapas sequenciais e iterativas, partindo da base bruta até à consolidação do conhecimento:

6.2 Engenharia de Dados e Curadoria Algorítmica

Esta seção estabelece a premissa fundamental da pesquisa: em tarefas de alta complexidade cognitiva, como a avaliação pedagógica, a eficiência de um LLM não é limitada primariamente pelo tamanho de sua rede neural, mas sim pela qualidade, estrutura e densidade informacional dos dados que o instruem.

6.3 Estratégia de Validação e Reprodutibilidade

Detalha o rigor metodológico adotado para assegurar que a comparação de desempenho entre as diferentes arquiteturas de LLMs seja justa e cientificamente válida. Optou-se pela técnica de Validação Hold-out Estática, fixando um subconjunto de dados representativo antes do treinamento devido ao elevado custo computacional da validação cruzada dinâmica.

Engenharia do Dataset V13

6.4 Arquitetura de Agentes (Personas) e Engenharia de Prompt

Esta seção detalha o núcleo tecnológico e cognitivo do sistema desenvolvido. A eficácia do modelo não se apoia apenas na atualização de pesos via Fine-Tuning, mas depende fundamentalmente do Aprendizado em Contexto (In-Context Learning). Este fenômeno permite que a IA refine as suas inferências com base em instruções semânticas na janela de contexto, sem calcular novos gradientes.

6.5 Métricas de Avaliação Multidimensional

Estabelece um arcabouço métrico rigoroso para avaliar os modelos generativos aplicados à correção de redações. Como essa avaliação exige resolver uma tarefa de natureza híbrida — que envolve regressão (predição de notas), classificação (níveis de competência) e geração de linguagem natural (texto de feedback) —, o estudo consolidou a auditoria do sistema em três eixos distintos.

6.6 Protocolo de Seleção de Modelos

Detalha a estratégia adotada para escolher as redes neurais que compõem o estudo. Diferente das abordagens puramente comerciais, a pesquisa investigou o ponto de equilíbrio exato: qual é a arquitetura mínima capaz de oferecer suporte pedagógico funcional, respeitando os severos limites de hardware dos SBCs.

6.6.3 Restrições de Hardware e Dados

Aprofunda os critérios técnicos que fundamentam a categorização e seleção dos modelos, baseando-se em dois pilares essenciais que determinam a viabilidade teórica de sua execução em SBCs:

6.7 Configuração dos Ambientes de Teste (Hardware)

Descreve o aparato físico e experimental montado para validar as hipóteses de viabilidade técnica e pedagógica do sistema AInclude. A metodologia adotada foi estruturada em fases incrementais de complexidade, partindo de um ambiente de controle confortável até a submissão dos modelos a hardwares com restrições severas de memória e processamento.

Tese de Doutorado | Capítulo 6

Anterior Capítulo 7

Capítulo 6: Metodologia Experimental e Engenharia de Dados

Índice do Capítulo

6.1 Enquadramento Metodológico: O Processo KDD

A Justificativa Metodológica

6.2 Engenharia de Dados e Curadoria Algorítmica

6.2.1 IA Centrada em Dados (Data-Centric AI)

6.2.2 Limite do Aprendizado com Dados Ruidosos

6.2.3 A Raiz do Problema: Ruído Normativo

6.2.4 O Efeito Letal: Diluição Semântica

6.3 Estratégia de Validação e Reprodutibilidade

Engenharia do Dataset V13

Isolamento de Teste

Determinismo Físico

Proporção de Treino

Impacto Metodológico

6.4 Arquitetura de Agentes (Personas) e Engenharia de Prompt

Prompting Estruturado e Restrição de Escopo

Domínio da Modalidade Escrita Formal

Tema e Estrutura Dissertativa

Coerência e Projeto de Texto

Mecanismos Linguísticos (Coesão)

Proposta de Intervenção

6.5 Métricas de Avaliação Multidimensional

6.5.1 Eixo de Precisão Pedagógica e Regressão

6.5.2 Eixo de Qualidade do Feedback (NLP)

6.5.3 Eixo de Estabilidade de Sistema

6.6 Protocolo de Seleção de Modelos

6.6.1 Detalhamento das Arquiteturas

6.6.2 Estratificação dos Modelos

O Propósito da Classe Standard

6.6.3 Restrições de Hardware e Dados

1. Densidade de Treinamento (Tokens)

2. Cálculo de Viabilidade de Memória (Quantização)

6.7 Configuração dos Ambientes de Teste (Hardware)

6.7.1 Ambiente de Desenvolvimento (Baseline x86)

6.7.2 Ambiente de Restrição Extrema

6.7.3 Ambiente de Validação Final