Voltar ao Capítulo 7
Veredicto Final

Capítulo 8: Conclusões e Trabalhos Futuros

O Capítulo 8 estrutura a consolidação dos achados experimentais e as diretrizes de implantação do Framework AInclude, confirmando a viabilidade da execução de Inteligência Artificial offline em hardware de baixo custo.

Objetivos

8.1 Síntese do Cumprimento dos Objetivos

Apresenta o sucesso do framework ao atender integralmente aos objetivos traçados, que incluem a criação de uma arquitetura multiagente, o desenvolvimento do Dataset V13, a execução offline otimizada em hardware de borda, a validação de métricas de erro estatisticamente equivalentes à correção humana e o mapeamento rigoroso dos limites operacionais termo-físicos.

8.1.1 Decisões de Engenharia e Tríade

A investigação atesta inequivocamente que a qualidade e a densidade instrucional dos dados de treino superam a capacidade bruta de parâmetros das redes neurais. Com base nisto, instituiu-se a "Tríade de Viabilidade":

Mistral 7B

Consolidou-se como o teto técnico absoluto e padrão-ouro de referência qualitativa para a pesquisa.

Qwen 2.5

Afirmou-se como uma alternativa híbrida robusta viabilizada rigorosamente via engenharia de prompt restritiva.

Phi-3 Mini

Tornou-se a escolha titular definitiva, representando o equilíbrio ideal entre inteligência e baixo custo de processamento local.

Retrospectiva

8.2 a 8.6 Sínteses Críticas das Fases Laboratoriais

Esta secção promove uma consolidação cronológica rigorosa das cinco etapas da investigação empírica, mapeando a evolução do framework desde a prova de conceito básica até ao teste físico limitante em ambiente de produção na borda.

8.2 Síntese Crítica da Fase 1

Analisa a prova de conceito inicial executada num processador padrão. Demonstra que, embora tenha provado que a IA pode residir no dispositivo sem internet, as limitações foram latentes:

Limite Operacional

O tempo de resposta alertou que modelos genéricos seriam inviáveis em computadores de placa única, exigindo obrigatoriamente a adoção de técnicas avançadas de quantização de pesos.

8.3 Síntese Crítica da Fase 2

Avalia a orquestração do fluxo de inferência e detalha a decisão crucial que fundamentou o abandono do RAG em prol de uma solução mais performática para a borda:

8.3.1 Transição de RAG para SFT

O RAG foi abandonado por sobrecarregar a memória VRAM. O Fine-Tuning internalizou o conhecimento pedagógico, reduziu o consumo de memória, permitiu raciocínio semântico profundo e garantiu 100% de sucesso estrutural.

8.4 Síntese Crítica da Fase 3

Refuta categoricamente a hipótese de que o volume bruto de dados compensaria a falta de curadoria em modelos de IA, provando que a densidade instrucional é o fator determinante do sucesso:

8.4.1 Envenenamento

O uso de bases ruidosas (com falhas de OCR) fez a máquina mimetizar erros estruturais e corromper as saídas em JSON.

8.4.2 Esquecimento Catastrófico

A inteligência nativa das LLMs não compensa dados ruins, resultando na imperativa construção de uma topologia multiagente contextualizada.

8.4.3 Redirecionamento

A pesquisa passou a focar na precisão estrutural e no isolamento de competências para suprimir definitivamente as alucinações gramaticais.

8.5 Síntese Crítica da Fase 4

Comprova que a reengenharia e a organização estrutural do Dataset V13 corrigiram todas as falhas sistémicas anteriores, superando a necessidade de escala paramétrica do modelo:

8.5.1 Universalização Estrutural

Demonstra que o refinamento dos dados garantiu uma taxa de sucesso estrutural de 100% (geração de JSON válido) em todas as arquiteturas.

8.5.2 Colapso da Precisão

Revela a rejeição de 50% dos modelos. Estes apresentavam taxas de erro baixas por conveniência estatística (atribuindo notas centrais sistematicamente).

8.5.3 Mitigação via Software

Mostra que o uso de guardrails (camadas lógicas no prompt) conseguiu estabilizar arquiteturas oscilantes, ancorando as predições à grelha oficial.

8.6 Síntese Crítica da Fase 5

Descreve a auditoria e os testes de estresse com o hardware operando 100% offline, provando que a inferência local na borda é um desafio primariamente termodinâmico e físico:

8.6.1 Gargalo Termodinâmico

Mapeia limites severos de I/O em cartões microSD (latências de 45s e descarte de cache) e evidencia o estrangulamento térmico que derruba o desempenho.

8.6.2 Paradoxo do Alinhamento

Expõe que, sob estresse, modelos mais densos adotam o Fail-Safe (respostas vazias). Modelos menores sofrem degradação lógica e alucinação térmica.

8.6.3 Veredito Arquitetural

Estabelece como obrigatória a adoção de Armazenamento de Estado Sólido (NVMe) e Gerenciamento Térmico Ativo para sustentar o sistema operacionalmente.

Veredicto

8.7 Veredito Final: A Tríade de Viabilidade

Redefine e consagra os papéis funcionais dos modelos após os testes de estresse físico, compondo uma orquestração inteligente e modular adaptável a diferentes cenários e capacidades de hardware.

Orquestração Modular

Mistral 7B

Atua como motor de alta performance e padrão ouro de referência. Requer hardware superior (>8GB VRAM).

Phi-3 Mini

Motor de agilidade titular. Equilíbrio ideal, estritamente condicionado a refrigeração ativa para não alucinar.

Qwen 1.8B

Motor de resiliência e redundância para borda estrita, ancorado através de engenharia de prompt restritiva.

Maturidade

8.8 TRL e Validação da Arquitetura

Mapeia a trajetória de desenvolvimento empírico do projeto segundo a rígida escala de Níveis de Maturidade Tecnológica (TRL - Technology Readiness Level) baseada na norma ISO 16290, atestando a evolução funcional do sistema.

Maturidade do Framework

8.8.1 Evolução Tecnológica

Descreve a jornada metodológica desde a exploração conceitual (TRL 1) até a materialização no TRL 6, transformando o projeto de simulações abstratas em nuvem para um dispositivo físico funcional embarcado.

8.8.2 Matriz Consolidada

Apresenta a consolidação formal que atesta os requisitos e as evidências colhidas, comprovando categoricamente o alcance do nível Demonstração do Sistema em Ambiente Relevante.

Visão a Longo Prazo

8.9 Trabalhos Futuros

Elenca o mapa de perspetivas e investigações técnicas delineadas para garantir o escalonamento, a governança e a criação de uma infraestrutura de software sustentável e duradoura para as próximas interações do framework.

Diretrizes de Evolução Sistémica

8.9.1 Interoperabilidade MCP

Adoção estrutural do protocolo para tornar o sistema agnóstico a modelos, permitir injeção dinâmica de manuais e conectar ferramentas externas de forma auditável.

8.9.2 Decodificação Restrita

Emprego de máscaras de vocabulário no inferidor para proibir fisicamente a IA de gerar formatos inválidos ou numerações inexistentes, garantindo o isolamento puro de competências.

8.9.3 Data Flywheel

Foco no Aprendizado Ativo, onde o sistema absorve continuamente as validações dos docentes para retroalimentar os pesos e mitigar vieses regionais dinamicamente.

8.9.4 Otimização Física SBC

Passos de hardware como SSD NVMe via PCIe, chamadas no Kernel (mlock) para fixar tensores na RAM e automação preditiva da refrigeração ativa.

Limitações

8.10 Limitações da Pesquisa

Mapeia frontalmente as restrições intrínsecas que permeiam a experimentação arquitetural e o uso em campo do framework, garantindo o devido distanciamento e imparcialidade rigorosa perante as tecnologias testadas.

Auditoria de Restrições

8.10.1 Infraestrutura Físicas

Dependência frágil de conversores de imagem para texto, gargalos de I/O em cartões de memória, redução forçada da taxa de geração por calor e degradação semântica pela compressão estrutural de pesos.

8.10.2 Cognitivas e Processamento

Alucinação termicamente induzida, vulnerabilidade a mudanças nas regras de correção (pesos congelados), ausência de verificação factual offline e inexistência de memória evolutiva do histórico do aluno.

8.10.3 Especialização de Domínio

Risco residual inerente ao sobreajuste intencional, tornando improvável a generalização das capacidades analíticas do agente para outras bancas avaliativas ou géneros textuais divergentes sem um novo ciclo de treino.

Relevância

8.11 Considerações Finais

Encerra a tese documentando as reflexões capitais e sistémicas sobre a relevância de se posicionar soberanamente a capacidade inteligível na base comunitária em face do atual cenário de ensino formativo.

O Contexto Social e Diagnóstico

8.11.1 A Crise de Subjetividade

Utiliza como justificação empírica a crise avaliativa instalada pelas alterações ocultas em manuais técnicos, onde critérios eminentemente subjetivos geraram punições assimétricas imprevisíveis nos candidatos, clamando por agentes computacionais padronizados e auditáveis.

8.11.2 Inteligência Aumentada

Posiciona a IA educacional como uma Inteligência Aumentada análoga aos exames de imagem da medicina clínica. Uma ferramenta concebida unicamente para mapear lacunas e remover o fardo burocrático, devolvendo ao professor o tempo basilar para a mediação intelectual e humana que se revela insubstituível.

8.12 Produções da Tese

Esta subsecção garante a legitimidade metodológica da investigação científica realizada. Lista de forma estrutural as publicações, ensaios e produções bibliográficas validadas que fundamentaram a pesquisa perante o escrutínio académico das conferências avançadas de Informática e Educação.

Tese de Doutorado | Capítulo 8