vOx Oratória v3.0 • Open Source Release

Sua Oratória
Refinada por IA.

Feedback instantâneo sobre tom, ritmo e clareza. Sem servidores proprietários. Sem taxas mensais. Sua voz, seus dados, sua evolução.

FILOSOFIA CENTRAL

Privacidade Absoluta. Custo Zero.

Quebramos o modelo SaaS tradicional. Você não paga aluguel pelo software, você possui o software.

Dados no Navegador

Seus áudios e textos nunca saem do seu dispositivo, exceto para o processamento da IA que você controla. Usamos IndexedDB para persistência local segura.

Modelo BYOK

Bring Your Own Key. Conecte sua própria chave de API do Google Gemini (gratuita ou paga). Nós não intermediamos o acesso, garantindo transparência total de custos e privacidade.

Simplicidade Radical

Sem login. Sem senha. Sem cartão de crédito. Apenas digite seu nome e comece a treinar. O sistema lembra de você via armazenamento local.

FUNCIONALIDADES

O Ecossistema de Treino

Um laboratório completo para sua comunicação, do ensaio à performance.

Painel de Controle

Status da API, Desafios Ativos e Ações Rápidas. Gere resumos semanais da sua evolução com um clique.

Gravador Híbrido

Dupla tecnologia: Transcrição visual em tempo real (WebSockets) + Gravação de alta fidelidade (Blob) para garantir que nenhuma palavra seja perdida.

Análise Profunda

Diagnóstico de Clareza (0-10), Ritmo (WPM), Vícios de Linguagem e Mapa de Calor de Sentimentos. Feedback estrutural de Abertura e Conclusão.

Estúdio & Púlpito

Teleprompter automático que rola no seu ritmo. Editor de ensaio com 'Co-piloto IA' para refinar discursos e gerar ideias.

Simulação Q&A

Treine para sabatinas. Escolha a persona da banca (Investidor, Jornalista, Cliente) e responda perguntas geradas pela IA sobre seu tema.

Gamificação

Agente de Carreira que cria missões personalizadas (ex: 'Sprint de Clareza') e Skill Drills para corrigir fraquezas específicas.

DOCUMENTAÇÃO FUNCIONAL v3.0

Mapa Funcional: O Porquê e o Pra Quê

Dissecção dos módulos do sistema baseada no PRD oficial. Cada feature existe para resolver uma dor específica de comunicação.

01

Painel de Evolução (Dashboard)

  • Status da API: Alerta proativo se sua chave Gemini está válida ou expirada.
  • Desafios Dinâmicos: O sistema analisa suas fraquezas e cria missões (ex: 'Melhore a clareza para > 8').
  • Resumo Semanal IA: Um relatório executivo gerado automaticamente sobre seus últimos 7 dias.
O Porquê (A Dor)

Estudantes e profissionais perdem a motivação por não visualizarem progresso tangível. Treinar 'no vácuo' desmotiva.

O Pra Quê (A Solução)

Centralizar a jornada. O sistema não apenas mostra histórico, mas atua como um 'Agente de Carreira' que propõe desafios.

02

Gravador Híbrido Dual-Core

  • Gemini Live (WebSockets): Transcrição na tela em tempo real para você saber que está sendo ouvido.
  • MediaRecorder (Blob): Gravação de alta fidelidade em background para análise profunda pós-treino.
  • Correção de Race Condition: O sistema re-transcreve o áudio final para garantir 100% de precisão.
O Porquê (A Dor)

Gravadores web comuns falham. Latência de rede corta palavras e feedback visual lento quebra o fluxo de pensamento.

O Pra Quê (A Solução)

Captura perfeita + Feedback instantâneo. Usamos duas tecnologias em paralelo.

03

Relatório de Diagnóstico

  • Clareza (0-10): Algoritmo que avalia estrutura, dicção e coerência.
  • Vícios de Linguagem: Contador automático de 'né', 'tipo', 'tá' com gráficos de barras.
  • Mapa de Calor: Análise de sentimento (Positivo/Negativo/Neutro) frase a frase.
O Porquê (A Dor)

O feedback humano ('foi bom') é subjetivo e vago. Você não sabe exatamente o que corrigir.

O Pra Quê (A Solução)

Métricas quantitativas e acionáveis. Transformar 'acho que falei rápido' em 'você falou a 180 PPM'.

04

Simulador de Banca (Q&A)

  • Personas Configuráveis: Treine contra um 'Investidor Cético', um 'Cliente Irritado' ou um 'Jornalista'.
  • Contexto Real: A IA gera perguntas baseadas especificamente no conteúdo que você acabou de apresentar.
  • Feedback de Resposta: Avaliação imediata da sua capacidade de improviso e defesa.
O Porquê (A Dor)

A apresentação é fácil, a sabatina é o caos. O branco acontece quando surge uma pergunta inesperada.

O Pra Quê (A Solução)

Stress Testing controlado. Treinar o cérebro para responder sob pressão.

05

Estúdio & Púlpito

  • Co-piloto de Escrita: Peça para a IA 'melhorar a introdução' ou 'criar uma metáfora' durante a escrita.
  • Teleprompter Inteligente: Rola o texto baseado na sua velocidade de fala estimada (WPM).
  • Geração de Imagem: Criação de conceitos visuais para slides baseados no seu texto.
O Porquê (A Dor)

Escrever o discurso e treinar a fala são processos desconectados. Papel não tem teleprompter.

O Pra Quê (A Solução)

Ambiente de refinamento. Escreva, melhore com IA e leia no ritmo certo.

UNDER THE HOOD

Stack Moderna &
IA de Ponta

Frontend Core

React 19 + TypeScript + Vite

Performance máxima e tipagem estática para robustez.

Persistência

IndexedDB (idb)

Banco de dados NoSQL completo rodando dentro do seu navegador.

AI Integration

Google GenAI SDK v1.30+

Conexão direta com os modelos Gemini sem intermediários.

Modelos Utilizados:

gemini-2.5-flashgemini-3.0-proimagen-3
const analyzeSpeech = async (audioBlob) => {
// 1. Processamento Local
const metrics = calculateWPM(audioBlob);
// 2. Chamada Direta (Client-to-Google)
const genAI = new GoogleGenAI(userApiKey);
const model = genAI.getGenerativeModel({ model: 'gemini-2.5-flash' });
// 3. Prompt de Engenharia (Feedback)
const result = await model.generateContent([
"Atue como um coach de oratória...",
audioBlob
]);
// 4. Salvar Localmente
await db.sessions.add({ ...result, date: new Date() });
}

Próximos Passos

PWA Nativo

Instalação no Desktop e Mobile para experiência full-screen.

Internacionalização

Suporte nativo para Inglês e Espanhol (i18n).

Acessibilidade

Melhorias ARIA para leitores de tela e navegação por teclado.

Sua evolução começa agora.

Junte-se à comunidade Open Source e ajude a construir o futuro da oratória digital.