ai-studio-image
Geracao de imagens humanizadas via Google AI Studio (Gemini). Fotos realistas estilo influencer ou educacional com iluminacao natural e imperfeicoes sutis.
What this skill does
# AI Studio Image — Especialista em Imagens Humanizadas ## Overview Geracao de imagens humanizadas via Google AI Studio (Gemini). Fotos realistas estilo influencer ou educacional com iluminacao natural e imperfeicoes sutis. ## When to Use This Skill - When the user mentions "gera imagem" or related topics - When the user mentions "gerar foto" or related topics - When the user mentions "criar imagem" or related topics - When the user mentions "foto realista" or related topics - When the user mentions "imagem humanizada" or related topics - When the user mentions "foto influencer" or related topics ## Do Not Use This Skill When - The task is unrelated to ai studio image - A simpler, more specific tool can handle the request - The user needs general-purpose assistance without domain expertise ## How It Works A diferenca entre uma imagem de IA e uma foto real esta nos detalhes imperceptiveis: a leve granulacao de um sensor de celular, a iluminacao que nao e perfeita, o enquadramento ligeiramente descentralizado, a profundidade de campo caracteristica de uma lente pequena. Esta skill injeta sistematicamente essas qualidades em cada geracao. ## Ai Studio Image — Especialista Em Imagens Humanizadas Skill de geracao de imagens via Google AI Studio que transforma qualquer prompt em fotos com aparencia genuinamente humana. Cada imagem gerada parece ter sido tirada por uma pessoa real com seu celular — nao por uma IA. ## 1. Configurar Api Key O usuario precisa de uma API key do Google AI Studio: - Acesse https://aistudio.google.com/apikey - Crie ou copie sua API key - Configure como variavel de ambiente: ```bash ## Windows set GEMINI_API_KEY=sua-api-key-aqui ## Linux/Mac export GEMINI_API_KEY=sua-api-key-aqui ``` Ou crie um arquivo `.env` em `C:\Users\renat\skills\ai-studio-image\`: ``` GEMINI_API_KEY=sua-api-key-aqui ``` ## 2. Instalar Dependencias ```bash pip install -r C:\Users\renat\skills\ai-studio-image\scripts\requirements.txt ``` ## 3. Gerar Sua Primeira Imagem ```bash python C:\Users\renat\skills\ai-studio-image\scripts\generate.py --prompt "mulher jovem tomando cafe em cafeteria" --mode influencer --format square ``` ## Workflow Principal Quando o usuario pedir para gerar uma imagem, siga este fluxo: ## Passo 1: Identificar O Modo Pergunte ou deduza pelo contexto: | Modo | Quando Usar | Caracteristicas | |------|-------------|-----------------| | **influencer** | Posts de redes sociais, lifestyle, branding pessoal | Estetica atraente mas natural, cores vibrantes sem saturacao excessiva, composicao que prende atencao | | **educacional** | Material de curso, tutorial, apresentacao, infografico | Visual limpo, profissional, foco no conteudo, elementos claros e legiveis | Se o usuario nao especificar, use **influencer** como padrao para conteudo de redes sociais e **educacional** para qualquer coisa relacionada a ensino/apresentacao. ## Passo 2: Identificar O Formato | Formato | Aspect Ratio | Uso Ideal | |---------|-------------|-----------| | `square` | 1:1 | Feed Instagram, Facebook, perfis | | `portrait` | 3:4 | Instagram portrait, Pinterest | | `landscape` | 16:9 | YouTube thumbnails, banners, desktop | | `stories` | 9:16 | Instagram/Facebook Stories, TikTok, Reels | Se nao especificado, deduza pelo contexto (stories → 9:16, feed → 1:1, etc). ## Passo 3: Transformar O Prompt **Esta e a etapa mais importante.** Nunca envie o prompt do usuario diretamente para a API. Sempre passe pelo motor de humanizacao: ```bash python C:\Users\renat\skills\ai-studio-image\scripts\prompt_engine.py --prompt "prompt do usuario" --mode influencer ``` O motor de humanizacao adiciona camadas de realismo: **Camada 1 — Dispositivo e Tecnica:** - Fotografado com smartphone (iPhone/Samsung Galaxy) - Lente de celular com profundidade de campo natural - Sem flash — apenas luz ambiente - Leve ruido de sensor (ISO elevado em baixa luz) **Camada 2 — Iluminacao Natural:** - Luz do sol indireta / golden hour / luz de janela - Sombras suaves e organicas - Sem iluminacao de estudio - Reflexos naturais em superficies **Camada 3 — Imperfeicoes Humanas:** - Enquadramento ligeiramente imperfeito (nao centralizado matematicamente) - Foco seletivo natural (algo levemente fora de foco no background) - Micro-tremor de maos (nitidez nao e absoluta) - Elementos aleatorios do ambiente real **Camada 4 — Autenticidade:** - Expressoes faciais genuinas (nao poses de estudio) - Roupas e cenarios do dia-a-dia - Textura de pele real (poros, marcas sutis — sem pele de porcelana) - Proporcoes corporais realistas **Camada 5 — Contexto Ambiental:** - Cenarios reais (nao fundos genericos de stock) - Objetos do cotidiano no ambiente - Iluminacao consistente com o cenario - Hora do dia coerente com a atividade ## Passo 4: Gerar A Imagem ```bash python C:\Users\renat\skills\ai-studio-image\scripts\generate.py \ --prompt "prompt humanizado gerado no passo anterior" \ --mode influencer \ --format square \ --model gemini-2-flash-exp \ --output C:\Users\renat\skills\ai-studio-image\data\outputs\ ``` **Modelos disponiveis (em ordem de recomendacao):** | Modelo | Velocidade | Qualidade | Custo | Uso Ideal | |--------|-----------|-----------|-------|-----------| | `gemini-2-flash-exp` | Rapido | Alta | **GRATIS** | **Padrao — usar sempre** | | `imagen-4` | Medio | Alta | $0.03/img | Alta qualidade (requer --force-paid) | | `imagen-4-ultra` | Lento | Maxima | $0.06/img | Impressao, 2K (requer --force-paid) | | `imagen-4-fast` | Rapido | Boa | $0.02/img | Volume alto (requer --force-paid) | | `gemini-flash-image` | Rapido | Alta | $0.039/img | Edicao de imagem (requer --force-paid) | | `gemini-pro-image` | Medio | Maxima+4K | $0.134/img | Referencia, 4K (requer --force-paid) | ## Passo 5: Apresentar E Iterar Mostre o resultado ao usuario. Se precisar ajustar: - Reluz: Ajustar iluminacao - Reenquadrar: Mudar composicao - Mais/menos natural: Ajustar nivel de imperfeicoes - Mudar cenario: Alterar ambiente ## Templates Pre-Configurados Para cenarios comuns, use templates prontos. Execute: ```bash python C:\Users\renat\skills\ai-studio-image\scripts\templates.py --list ``` Templates disponiveis: ## Modo Influencer | Template | Descricao | |----------|-----------| | `cafe-lifestyle` | Pessoa em cafeteria/restaurante com bebida/comida | | `outdoor-adventure` | Atividade ao ar livre, natureza, viagem | | `workspace-minimal` | Mesa de trabalho elegante, home office | | `fitness-natural` | Exercicio/wellness com visual natural | | `food-flat-lay` | Comida vista de cima, flat lay casual | | `urban-street` | Cenario urbano, street style | | `golden-hour-portrait` | Retrato com luz dourada do por-do-sol | | `mirror-selfie` | Selfie no espelho, casual e espontaneo | | `product-in-use` | Produto sendo usado naturalmente por pessoa | | `behind-scenes` | Bastidores, making of, dia-a-dia real | ## Modo Educacional | Template | Descricao | |----------|-----------| | `tutorial-step` | Pessoa demonstrando passo de tutorial | | `whiteboard-explain` | Pessoa explicando em quadro/lousa | | `hands-on-demo` | Maos fazendo demonstracao pratica | | `before-after` | Comparacao antes/depois | | `tool-showcase` | Ferramenta/software sendo utilizado | | `classroom-natural` | Ambiente de aula/workshop | | `infographic-human` | Pessoa apontando para dados/graficos | | `interview-setup` | Setup de entrevista/podcast natural | | `screen-recording-human` | Pessoa com notebook mostrando tela | | `team-collaboration` | Equipe trabalhando junta naturalmente | Usar template: ```bash python C:\Users\renat\skills\ai-studio-image\scripts\generate.py \ --template cafe-lifestyle \ --custom "mulher ruiva, 30 anos, lendo livro" \ --format square ``` ## Nivel De Humanizacao Controle quanto "imperfeicao" injetar: | Nivel | Efeito | |-------|--------| | `ultra` | Maximo realismo — parece 100% foto de celular | | `natural` (padrao) | Equilibrio perfeito entre qualidade e realismo | | `polished`
Related in Image & Video
watch
IncludedWatch a video (URL or local path). Downloads with yt-dlp, extracts auto-scaled frames with ffmpeg, pulls the transcript from captions (or Whisper API fallback), and hands the result to Claude so it can answer questions about what's in the video.
physical-ai-defect-image-generation
IncludedUse when the user wants to orchestrate defect image generation, run associated setup, or handle outputs on OSMO. The Day 0 path handles cold-start with USD-to-ROI, image-edit augmentation, and AnomalyGen to create initial PCBA datasets. The Day 1 path performs inference and labeling on real images. This skill helps with first-time asset setup, creation of finetuning checkpoints, and configuring deployment. Trigger keywords: defect image generation, dig workflow, dig pipeline, defect image detection workflow, aoi pipeline, aoi anomalygen, usd2roi anomalygen, day 0 pcba, day 1 pcba, day 1 real-photo alignment, day 1 manual roi, metal surface anomaly, glass defect, anomalygen finetune, setup_pcb, setup_metal, setup_glass, setup_pretrained, dig setup, dig datasets, dig pretrained checkpoint, dig image-edit endpoint.
accelint-react-best-practices
IncludedReact performance optimization and best practices. ALWAYS use this skill when working with any React code - writing components, hooks, JSX; refactoring; optimizing re-renders, memoization, state management; reviewing for performance; fixing hydration mismatches; debugging infinite re-renders, stale closures, input focus loss, animations restarting; preventing remounting; implementing transitions, lazy initialization, effect dependencies. Even simple React tasks benefit from these patterns. Covers React 19+ (useEffectEvent, Activity, ref props). Triggers - useEffect, useState, useMemo, useCallback, memo, inline components, nested components, components inside components, re-render, performance, hydration, SSR, Next.js, useDeferredValue, combined hooks.
elevenlabs-agents
IncludedBuild conversational AI voice agents with ElevenLabs Platform using React, JavaScript, React Native, or Swift SDKs. Configure agents, tools (client/server/MCP), RAG knowledge bases, multi-voice, and Scribe real-time STT. Use when: building voice chat interfaces, implementing AI phone agents with Twilio, configuring agent workflows or tools, adding RAG knowledge bases, testing with CLI "agents as code", or troubleshooting deprecated @11labs packages, Android audio cutoff, CSP violations, dynamic variables, or WebRTC config. Keywords: ElevenLabs Agents, ElevenLabs voice agents, AI voice agents, conversational AI, @elevenlabs/react, @elevenlabs/client, @elevenlabs/react-native, @elevenlabs/elevenlabs-js, @elevenlabs/agents-cli, elevenlabs SDK, voice AI, TTS, text-to-speech, ASR, speech recognition, turn-taking model, WebRTC voice, WebSocket voice, ElevenLabs conversation, agent system prompt, agent tools, agent knowledge base, RAG voice agents, multi-voice agents, pronunciation dictionary, voice speed control, elevenlabs scribe, @11labs deprecated, Android audio cutoff, CSP violation elevenlabs, dynamic variables elevenlabs, case-sensitive tool names, webhook authentication
humanizer
IncludedHumanize AI-generated text by detecting and removing patterns typical of LLM output. Rewrites text to sound natural, specific, and human. Uses 28 pattern detectors, 560+ AI vocabulary terms across 3 tiers, and statistical analysis (burstiness, type-token ratio, readability) for comprehensive detection. Use when asked to humanize text, de-AI writing, make content sound more natural/human, review writing for AI patterns, score text for AI detection, or improve AI-generated drafts. Covers content, language, style, communication, and filler categories.
generating-mermaid-diagrams
IncludedSalesforce architecture diagrams using Mermaid with ASCII fallback. Use this skill when generating text-based diagrams for Salesforce architecture, OAuth flows, ERDs, integration sequences, or Agentforce structure. TRIGGER when: user says "diagram", "visualize", "ERD", or asks for sequence diagrams, flowcharts, class diagrams, or architecture visualizations in Mermaid. DO NOT TRIGGER when: user wants PNG/SVG image output (use generating-visual-diagrams), or asks about non-Salesforce systems.