Applicazioni Agentiche con Gemini SDK, NodeS & TypeScript
Corso introduttivo per integrare l'AI generativa in applicazioni Node.js (v.24+) con TypeScript e l'SDK di Gemini

- Durata
- 8h
- Sessioni
- 2 da 4h
- Livello
- Base
Di cosa parla
questo corso.
Contesto, obiettivi e taglio del corso. Tutto è personalizzabile in base a stack e team — questa è la base di partenza.
INTRODUZIONE
Grazie alle più recenti API e a diversi SDK disponibili, tra cui Google GEN AI SDK, gli sviluppatori JavaScript possono ora integrare modelli linguistici avanzati (LLM) direttamente nelle loro applicazioni in modo molto semplice e veloce.
In questo corso imparerai a integrare le API di Google Gemini utilizzando TypeScript e (Node.js) per creare le prime applicazioni "intelligenti" capaci di comprendere e generare testo, immagini, audio e video.
Partiamo dall'impostazione delle API Key di Google ai concetti fondamentali che ogni sviluppatore dovrebbe conoscere per la creazione di applicazioni agentiche: gestione streaming, output strutturati e prompt multimodali, fino a tecniche più avanzate come il Function Calling (per estendere le capacità degli LLM e poter interagire con applicazioni esterne) o l'integrazione di MCP, ChatBot e molto altro.
Imparerai a costruire le prime applicazioni "agentiche" intelligenti in JavaScript con l'SDK Google GEN AI (facilmente portabili in framework e librerie come Angular, React, Vue, NextJS, ...).
COSA PUOI FARE
• Customer Support
• Analizzare e validare immagini e commenti inseriti da un CMS o dagli utenti
• Processare, analizzare ed estrapolare informazioni da documenti (PDF, Audio, Video, Docs, ...)
• Creare un'applicazione fitness che definisca un workout sulla base di parametri inseriti dall'utente
• Generare immagini con i modelli NanoBanana : ad esempio diverse colorazioni di un prodotto tramite il tuo CMS, versioni 3D di un ambiente 2D, permettere agli utenti di provare un indumento e così via
• Creare video con i modelli VEO: tramite queste API l'utente potrebbe ad esempio inviare una fotografia ad un sito web e provare un capo di abbigliamento generando un video demo o un'immagine
In generale, potrai realizzare qualunque altra idea ti venga in mente per analizzare, gestire e generare contenuti testuali, immagini, audio e video
OBIETTIVO DEL CORSO
Imparerai a gestire prompt Multimodali, a implementare chatbot con memoria storica e a sfruttare le capacità multimodali di Gemini per analizzare e generare dati e file multimediali.
Un percorso pratico e concreto per costruire applicazioni reali, sfruttando tutto il potenziale dell’ecosistema Google per l’AI generativa.
Se non hai mai integrato l’AI generativa in applicazioni web, questo corso rappresenta un eccellente punto di partenza per comprendere i concetti fondamentali per lo sviluppo di applicazioni agentiche.
I concetti appresi sono trasversali e riutilizzabili anche con altre piattaforme di intelligenza artificiale, come le API di OpenAI, Claude e altri modelli, rendendo il percorso valido indipendentemente dal provider scelto.
REQUISITI
async/await) ed è preferibile una conoscenza base di TypeScript.
È utile (ma non indispensabile) un minimo di confidenza di Node.js, ma i concetti sono applicabili anche ad ambienti Web standard. Nessuna conoscenza precedente di Machine Learning è necessaria.
Cosa vediamo,
in dettaglio.
Il programma viene rifinito con il team prima del corso, in base a stack, obiettivi e livello. Quella che vedi è la base: possiamo accelerare o approfondire dove serve e, se necessario, modificare il programma.
La maggior parte del corso è live-coding, con esempi pratici.
M01 Fondamenti e Setup
- 01Introduzione ai modelli Gemini
- 02Configurazione Google AI Studio e API Key
- 03Setup Node.js + SDK
@google/gen-ai - 04Prima chiamata REST e prima chiamata con SDK
M02 Conversazioni e Streaming
- 01Risposte in tempo reale con
generateContentStream - 02System Instructions e personalità del modello
- 03Structured Output: forzare l'output in JSON
- 04MultiTurn: AI Chat & History
- 05Budget, thinking level, ottimizzazione costi
- 06Parametri:
temperature,topP, …
- 01Risposte in tempo reale con
M03 Prompt multimodali, Tools, API
- 01File: caricamento e analisi di PDF e documenti
- 02Audio e Video: estrarre informazioni da file multimediali
- 03Grounding Tools: Google Search e Url Context
- 04Function Calling: invocare funzioni JavaScript
- 05Integrazione con MCP server
- 06Interactions API: state, tool orchestration, long-running task
- 07Introduzione alle File Search API per RAG semplici
M04 Immagini, Video e Audio
- 01Prompt Multimodali
- 02Image generation con i modelli e le API di Imagen/Nano Banana
- 03Video generation con i modelli e le API di Veo
- 04Introduzione al Text-to-Speech e Speech-to-Text
Prima di questo corso...
8h · BaseJavaScript per Front-End Developer
Un corso propedeutico sulle funzionalità di JavaScript che ogni sviluppatore front-end dovrebbe conoscere.
12h · IntermedioTypeScript per Front-End Developer
Sintassi e concetti TypeScript da conoscere prima di studiare Angular, React o qualunque altro framework.
Potrebbero piacerti anche...
8h · BaseGemini CLI & Antigravity
Sfrutta i più recenti strumenti AI di Google per scrivere codice: Antigravity, Gemini CLI e Google AI Studio.
6h · BaseClaude Code
Impara a usare Claude Code per assisterti nel tuo lavoro da developer: skills, context engineering, plan & spec-driven development.
12h · IntermedioApplicazioni Agentiche con Angular & Gemini SDK
Interfacce professionali per l'AI, dashboard per la generazione video con Veo e tool di image editing basati su Nano Banana.