FabioBiondi.
← tutti i corsi
// corso · 2026aiNEW

Applicazioni Agentiche con Gemini SDK, NodeS & TypeScript

Corso introduttivo per integrare l'AI generativa in applicazioni Node.js (v.24+) con TypeScript e l'SDK di Gemini

Durata
8h
Sessioni
2 da 4h
Livello
Base
[ descrizione ]

Di cosa parla
questo corso.

Contesto, obiettivi e taglio del corso. Tutto è personalizzabile in base a stack e team — questa è la base di partenza.

§01

INTRODUZIONE

L'intelligenza artificiale non è più solo per i data scientist.
Grazie alle più recenti API e a diversi SDK disponibili, tra cui Google GEN AI SDK, gli sviluppatori JavaScript possono ora integrare modelli linguistici avanzati (LLM) direttamente nelle loro applicazioni in modo molto semplice e veloce.

In questo corso imparerai a integrare le API di Google Gemini utilizzando TypeScript e (Node.js) per creare le prime applicazioni "intelligenti" capaci di comprendere e generare testo, immagini, audio e video.

Partiamo dall'impostazione delle API Key di Google ai concetti fondamentali che ogni sviluppatore dovrebbe conoscere per la creazione di applicazioni agentiche: gestione streaming, output strutturati e prompt multimodali, fino a tecniche più avanzate come il Function Calling (per estendere le capacità degli LLM e poter interagire con applicazioni esterne) o l'integrazione di MCP, ChatBot e molto altro.

Imparerai a costruire le prime applicazioni "agentiche" intelligenti in JavaScript con l'SDK Google GEN AI (facilmente portabili in framework e librerie come Angular, React, Vue, NextJS, ...).

§02

COSA PUOI FARE

Ecco alcuni esempi pratici di ciò che potrai integrare nelle tue applicazioni (Node.js o Web) tramite l'utilizzo di Gemini e del suo SDK:
Customer Support
Analizzare e validare immagini e commenti inseriti da un CMS o dagli utenti
Processare, analizzare ed estrapolare informazioni da documenti (PDF, Audio, Video, Docs, ...)
Creare un'applicazione fitness che definisca un workout sulla base di parametri inseriti dall'utente
Generare immagini con i modelli NanoBanana : ad esempio diverse colorazioni di un prodotto tramite il tuo CMS, versioni 3D di un ambiente 2D, permettere agli utenti di provare un indumento e così via
Creare video con i modelli VEO: tramite queste API l'utente potrebbe ad esempio inviare una fotografia ad un sito web e provare un capo di abbigliamento generando un video demo o un'immagine

In generale, potrai realizzare qualunque altra idea ti venga in mente per analizzare, gestire e generare contenuti testuali, immagini, audio e video

§03

OBIETTIVO DEL CORSO

Il corso fornisce le nozioni fondamentali per la creazione delle tue prime applicazioni JavaScript "AI Powered".
Imparerai a gestire prompt Multimodali, a implementare chatbot con memoria storica e a sfruttare le capacità multimodali di Gemini per analizzare e generare dati e file multimediali.
Un percorso pratico e concreto per costruire applicazioni reali, sfruttando tutto il potenziale dell’ecosistema Google per l’AI generativa.

Se non hai mai integrato l’AI generativa in applicazioni web, questo corso rappresenta un eccellente punto di partenza per comprendere i concetti fondamentali per lo sviluppo di applicazioni agentiche.

I concetti appresi sono trasversali e riutilizzabili anche con altre piattaforme di intelligenza artificiale, come le API di OpenAI, Claude e altri modelli, rendendo il percorso valido indipendentemente dal provider scelto.

§04

REQUISITI

È richiesta una buona conoscenza di JavaScript (ES6+), in particolare la gestione della programmazione asincrona (Promise e async/await) ed è preferibile una conoscenza base di TypeScript.

È utile (ma non indispensabile) un minimo di confidenza di Node.js, ma i concetti sono applicabili anche ad ambienti Web standard. Nessuna conoscenza precedente di Machine Learning è necessaria.
[ programma ]

Cosa vediamo,
in dettaglio.

Il programma viene rifinito con il team prima del corso, in base a stack, obiettivi e livello. Quella che vedi è la base: possiamo accelerare o approfondire dove serve e, se necessario, modificare il programma.
La maggior parte del corso è live-coding, con esempi pratici.

4 moduli · 21 argomenti
  1. M01

    Fondamenti e Setup

    • Introduzione ai modelli Gemini
    • Configurazione Google AI Studio e API Key
    • Setup Node.js + SDK @google/gen-ai
    • Prima chiamata REST e prima chiamata con SDK
  2. M02

    Conversazioni e Streaming

    • Risposte in tempo reale con generateContentStream
    • System Instructions e personalità del modello
    • Structured Output: forzare l'output in JSON
    • MultiTurn: AI Chat & History
    • Budget, thinking level, ottimizzazione costi
    • Parametri: temperature, topP, …
  3. M03

    Prompt multimodali, Tools, API

    • File: caricamento e analisi di PDF e documenti
    • Audio e Video: estrarre informazioni da file multimediali
    • Grounding Tools: Google Search e Url Context
    • Function Calling: invocare funzioni JavaScript
    • Integrazione con MCP server
    • Interactions API: state, tool orchestration, long-running task
    • Introduzione alle File Search API per RAG semplici
  4. M04

    Immagini, Video e Audio

    • Prompt Multimodali
    • Image generation con i modelli e le API di Imagen/Nano Banana
    • Video generation con i modelli e le API di Veo
    • Introduzione al Text-to-Speech e Speech-to-Text

Pronto a portarlo nel tuo team?

Contattami →