Comparteix:

Forma't

Forma't en la intel·ligència artificial generativa

Comparteix:

Què és la intel·ligència artificial?

La intel·ligència artificial és una tecnologia que permet als ordinadors replicar tasques pròpies de la intel·ligència humana com:

  • Prendre decisions: les eines que t’ofereixen recomanacions de pel·lícules o rutes de GPS en serien un exemple.
  • Reconèixer patrons: les eines que identifiquen cares en fotos o que tradueixen veu a text serien eines que utilitzen la IA.
  • Analitzar informació: són eines que llegeixen i processen grans quantitats de dades.
  • Crear contingut senzill: com les respostes automàtiques en xats o correus.

Comparteix:

Què és la intel·ligència artificial generativa?

És aquella part de la IA que té per objectiu la creació de contingut nou i original a partir de dades d’entrenament. Pot generar text, imatges, música, vídeos, codi informàtic, veu a partir d’una instrucció que s’anomena prompt i de l’anàlisi de fitxers o imatges que li puguis adjuntar.

Comparteix:

Com funciona la intel·ligència artificial generativa?

La intel·ligència artificial generativa s’ha entrenat tot processant molts continguts (tots els llibres del món, webs, notícies mundials...) i a partir d’aquí a generat un model que s’anomena Large Language Model.

A partir d’aquest entrenament, la intel·ligència artificial generativa és capaç de generar text predient quina és la paraula que té majors probabilitats d’aparèixer després d’una altra.

També la IA generativa analitza el prompt i intenta entendre què li demanes a partir de les instruccions que li dones i a partir d’aquí generar una resposta.

Aquestes respostes són refinades a partir d’un equip multidisciplinari d’experts que li donen feedback respecte com podrien millorar les respostes i la IA incorpora aquest feedback.

També quan proveeix una resposta, totes les persones usuàries poden donar-li feedback que també incorpora per millorar les respostes que dona.

Comparteix:

Com genera la IA generativa una resposta?

La resposta la genera a partir de la instrucció amb llenguatge natural que li hagis indicat en el prompt i de l’anàlisi de documents o imatges adjunts. També té en compte el context de la conversa (preguntes i respostes) que hem tingut prèviament a la conversa. I finalment, de les dades d’entrenament LLM que ha utilitzat d’entrenament.

Comparteix:

Què és un prompt?

Un prompt és una instrucció amb llenguatge natural que la IA generativa interpreta i utilitza per a generar el text com a resposta tenint en compte el context de la conversa que has tingut amb ella.

Comparteix:

Què és un LLM?

Imagina que parles amb una persona increïblement culta que ha llegit gairebé tots els llibres del món, totes les converses d'internet i tota la Viquipèdia. Aquesta persona no només ha memoritzat tota aquesta informació, sinó que ha après a reconèixer patrons, a relacionar idees i a entendre com es connecten les paraules per formar frases amb sentit, poemes, resums o fins i tot codi informàtic.

Un LLM (Large Language Model o Model Lingüístic Gran) de la IA generativa és, en essència, una cosa molt semblant a aquesta persona súper culta, però en forma de programa d'ordinador.

Ho desglossem:

  • Model Lingüístic: És un programa informàtic dissenyat per entendre i treballar amb el llenguatge humà. Com quan dues persones parlen, però en versió digital.
  • Gran (Large): Se l'anomena "gran" per la immensa, gegantina quantitat de text amb què ha estat entrenat. Pensa en biblioteques senceres, en tota la Viquipèdia, en milions de pàgines web. Aquesta "lectura" massiva li permet aprendre les regles de la gramàtica, l'estil, els matisos i el coneixement general sobre el món.
  • IA Generativa: Aquí hi ha la clau. No es limita a repetir la informació que ha après de memòria. És "generativa", la qual cosa significa que pot crear contingut nou i original a partir dels patrons que ha après. És com si, en lloc de citar un llibre, aquella persona súper culta et donés una explicació original amb les seves pròpies paraules, o t'escrivís un poema nou inspirat en l'estil d'un autor famós.

En resum, un LLM és com un cervell digital gegant que ha après a parlar, escriure i raonar a partir d'una quantitat massiva de text, i que pot fer servir aquest coneixement per generar respostes i textos completament nous.

Cada LLM és diferent i ha estat entrenant de forma diferents així que tindran comportaments diferents en aspectes com:

  • Precisió i Fiabilitat: Com de correctes són les seves respostes? Inventa dades (el que s'anomena "al·lucinació") o es basa en fets contrastats? Per a tasques de recerca o feina, aquest és el factor més important.
  • Raonament i Lògica: És capaç de resoldre problemes complexos, seguir instruccions amb diversos passos o entendre un raonament abstracte? Pots provar-ho amb problemes matemàtics, trencaclosques lògics o demanant-li que planifiqui una estratègia.
  • Creativitat: Té la capacitat de generar textos originals, imaginatius i amb un estil concret? Això és clau si el vols per a escriure guions, poemes, lletres de cançons o idees de màrqueting.
  • Coherència i Fluïdesa: El text que genera és natural, coherent i fàcil de llegir? Manté el fil de la conversa en xats llargs?
  • Capacitats Multimodals: Pot entendre més enllà del text? i entendre imatges, documents (PDFs), àudio i fins i tot vídeo o gràfiques?
  • Coneixement Actualitzat: Fins a quina data està actualitzat el seu coneixement? Alguns models tenen accés a Internet en temps real i poden donar-te informació sobre esdeveniments molt recents. Altres tenen una "data de tall" i no coneixen res que hagi passat després.
  • Amplitud de la "Finestra de Context": La finestra de context indica quanta informació és capaç de recordar el LLM? Com més gran sigui el context, més recordarà el que ja li has dit o pots donar-li documents molt llargs (fins i tot llibres sencers) i serà capaç de respondre preguntes sobre tot el contingut sense perdre's.
  • Rendiment en Idiomes: Com funciona en tots els idiomes? Encara que molts models són multilingües, la seva qualitat pot variar molt. És important provar-los específicament en l'idioma que faràs servir més.
  • Velocitat: Com de ràpid genera les respostes? Per a un ús fluid i conversacional, la velocitat és important. Models recents com GPT-4o o Claude 3.5 Sonnet han millorat molt en aquest aspecte.
  • Accessibilitat i Cost: Hi ha una versió gratuïta? Quines funcionalitats extra ofereix la versió de pagament? Si ets desenvolupador, té una API fàcil d'utilitzar i a un preu raonable?
  • Censura i Seguretat: Quines són les seves barreres ètiques? Alguns models són més conservadors o restrictius que altres a l'hora de tractar temes sensibles.