Conceptos de Inteligencia artificial | Xyclos

Carlos Altamirano
16 abr 2023
14 Min. de lectura

Actualizado: 20 may

Conceptos de Inteligencia artificial | Artificial intelligence concept |Xyclos

Confundido entre GPT, LLM y AGI? Este glosario lo aclara todo

Vivimos en un mundo donde la inteligencia artificial evoluciona más rápido que nuestra capacidad para seguirla, entender sus conceptos fundamentales ya no es opcional: es esencial. Este blog no es solo una lista de términos técnicos; es una guía estratégica y actualizada que te lleva de la mano desde lo básico hasta lo emergente en IA.

Aquí desglosamos más de 70 conceptos —desde ChatGPT y Prompt Engineering, hasta Biological Intelligence Operating Systems— para ayudarte a dominar el nuevo lenguaje de la tecnología que está transformando empresas, empleos y decisiones.

¿Buscas algo específico? Usa Ctrl + F en tu navegador para encontrar cualquier término o sigla de manera instantánea.

GPT

GPT son las siglas de Generative Pre-trained Transformer.

GPT es una arquitectura diseñada por OpenAI para el procesamiento de lenguaje natural.

GPT como todos los modelos de lenguaje, ha sido entrenado con grandes volúmenes de contenido: texto, libros, artículos, sitios web.

Con este entrenamiento, los modelos aprenden la estructura y patrones del lenguaje y son usados para crear resúmenes, traducción y para responder preguntas que le hacen.

Chatbot

Es un programa que usa Inteligencia artificial y Procesamiento natural de lenguaje (Natural Language Processing - NLP), para simular una conversación con humanos.

ChatGPT (30.11.2022)

ChatGPT es una versión de GPT, ambos desarrollados con OpenAI; pero ChatGPT ha sido afinada para su uso como una aplicación de chatbot y diseñada para generar respuestas contextualmente relevantes y naturales a un input o Prompt de un usuario,

GPT-4 (14.03.2023)

También desarrollada por OpenAI, GPT-4 a diferencia de ChatGPT que solo acepta Prompts de texto, GPT-4 es más poderoso y complejo al realizar tareas y además a diferencia de ChatGPT acepta Prompts de imágenes y texto para construir respuestas textuales.

Prompt

Es un texto con un requerimiento específico, que activa al modelo o Inteligencia artificial para generar una respuesta contextualmente relevante, apropiada y gramaticalmente correcta.

Un Prompt o indicación puede ser largo o corto y puede incluir diferentes tipos de expresiones de lenguaje como: preguntas, comandos, oraciones o declaraciones.

Prompt Engineering

Es el proceso para crear un pedido claro, conciso y suficientemente contextualizado para que la Inteligencia artificial comprenda la intención del usuario y genere una respuesta relevante y satisfactoria.

Prompt injection

Es un ataque a una Inteligencia artificial para controlar los resultados de la respuesta, eludir la seguridad y manipular las respuestas

Hallucination

Una alucinación, es una respuesta proporcionada por una Inteligencia Artificial, que no tiene sentido, no se ajusta a contenido en el que ha sido entrenado, puede ser una desviación significativa del conocimiento en la cual fue entrenada o un desvío sin base en ningún conocimiento previo. Actualmente en el 2024, todas las empresas que desarrollan LLM's están conscientes de esto, aceptan su existencia y trabajan para descubrir cual es la causa. Un tema muy complejo.

Como usuarios, ahora que conocemos este comportamiento de la IA's, debemos siempre validar o verificar las respuestas que nos dan las IA's.

Token

Es una secuencia de caracteres que representa una unidad significativa de texto.

Tokenization

Es el proceso para descomponer una frase en unidades menos complejas como oraciones, palabras o caracteres para luego ser enviados para su proceso por la Inteligencia artificial.

Prompt - Tokenización - Proceso de análisis de Inteligencia artificial - re-Tokenización - Respuesta

Reverse tokenization

Es el proceso de tomar una secuencia de tokens y reconstruir el texto original o la oración que representan. Esto implica revertir el proceso de tokenización, que generalmente implica dividir un fragmento de texto en sus tokens o palabras componentes.

Generative AI

Los Modelos de Lenguaje de Gran Tamaño (Large Language Models, LLM) de Inteligencia Artificial generativa utilizan redes neuronales para identificar patrones y estructuras en un Prompt definido, y generar nuevo contenido o resultados de diversos tipos, como texto, imágenes, sonidos, animaciones, videos y modelos 3D. Ejemplos de IA's generativas incluyen ChatGPT, DALL-E, Bard, Bing, Perplexity, You, entre otros.

Auto-GPT (10.04.2023)

Es una aplicación experimental de código abierto, desarrollada en Python, que usa GPT-4 para generar contenido en forma autónoma.

Crea un Agente a partir de un objetivo que nosotros le proporcionamos (Prompt).

El Agente crea un plan y a su vez genera Prompts hasta conseguir un resultado u objetivo. En principio podemos decir que ahora, solo necesitamos crear un Prompt con el objetivo y Auto-GPT realiza todo lo necesario hasta conseguir el objetivo.

Agent

Es una entidad o programa independiente que observa y analiza un ambiente, aprende, razona y toma decisiones en forma autónoma para lograr un objetivo. Auto_GPT usa agentes para conseguir el objetivo.

LAMS

Large Action Models. Es un nuevo tipo de Inteligencia Artificial que toma acciones en el mundo real, a diferencia de los LLM (Large Lenguaje Model) que solo responden a prompts y no interactúan con el mundo real, como acceder a dispositivos, páginas web, aplicaciones y realizar acciones sobre ellos.

AI Agent device

Es un dispositivo que tiene integrado una Inteligencia artificial de tipo LAMS, a la que se le puede entrenar para interactuar con el propio dispositivo o también con otros dispositivos o aplicaciones. Rabbit R1 es un caso de este tipo de IA, otro es Humane de Open AI, Imbue y Adept Ai de otras compañías.

Artificial General Intelligence - AGI

Artificial General Intelligence es un modelo mas flexible, adaptable, amplio y avanzado que GPT, porque va a ser capaz de entender lenguaje natural, razonar, aprender, percibir y resolver problemas más complejos tal como lo hace el cerebro humano. La intención es que estos sistemas de AGI ,sean capaces de desempeñarse en forma autónoma, realizando tareas tal como lo hacemos los humanos. También se habla que hay dos tipos de inteligencias: Específicas como ChatGPT y Generales como Auto-GPT.

Artificial Narrow Intelligence (ANI)

Una Inteligencia Artificial Limitada, es un modelo de lenguaje diseñado para realizar una tarea en particular, por ejemplo ChatGPT interactúa via chat con el usuario via texto o voz y responde via texto o voz.

Otro ejemplo son las IA's que convierten texto a imagen, texto a video, texto a música. Solo están especializadas en una particular destreza.

BCI

Brain Computer Interface. Es un dispositivo implantado en el cerebro que entiende y analiza las señales del cerebro y que además está diseñado para comunicarse con un dispositivo externo para interactuar con el. Neuralink, empresa de Elon Musk, publicó el 29 de Enero, 2024, que ha realizado el primer implante de este tipo en un humano.

Computer vision

Visión por computadora o visión artificial (VLM - Vision_language Model), es un campo de la Inteligencia artificial enfocado en interpretar, entender, procesar y clasificar los componentes (pixeles) de una imagen o video para su posterior uso en diferentes aplicaciones que requieran usar esta característica.

Lip Sync

O Sincronización de labios, es una técnica desarrollada por varias IA's, que utiliza avanzados algoritmos para sincronizar el movimiento de los labios, la lengua y lss micros expresiones faciales con un dialogo.

Su usa también para realizar traducciones de voz a otros idiomas.

KPU

Knowledge Processing Unit o Unidad de procesamiento del conocimiento, es un término creado y patentado por Maisa (marzo, 2024), que consiste en optimizar el proceso que actualmente llevan a cabo los LLM's y VLM's, creando un nueva arquitectura que decopla o divide en dos partes el proceso de las consultas, queries o prompts: por un lado el proceso de razonamiento (Reasoning Engine) y por otro lado el proceso de los datos (Execution Engine).

Deepfake

O Ultra falso, es un contenido generado por una Inteligencia artificial, que suplanta rostros, acciones o palabras alterando el contenido original.

Voice cloning

O Clonación de voz, es un proceso que usa Inteligencia artificial para analizar los patrones de sonido de la voz de una persona, para generar una voz sintética y conseguir reproducirla sin que se pueda distinguir de la voz original.

Labelling

En Inteligencia artificial se refiere a: human labelling o etiquetadores humanos.

Es una de las etapas de afinamiento del conocimiento de las IA's, que consiste en realizar un proceso manual llevado a cabo por seres humanos, para identificar datos no procesados (raw data) en imágenes, texto, video y sonido; agregándoles etiquetas con información significativa para proveer contexto y facilitar a las IA's su aprendizaje.

Multimodal AI

Son Inteligencias artificiales que pueden procesar varios tipos de entradas de múltiples fuentes: texto, imagen, video y sonido; para producir salidas más completas y precisas.

AI Operating System

Un sistema operativo que integra Inteligencia artificial para manejar un dispositivo en forma similar a lo que hacen Windows, MacOS, IOS o Android, pero más eficiente, adaptable, intuitivo y enfocado en la interacción con el usuario.

C2PA

Es un estándar de código abierto, que permite incorporar metadatos (un conjunto de datos que describen el contenido del objeto) en medios digitales para verificar su origen; por ejemplo, un identificador o marca de agua para indicar que una imagen fue generada por una Inteligencia artificial.

API

Application Programming Interface: Es un software que actúa como intermediario para permitir la comunicación entre dos aplicaciones.

API KEY

Para acceder a una API, se requiere primero registrase con el proveedor de la API para luego obtener una clave compuesta de números y caracteres como mecanismo de autenticación de su identidad.

Una vez obtenida la API, estamos listos y podemos hacerle requerimientos para que la API a su vez acceda al software o aplicación y recibamos repuestas. Registro - API Key - Requerimientos - Acceso al software - Respuestas

Discord

Es una plataforma de mensajería instantánea que permite a los usuarios comunicarse entre ellos a través de diferentes canales usando: llamadas de voz, llamadas de video, mensajes de texto o imágenes, similar a los canales de Teams o Slack.

Discord incorpora un bot llamado Clyde que tiene integrado OpenAI ChatGPT para facilitar la interacción entre usuarios.

GitHub

Es un sitio web y un servicio online que permite a desarrolladores de programación, colaborar en proyectos de desarrollo de software de código abierto (Open Source), almacenar, administrar, monitorear y controlar cambios en los códigos fuente.

Open Source

Son programas con una licencia de Uso libre (Free license), se publican para ser compartidos por ejemplo en GitHub; incluyen el código fuente del programa y por tal razón pueden ser modificados por cualquier persona o empresa para su uso.

LLM

Siglas de Large Language Models

ToT (Tree of Thoughts / Árbol de ideas)

Es un concepto en base al cual se programan las Inteligencias artificiales para descomponer los Prompts en partes o pasos intermedios, analizar cada resultado, analizar la mejor opción y conseguir mejores y más precisos resultados.

Deep Learning

Deep Learning es un tipo de Machine Learning, pre-entrenado con Datasets pre-etiquetados ya sea por humanos, etiquetados usando reglas/lógica o una combinación de las dos. Por ejemplo en un auto con Inteligencia artificial, Deep learning se usa para reconocer los signos o símbolos de la carretera o reconocer peatones.

Reinforcement Learning (RL)

Por otro lado Reinforcement Learning (Aprendizaje por refuerzo) es otro tipo de Machine Learning, donde un algoritmo aprende por su propia cuenta realizando tareas de prueba/error. Por ejemplo en un auto con Inteligencia artificial, Reinforcement Learning se usa para optimizar el comportamiento de manejo y ajustar la estrategia del auto en base a experiencias pasadas. Entonces en un mismo auto, pueden coexistir dos tipos d enfoques complementarios de Machine learning: Deep learning y Reinforcement Learning, llevándonos a un tercer tipo que seria una combinación de los dos...el futuro lo dirá pero paree ser el camino que están desarrollando las grandes empresas de robótica, Google, Microsoft, Apple, OpenAI...

Tipos de inteligencias artificiales

Inteligencias específicas (Narrow AI systems) Están entrenados para realizar un solo tipo de tarea Por ejemplo ChatGPT en Nov 2022 solo estaba entrenado para aceptar texto y responder texto
Inteligencias multimodal Están entrenadas para realizar varias tipos de tareas Ahora (2023) las IA's de Bard, Microsoft, OpenAI, Claude, PI; además de aceptar texto, también pueden "leer imágenes", es decir tienen visión; aceptar voz como input y muchas de ellas no solo contestan en texto sino que también responden con voz 31.10.2023 ChatGPT en su versión de pago, anunció la integración en un solo menú el acceso a diferentes Inteligencias: Default Información hasta al año 2022 Browse with Bing Navegación en línea Advance Data Analysis Ex Code Interpreter Plugins Extensiones para ChatGPT DALL-E 3 Generación de imágenes

Seed

Es un código numérico que representa un ingrediente específico que se agrega a una imagen generada por una IA

Gen_id (Generation ID)

Es un identificador único para imágenes generadas por IA. Puede ser usada en un prompt para referirse a una imagen y mantener por ejemplo consistencia al usar una imagen en particular

Wereables

Dispositivos con Inteligencia artificial para vestir o usar en nuestro cuerpo. Tenemos las Ray-Ban Meta, los Apple Vision Pro, un pendiente de Limitless, Humane Pin de Humane.

ASI

Artificial Superintelligence o Inteligencia Artificial Super inteligente, teóricamente es una Inteligencia Artificial que supera en todos los aspectos al cerebro y comportamiento humano, en lo relacionado a razonamiento, creatividad, sabiduría y relaciones sociales.

Chain of though

CoT o Cadena de pensamiento, es una técnica aplicada en la ingeniería de prompts para que los LLM's (Large Language Models), demuestren su capacidad paso a paso, de como piensan y razonan para llegar a una solución.

RAG

Retrieval-Augmented Generation (RAG), es un método de elaboración de prompts en donde por un lado se alimenta a la Inteligencia artificial con una base de conocimientos y por otro lado se le solicita que integrando el conocimiento proporcionado más su propio conocimiento, genere una respuesta.

Latency

O Latencia, es el retraso en el tiempo de respuesta en la interacción con una Inteligencia artificial.

Context window

O Ventana de contexto en Inteligencia artificial, se refiere a la cantidad de texto en el prompt, que puede procesar a la vez para entregar una respuesta.

Re-timing

En el contexto de Inteligencia artificial, puede ser el proceso llevado a cabo para validar algoritmos, evaluación y ajuste de repuestas o el tiempo de respuesta.

Interpolation

O interpolación, en el contexto de procesamiento de imágenes y generación de videos, es un método matemático que basado en un contexto, genera cuadros intermedios que cambian progresivamente desde la imagen inicial hasta llegar a la imagen final, con una transición suave y continua entre cuadros.

RLHF

Reinforcement Learning from Human Feedback o Aprendizaje reforzado a partir de la retroalimentación humana, es una técnica usada para mejorar las respuestas de los LLM's, mediante la revisión y validación realizada por seres humanos.

Guardrails

O Medidas de seguridad, se refiere a las directrices de comportamiento de las IA's, establecidas para garantizar que los LLM's operen dentro de límites seguros y éticos para evitar sesgos, resultados no deseados y/o peligrosos.

LoRA

Low Rank Adaptation o Adaptación de Bajo Rango, es un proceso usando en inteligencia artificial para re-entrenar y ajustar solo una parte del modelo de lenguaje sobre algo en particular.

Vectorization

O Vectorización, es el proceso de convertir texto en una representación numérica que puede ser procesada por modelos de lenguaje, como los LLMs (Modelos de Lenguaje Extensos).

Este proceso establece relaciones semánticas entre las palabras y permite a los algoritmos comprender mejor el significado del texto, facilitando tareas como la búsqueda y recuperación de información.

Organoid Intelligence

La Inteligencia Organoide (OI) es un campo emergente que combina la biología y las ciencias de la computación para desarrollar sistemas de computación biológica mediante cultivos tridimensionales de células cerebrales humanas, conocidos como organoides cerebrales. Este enfoque busca aprovechar las características únicas de estos organoides para crear sistemas de computación capaces de superar a las computadoras tradicionales basadas en silicio en tareas específicas, especialmente aquellas que requieren procesamiento complejo de información y capacidades avanzadas de aprendizaje.

Infoxicación

Este concepto, introducido por el experto en gestión de la información Alfons Cornella en 1996, describe la sobrecarga o intoxicación informativa que sufren las personas ante el exceso de información. Esta sobrecarga puede causar dificultad para procesarla adecuadamente, especialmente cuando es repetitiva y no agrega valor, causando estrés y confusión. Los LLM's con tanta información se comportan de manera parecida a los humanos con toda la información que tienen, teniendo alucinaciones, respondiendo incorrectamente o con inconsistencias, pero eso si: sin estrés.

GAN

La Generative Adversarial Network, es un sistema neuronal de Deep Learning, compuesto por dos actores, el generador y el discriminador o inspector. El generador crea algo, el inspector verifica que tan real es la creación, y entre los dos se conversan para aprender de sus resultados. Las GAN son una herramienta de generación y autoaprendizaje - son como "artistas artificiales" que aprenden a crear contenido nuevo basándose en ejemplos reales y se usan por ejemplo para: generar rostros de personas que no existen, restaurar fotos antiguas o dañadas, aumentar la resolución de imágenes, rellenar partes faltantes en imágenes, crear obras de arte en diferentes estilos, detectar anomalías en radiografías, simular casos médicos raros, predecir patrones climáticos.

Metacognition

La metacognición es un concepto en el que los humanos tomamos conciencia de nuestros procesos de pensamiento; y esto mismo, está poco o poco siendo aplicado a la inteligencia artificial para que se auto evalúe y ajuste sus propios procesos de pensamiento y de razonamiento, para que el resultado que proporcione sea más preciso y "bien pensado".

Difussion Models

Los Modelos de difusión de IA, son un tipo de modelos de aprendizaje profundo (Deep learning models), que se utilizan para generar imágeens y sonido de alta calidad particularmente para sistemas de generación de imágenes como Stable Diffusion, DALL-E y Midjourney.

MCP

Model Control Protocol o Modelo de Control de Protocolos, es un un nuevo standard creado por Anthropic (Claude), diseñado para permitir el acceso universal de agentes de IA a fuentes de información, a bases de datos en general o también a API's. Posibles usos del MCP:

Permitir que los asistentes de IA consulten bases de datos empresariales en tiempo real.

Integrar múltiples fuentes de información en un solo punto de acceso para modelos de IA.

Facilitar la interoperabilidad entre distintas plataformas de IA sin necesidad de integraciones personalizadas.

Computer-using agent (CUA)

Es un agente de IA de amplio espectro presentado por OpenAI, que puede navegar por la Web, que ha sido entrenado para interactuar con interfases gráficas como botones, menús y campos de texto, tal como lo hacemos los humanos.

Small Language Models (SLM's)

Son modelos de lenguaje más pequeños y que son especializados en algo en particular. Esto tiene varias ventajas: Latencia (respondan más rápido), son especializados en algo en particular, su entrenamiento (datos) fue más depurado, requieren menos potencia de procesamiento y por lo tanto tiene menos consumo de energía.

Pruning

Pruning o podar, es una técnica para reducir el tamaño de los modelos de redes neuronales eliminando parámetros redundantes o menos importantes. Es similar a la poda de un árbol, donde se recortan las ramas menos necesarias para mejorar el crecimiento general; y esto es lo que se hace: se toma el LLM y luego se realiza el proceso de pruning para obtener un SML (Small Language Model)

Persistent memory

Es la capacidad de un LLM para recordar y acceder a la información de la interacción con el usuario, a lo largo del tiempo. Es un sistema de almacenamiento que persiste entre sesiones, lo que permite contextualizar las interacciones entre sesiones.

Deep research

o Investigación profunda, consiste en activar un razonamiento profundo, que implica un proceso de descomposición en varios pasos para la investigación sobre algún tema, esto implica: investigación en varias fuentes, contrastación de fuentes, descomposición de preguntas y usar cadenas de pensamiento, presentación razonado de resultados en formato estructurado.

BIOS

O Biological Intelligent Operating Systems (Sistemas Operativos Inteligentes Biológicos), son sistemas computacionales creados a partir de neuronas, interconectadas entre si y mantenidas en un ambiente optimo de supervivencia que asegura su viabilidad y funcionamiento y que por su propia característica pueden procesar información. Una alternativa a los chips de silicio que se usan en los procesadores actuales.

Preguntas Frecuentes sobre Inteligencia Artificial (IA)

Qué es un LLM o Large Language Model?

Un LLM es un modelo de lenguaje de gran tamaño entrenado con enormes cantidades de texto. Puede generar respuestas, realizar traducciones, escribir textos creativos y mucho más, gracias a su capacidad para comprender y generar lenguaje humano.

¿Cuál es la diferencia entre GPT y ChatGPT?

GPT (Generative Pre-trained Transformer) es la arquitectura del modelo, mientras que ChatGPT es una aplicación específica de GPT diseñada para mantener conversaciones naturales y responder preguntas con contexto.

¿Qué es un Prompt y por qué es tan importante?

Un Prompt es una instrucción o pregunta que le das a una IA. La calidad del Prompt influye directamente en la calidad de la respuesta. De ahí nace el concepto de "Prompt Engineering".

¿Qué es Prompt Engineering?

El Prompt Engineering es la técnica de redactar instrucciones (prompts) claras, específicas y contextualizadas para obtener mejores respuestas de una inteligencia artificial. No se trata solo de preguntar, sino de saber cómo hacerlo para que la IA comprenda la intención exacta del usuario y genere resultados útiles, coherentes y precisos.

¿Qué son las alucinaciones en inteligencia artificial?

Se llaman alucinaciones o hallucinations a las respuestas incorrectas o sin base real que una IA puede generar. Aunque suenen coherentes, pueden estar completamente equivocadas.

¿Qué es AGI (Inteligencia Artificial General)?

La AGI es una IA hipotética con habilidades cognitivas similares o superiores a las humanas. A diferencia de las IA actuales, que son especializadas, la AGI podría aprender, razonar y resolver cualquier tipo de problema.

#xyclos #chatgpt #midjourney #ia #ai #futurepedia #allfindy #copilot #microsoft365 #autogpt #token #agent #gemini #microsoft #openai #claude #deepseek #you