top of page

Conceptos de Inteligencia artificial | Xyclos

Actualizado: 15 feb


Conceptos de Inteligencia artificial | Artificial intelligence concept |Xyclos

Veamos algunos términos y conceptos para familiarizarse con el entorno o entornos de las Inteligencias artificiales (IA) o Artificial Intelligences (AI):


GPT


GPT son las siglas de Generative Pre-trained Transformer.


GPT es una arquitectura diseñada por OpenAI para el procesamiento de lenguaje natural.


GPT como todos los modelos de lenguaje, ha sido entrenado con grandes volúmenes de contenido: texto, libros, artículos, sitios web.


Con este entrenamiento, los modelos aprenden la estructura y patrones del lenguaje y son usados para crear resúmenes, traducción y para responder preguntas que le hacen.


Chatbot


Es un programa que usa Inteligencia artificial y Procesamiento natural de lenguaje (Natural Language Processing - NLP), para simular una conversación con humanos.


ChatGPT (30.11.2022)

ChatGPT es una versión de GPT, ambos desarrollados con OpenAI; pero ChatGPT ha sido afinada para su uso como una aplicación de chatbot y diseñada para generar respuestas contextualmente relevantes y naturales a un input o Prompt de un usuario,


GPT-4 (14.03.2023)


También desarrollada por OpenAI, GPT-4 a diferencia de ChatGPT que solo acepta Prompts de texto, GPT-4 es más poderoso y complejo al realizar tareas y además a diferencia de ChatGPT acepta Prompts de imágenes y texto para construir respuestas textuales.


Prompt


Es un texto con un requerimiento específico, que activa al modelo o Inteligencia artificial para generar una respuesta contextualmente relevante, apropiada y gramaticalmente correcta.


Un Prompt o indicación puede ser largo o corto y puede incluir diferentes tipos de expresiones de lenguaje como: preguntas, comandos, oraciones o declaraciones.


Prompt Engineering


Es el proceso para crear un pedido claro, conciso y suficientemente contextualizado para que la Inteligencia artificial comprenda la intención del usuario y genere una respuesta relevante y satisfactoria.


Prompt injection

Es un ataque a una Inteligencia artificial para controlar los resultados de la respuesta, eludir la seguridad y manipular las respuestas


Hallucination


Una alucinación, es una respuesta proporcionada por una Inteligencia Artificial, que no tiene sentido, no se ajusta a contenido en el que ha sido entrenado, puede ser una desviación significativa del conocimiento en la cual fue entrenada o un desvío sin base en ningún conocimiento previo. Actualmente en el 2024, todas las empresas que desarrollan LLM's están conscientes de esto, aceptan su existencia y trabajan para descubrir cual es la causa. Un tema muy complejo.

Como usuarios, ahora que conocemos este comportamiento de la IA's, debemos siempre validar o verificar las respuestas que nos dan las IA's.

Token


Es una secuencia de caracteres que representa una unidad significativa de texto.


Tokenization


Es el proceso para descomponer una frase en unidades menos complejas como oraciones, palabras o caracteres para luego ser enviados para su proceso por la Inteligencia artificial.


Prompt - Tokenización - Proceso de análisis de Inteligencia artificial - re-Tokenización - Respuesta


Reverse tokenization


Es el proceso de tomar una secuencia de tokens y reconstruir el texto original o la oración que representan. Esto implica revertir el proceso de tokenización, que generalmente implica dividir un fragmento de texto en sus tokens o palabras componentes.


Generative AI

Los Modelos de Lenguaje de Gran Tamaño (Large Language Models, LLM) de Inteligencia Artificial generativa utilizan redes neuronales para identificar patrones y estructuras en un Prompt definido, y generar nuevo contenido o resultados de diversos tipos, como texto, imágenes, sonidos, animaciones, videos y modelos 3D. Ejemplos de IA's generativas incluyen ChatGPT, DALL-E, Bard, Bing, Perplexity, You, entre otros.

Auto-GPT (10.04.2023)


Es una aplicación experimental de código abierto, desarrollada en Python, que usa GPT-4 para generar contenido en forma autónoma.


Crea un Agente a partir de un objetivo que nosotros le proporcionamos (Prompt).


El Agente crea un plan y a su vez genera Prompts hasta conseguir un resultado u objetivo. En principio podemos decir que ahora, solo necesitamos crear un Prompt con el objetivo y Auto-GPT realiza todo lo necesario hasta conseguir el objetivo.


Agent


Es una entidad o programa independiente que observa y analiza un ambiente, aprende, razona y toma decisiones en forma autónoma para lograr un objetivo. Auto_GPT usa agentes para conseguir el objetivo.


LAMS


Large Action Models. Es un nuevo tipo de Inteligencia Artificial que toma acciones en el mundo real, a diferencia de los LLM (Large Lenguaje Model) que solo responden a prompts y no interactúan con el mundo real, como acceder a dispositivos, páginas web, aplicaciones y realizar acciones sobre ellos.

AI Agent device

Es un dispositivo que tiene integrado una Inteligencia artificial de tipo LAMS, a la que se le puede entrenar para interactuar con el propio dispositivo o también con otros dispositivos o aplicaciones. Rabbit R1 es un caso de este tipo de IA, otro es Humane de Open AI, Imbue y Adept Ai de otras compañías.


Artificial General Intelligence - AGI

Artificial General Intelligence es un modelo mas flexible, adaptable, amplio y avanzado que GPT, porque va a ser capaz de entender lenguaje natural, razonar, aprender, percibir y resolver problemas más complejos tal como lo hace el cerebro humano. La intención es que estos sistemas de AGI ,sean capaces de desempeñarse en forma autónoma, realizando tareas tal como lo hacemos los humanos. También se habla que hay dos tipos de inteligencias: Específicas como ChatGPT y Generales como Auto-GPT.


Artificial Narrow Intelligence (ANI)


Una Inteligencia Artificial Limitada, es un modelo de lenguaje diseñado para realizar una tarea en particular, por ejemplo ChatGPT interactúa via chat con el usuario via texto o voz y responde via texto o voz.


Otro ejemplo son las IA's que convierten texto a imagen, texto a video, texto a música. Solo están especializadas en una particular destreza.


BCI


Brain Computer Interface. Es un dispositivo implantado en el cerebro que entiende y analiza las señales del cerebro y que además está diseñado para comunicarse con un dispositivo externo para interactuar con el. Neuralink, empresa de Elon Musk, publicó el 29 de Enero, 2024, que ha realizado el primer implante de este tipo en un humano.


Computer vision


Visión por computadora o visión artificial, es un campo de la Inteligencia artificial enfocado en interpretar, entender, procesar y clasificar los componentes (pixeles) de una imagen o video para su posterior uso en diferentes aplicaciones que requieran usar esta característica.


Labelling

En Inteligencia artificial se refiere a: human labelling o etiquetadores humanos.


Es una de las etapas de afinamiento del conocimiento de las IA's, que consiste en realizar un proceso manual llevado a cabo por seres humanos, para identificar datos no procesados (raw data) en imágenes, texto, video y sonido; agregándoles etiquetas con información significativa para proveer contexto y facilitar a las IA's su aprendizaje.


Multimodal AI


Son Inteligencias artificiales que pueden procesar varios tipos de entradas de múltiples fuentes: texto, imagen, video y sonido; para producir salidas más completas y precisas.


AI Operating System


Un sistema operativo que integra Inteligencia artificial para manejar un dispositivo en forma similar a lo que hacen Windows, MacOS, IOS o Android, pero más eficiente, adaptable, intuitivo y enfocado en la interacción con el usuario.

C2PA

Es un estándar de código abierto, que permite incorporar metadatos (un conjunto de datos que describen el contenido del objeto) en medios digitales para verificar su origen; por ejemplo, un identificador o marca de agua para indicar que una imagen fue generada por una Inteligencia artificial.


API


Application Programming Interface: Es un software que actúa como intermediario para permitir la comunicación entre dos aplicaciones.


API KEY


Para acceder a una API, se requiere primero registrase con el proveedor de la API para luego obtener una clave compuesta de números y caracteres como mecanismo de autenticación de su identidad.

Una vez obtenida la API, estamos listos y podemos hacerle requerimientos para que la API a su vez acceda al software o aplicación y recibamos repuestas. Registro - API Key - Requerimientos - Acceso al software - Respuestas


Es una plataforma de mensajería instantánea que permite a los usuarios comunicarse entre ellos a través de diferentes canales usando: llamadas de voz, llamadas de video, mensajes de texto o imágenes, similar a los canales de Teams o Slack.


Discord incorpora un bot llamado Clyde que tiene integrado OpenAI ChatGPT para facilitar la interacción entre usuarios.


Es un sitio web y un servicio online que permite a desarrolladores de programación, colaborar en proyectos de desarrollo de software de código abierto (Open Source), almacenar, administrar, monitorear y controlar cambios en los códigos fuente.


Open Source

Son programas con una licencia de Uso libre (Free license), se publican para ser compartidos por ejemplo en GitHub; incluyen el código fuente del programa y por tal razón pueden ser modificados por cualquier persona o empresa para su uso.


LLM

Siglas de Large Language Models

ToT (Tree of Thoughts / Árbol de ideas)


Es un concepto en base al cual se programan las Inteligencias artificiales para descomponer los Prompts en partes o pasos intermedios, analizar cada resultado, analizar la mejor opción y conseguir mejores y más precisos resultados.


Deep Learning

Deep Learning es un tipo de Machine Learning, pre-entrenado con Datasets pre-etiquetados ya sea por humanos, etiquetados usando reglas/lógica o una combinación de las dos. Por ejemplo en un auto con Inteligencia artificial, Deep learning se usa para reconocer los signos o símbolos de la carretera o reconocer peatones.

Reinforcement Learning (RL)

Por otro lado Reinforcement Learning (Aprendizaje por refuerzo) es otro tipo de Machine Learning, donde un algoritmo aprende por su propia cuenta realizando tareas de prueba/error. Por ejemplo en un auto con Inteligencia artificial, Reinforcement Learning se usa para optimizar el comportamiento de manejo y ajustar la estrategia del auto en base a experiencias pasadas. Entonces en un mismo auto, pueden coexistir dos tipos d enfoques complementarios de Machine learning: Deep learning y Reinforcement Learning, llevándonos a un tercer tipo que seria una combinación de los dos...el futuro lo dirá pero paree ser el camino que están desarrollando las grandes empresas de robótica, Google, Microsoft, Apple, OpenAI...


Tipos de inteligencias artificiales

  1. Inteligencias específicas (Narrow AI systems) Están entrenados para realizar un solo tipo de tarea Por ejemplo ChatGPT en Nov 2022 solo estaba entrenado para aceptar texto y responder texto

  2. Inteligencias multimodal Están entrenadas para realizar varias tipos de tareas Ahora (2023) las IA's de Bard, Microsoft, OpenAI, Claude, PI; además de aceptar texto, también pueden "leer imágenes", es decir tienen visión; aceptar voz como input y muchas de ellas no solo contestan en texto sino que también responden con voz 31.10.2023 ChatGPT en su versión de pago, anunció la integración en un solo menú el acceso a diferentes Inteligencias: Default Información hasta al año 2022 Browse with Bing Navegación en línea Advance Data Analysis Ex Code Interpreter Plugins Extensiones para ChatGPT DALL-E 3 Generación de imágenes

Seed

Es un código numérico que representa un ingrediente específico que se agrega a una imagen generada por una IA


Gen_id (Generation ID)

Es un identificador único para imágenes generadas por IA. Puede ser usada en un prompt para referirse a una imagen y mantener por ejemplo consistencia al usar una imagene en particular




15 visualizaciones0 comentarios
bottom of page