top of page
Foto del escritorCarlos Altamirano

Conceptos de Inteligencia artificial | Xyclos

Actualizado: 1 dic


Conceptos de Inteligencia artificial | Artificial intelligence concept |Xyclos

Veamos algunos términos y conceptos para familiarizarse con el entorno o entornos de las Inteligencias artificiales (IA) o Artificial Intelligences (AI):


GPT


GPT son las siglas de Generative Pre-trained Transformer.


GPT es una arquitectura diseñada por OpenAI para el procesamiento de lenguaje natural.


GPT como todos los modelos de lenguaje, ha sido entrenado con grandes volúmenes de contenido: texto, libros, artículos, sitios web.


Con este entrenamiento, los modelos aprenden la estructura y patrones del lenguaje y son usados para crear resúmenes, traducción y para responder preguntas que le hacen.


Chatbot


Es un programa que usa Inteligencia artificial y Procesamiento natural de lenguaje (Natural Language Processing - NLP), para simular una conversación con humanos.


ChatGPT (30.11.2022)

ChatGPT es una versión de GPT, ambos desarrollados con OpenAI; pero ChatGPT ha sido afinada para su uso como una aplicación de chatbot y diseñada para generar respuestas contextualmente relevantes y naturales a un input o Prompt de un usuario,


GPT-4 (14.03.2023)


También desarrollada por OpenAI, GPT-4 a diferencia de ChatGPT que solo acepta Prompts de texto, GPT-4 es más poderoso y complejo al realizar tareas y además a diferencia de ChatGPT acepta Prompts de imágenes y texto para construir respuestas textuales.


Prompt


Es un texto con un requerimiento específico, que activa al modelo o Inteligencia artificial para generar una respuesta contextualmente relevante, apropiada y gramaticalmente correcta.


Un Prompt o indicación puede ser largo o corto y puede incluir diferentes tipos de expresiones de lenguaje como: preguntas, comandos, oraciones o declaraciones.


Prompt Engineering


Es el proceso para crear un pedido claro, conciso y suficientemente contextualizado para que la Inteligencia artificial comprenda la intención del usuario y genere una respuesta relevante y satisfactoria.


Prompt injection

Es un ataque a una Inteligencia artificial para controlar los resultados de la respuesta, eludir la seguridad y manipular las respuestas


Hallucination


Una alucinación, es una respuesta proporcionada por una Inteligencia Artificial, que no tiene sentido, no se ajusta a contenido en el que ha sido entrenado, puede ser una desviación significativa del conocimiento en la cual fue entrenada o un desvío sin base en ningún conocimiento previo. Actualmente en el 2024, todas las empresas que desarrollan LLM's están conscientes de esto, aceptan su existencia y trabajan para descubrir cual es la causa. Un tema muy complejo.

Como usuarios, ahora que conocemos este comportamiento de la IA's, debemos siempre validar o verificar las respuestas que nos dan las IA's.

Token


Es una secuencia de caracteres que representa una unidad significativa de texto.


Tokenization


Es el proceso para descomponer una frase en unidades menos complejas como oraciones, palabras o caracteres para luego ser enviados para su proceso por la Inteligencia artificial.


Prompt - Tokenización - Proceso de análisis de Inteligencia artificial - re-Tokenización - Respuesta


Reverse tokenization


Es el proceso de tomar una secuencia de tokens y reconstruir el texto original o la oración que representan. Esto implica revertir el proceso de tokenización, que generalmente implica dividir un fragmento de texto en sus tokens o palabras componentes.


Generative AI

Los Modelos de Lenguaje de Gran Tamaño (Large Language Models, LLM) de Inteligencia Artificial generativa utilizan redes neuronales para identificar patrones y estructuras en un Prompt definido, y generar nuevo contenido o resultados de diversos tipos, como texto, imágenes, sonidos, animaciones, videos y modelos 3D. Ejemplos de IA's generativas incluyen ChatGPT, DALL-E, Bard, Bing, Perplexity, You, entre otros.

Auto-GPT (10.04.2023)


Es una aplicación experimental de código abierto, desarrollada en Python, que usa GPT-4 para generar contenido en forma autónoma.


Crea un Agente a partir de un objetivo que nosotros le proporcionamos (Prompt).


El Agente crea un plan y a su vez genera Prompts hasta conseguir un resultado u objetivo. En principio podemos decir que ahora, solo necesitamos crear un Prompt con el objetivo y Auto-GPT realiza todo lo necesario hasta conseguir el objetivo.


Agent


Es una entidad o programa independiente que observa y analiza un ambiente, aprende, razona y toma decisiones en forma autónoma para lograr un objetivo. Auto_GPT usa agentes para conseguir el objetivo.


LAMS


Large Action Models. Es un nuevo tipo de Inteligencia Artificial que toma acciones en el mundo real, a diferencia de los LLM (Large Lenguaje Model) que solo responden a prompts y no interactúan con el mundo real, como acceder a dispositivos, páginas web, aplicaciones y realizar acciones sobre ellos.

AI Agent device

Es un dispositivo que tiene integrado una Inteligencia artificial de tipo LAMS, a la que se le puede entrenar para interactuar con el propio dispositivo o también con otros dispositivos o aplicaciones. Rabbit R1 es un caso de este tipo de IA, otro es Humane de Open AI, Imbue y Adept Ai de otras compañías.


Artificial General Intelligence - AGI

Artificial General Intelligence es un modelo mas flexible, adaptable, amplio y avanzado que GPT, porque va a ser capaz de entender lenguaje natural, razonar, aprender, percibir y resolver problemas más complejos tal como lo hace el cerebro humano. La intención es que estos sistemas de AGI ,sean capaces de desempeñarse en forma autónoma, realizando tareas tal como lo hacemos los humanos. También se habla que hay dos tipos de inteligencias: Específicas como ChatGPT y Generales como Auto-GPT.


Artificial Narrow Intelligence (ANI)


Una Inteligencia Artificial Limitada, es un modelo de lenguaje diseñado para realizar una tarea en particular, por ejemplo ChatGPT interactúa via chat con el usuario via texto o voz y responde via texto o voz.


Otro ejemplo son las IA's que convierten texto a imagen, texto a video, texto a música. Solo están especializadas en una particular destreza.


BCI


Brain Computer Interface. Es un dispositivo implantado en el cerebro que entiende y analiza las señales del cerebro y que además está diseñado para comunicarse con un dispositivo externo para interactuar con el. Neuralink, empresa de Elon Musk, publicó el 29 de Enero, 2024, que ha realizado el primer implante de este tipo en un humano.


Computer vision


Visión por computadora o visión artificial (VLM - Vision_language Model), es un campo de la Inteligencia artificial enfocado en interpretar, entender, procesar y clasificar los componentes (pixeles) de una imagen o video para su posterior uso en diferentes aplicaciones que requieran usar esta característica.


Lip Sync


O Sincronización de labios, es una técnica desarrollada por varias IA's, que utiliza avanzados algoritmos para sincronizar el movimiento de los labios, la lengua y lss micros expresiones faciales con un dialogo.

Su usa también para realizar traducciones de voz a otros idiomas.


KPU


Knowledge Processing Unit o Unidad de procesamiento del conocimiento, es un término creado y patentado por Maisa (marzo, 2024), que consiste en optimizar el proceso que actualmente llevan a cabo los LLM's y VLM's, creando un nueva arquitectura que decopla o divide en dos partes el proceso de las consultas, queries o prompts: por un lado el proceso de razonamiento (Reasoning Engine) y por otro lado el proceso de los datos (Execution Engine).


Deepfake

O Ultra falso, es un contenido generado por una Inteligencia artificial, que suplanta rostros, acciones o palabras alterando el contenido original.


Voice cloning


O Clonación de voz, es un proceso que usa Inteligencia artificial para analizar los patrones de sonido de la voz de una persona, para generar una voz sintética y conseguir reproducirla sin que se pueda distinguir de la voz original.



Labelling

En Inteligencia artificial se refiere a: human labelling o etiquetadores humanos.


Es una de las etapas de afinamiento del conocimiento de las IA's, que consiste en realizar un proceso manual llevado a cabo por seres humanos, para identificar datos no procesados (raw data) en imágenes, texto, video y sonido; agregándoles etiquetas con información significativa para proveer contexto y facilitar a las IA's su aprendizaje.


Multimodal AI


Son Inteligencias artificiales que pueden procesar varios tipos de entradas de múltiples fuentes: texto, imagen, video y sonido; para producir salidas más completas y precisas.


AI Operating System


Un sistema operativo que integra Inteligencia artificial para manejar un dispositivo en forma similar a lo que hacen Windows, MacOS, IOS o Android, pero más eficiente, adaptable, intuitivo y enfocado en la interacción con el usuario.

C2PA

Es un estándar de código abierto, que permite incorporar metadatos (un conjunto de datos que describen el contenido del objeto) en medios digitales para verificar su origen; por ejemplo, un identificador o marca de agua para indicar que una imagen fue generada por una Inteligencia artificial.


API


Application Programming Interface: Es un software que actúa como intermediario para permitir la comunicación entre dos aplicaciones.


API KEY


Para acceder a una API, se requiere primero registrase con el proveedor de la API para luego obtener una clave compuesta de números y caracteres como mecanismo de autenticación de su identidad.

Una vez obtenida la API, estamos listos y podemos hacerle requerimientos para que la API a su vez acceda al software o aplicación y recibamos repuestas. Registro - API Key - Requerimientos - Acceso al software - Respuestas


Es una plataforma de mensajería instantánea que permite a los usuarios comunicarse entre ellos a través de diferentes canales usando: llamadas de voz, llamadas de video, mensajes de texto o imágenes, similar a los canales de Teams o Slack.


Discord incorpora un bot llamado Clyde que tiene integrado OpenAI ChatGPT para facilitar la interacción entre usuarios.


Es un sitio web y un servicio online que permite a desarrolladores de programación, colaborar en proyectos de desarrollo de software de código abierto (Open Source), almacenar, administrar, monitorear y controlar cambios en los códigos fuente.


Open Source

Son programas con una licencia de Uso libre (Free license), se publican para ser compartidos por ejemplo en GitHub; incluyen el código fuente del programa y por tal razón pueden ser modificados por cualquier persona o empresa para su uso.


LLM

Siglas de Large Language Models

ToT (Tree of Thoughts / Árbol de ideas)


Es un concepto en base al cual se programan las Inteligencias artificiales para descomponer los Prompts en partes o pasos intermedios, analizar cada resultado, analizar la mejor opción y conseguir mejores y más precisos resultados.


Deep Learning

Deep Learning es un tipo de Machine Learning, pre-entrenado con Datasets pre-etiquetados ya sea por humanos, etiquetados usando reglas/lógica o una combinación de las dos. Por ejemplo en un auto con Inteligencia artificial, Deep learning se usa para reconocer los signos o símbolos de la carretera o reconocer peatones.

Reinforcement Learning (RL)

Por otro lado Reinforcement Learning (Aprendizaje por refuerzo) es otro tipo de Machine Learning, donde un algoritmo aprende por su propia cuenta realizando tareas de prueba/error. Por ejemplo en un auto con Inteligencia artificial, Reinforcement Learning se usa para optimizar el comportamiento de manejo y ajustar la estrategia del auto en base a experiencias pasadas. Entonces en un mismo auto, pueden coexistir dos tipos d enfoques complementarios de Machine learning: Deep learning y Reinforcement Learning, llevándonos a un tercer tipo que seria una combinación de los dos...el futuro lo dirá pero paree ser el camino que están desarrollando las grandes empresas de robótica, Google, Microsoft, Apple, OpenAI...


Tipos de inteligencias artificiales

  1. Inteligencias específicas (Narrow AI systems) Están entrenados para realizar un solo tipo de tarea Por ejemplo ChatGPT en Nov 2022 solo estaba entrenado para aceptar texto y responder texto

  2. Inteligencias multimodal Están entrenadas para realizar varias tipos de tareas Ahora (2023) las IA's de Bard, Microsoft, OpenAI, Claude, PI; además de aceptar texto, también pueden "leer imágenes", es decir tienen visión; aceptar voz como input y muchas de ellas no solo contestan en texto sino que también responden con voz 31.10.2023 ChatGPT en su versión de pago, anunció la integración en un solo menú el acceso a diferentes Inteligencias: Default Información hasta al año 2022 Browse with Bing Navegación en línea Advance Data Analysis Ex Code Interpreter Plugins Extensiones para ChatGPT DALL-E 3 Generación de imágenes

Seed

Es un código numérico que representa un ingrediente específico que se agrega a una imagen generada por una IA


Gen_id (Generation ID)

Es un identificador único para imágenes generadas por IA. Puede ser usada en un prompt para referirse a una imagen y mantener por ejemplo consistencia al usar una imagen en particular


Wereables

Dispositivos con Inteligencia artificial para vestir o usar en nuestro cuerpo. Tenemos las Ray-Ban Meta, los Apple Vision Pro, un pendiente de Limitless, Humane Pin de Humane.


ASI


Artificial Superintelligence o Inteligencia Artificial Super inteligente, teóricamente es una Inteligencia Artificial que supera en todos los aspectos al cerebro y comportamiento humano, en lo relacionado a razonamiento, creatividad, sabiduría y relaciones sociales.


Chain of though


CoT o Cadena de pensamiento, es una técnica aplicada en la ingeniería de prompts para que los LLM's (Large Language Models), demuestren su capacidad paso a paso, de como piensan y razonan para llegar a una solución.


RAG

Retrieval-Augmented Generation (RAG), es un método de elaboración de prompts en donde por un lado se alimenta a la Inteligencia artificial con una base de conocimientos y por otro lado se le solicita que integrando el conocimiento proporcionado más su propio conocimiento, genere una respuesta.


Latency


O Latencia, es el retraso en el tiempo de respuesta en la interacción con una Inteligencia artificial.


Context window


O Ventana de contexto en Inteligencia artificial, se refiere a la cantidad de texto en el prompt, que puede procesar a la vez para entregar una respuesta.


Re-timing


En el contexto de Inteligencia artificial, puede ser el proceso llevado a cabo para validar algoritmos, evaluación y ajuste de repuestas o el tiempo de respuesta.


Interpolation


O interpolación, en el contexto de procesamiento de imágenes y generación de videos, es un método matemático que basado en un contexto, genera cuadros intermedios que cambian progresivamente desde la imagen inicial hasta llegar a la imagen final, con una transición suave y continua entre cuadros.


RLHF


Reinforcement Learning from Human Feedback o Aprendizaje reforzado a partir de la retroalimentación humana, es una técnica usada para mejorar las respuestas de los LLM's, mediante la revisión y validación realizada por seres humanos.


Guardrails


O Medidas de seguridad, se refiere a las directrices de comportamiento de las IA's, establecidas para garantizar que los LLM's operen dentro de límites seguros y éticos para evitar sesgos, resultados no deseados y/o peligrosos.


LoRA


Low Rank Adaptation o Adaptación de Bajo Rango, es un proceso usando en inteligencia artificial para re-entrenar y ajustar solo una parte del modelo de lenguaje sobre algo en particular.


Vectorization


O Vectorización, es el proceso de convertir texto en una representación numérica que puede ser procesada por modelos de lenguaje, como los LLMs (Modelos de Lenguaje Extensos).


Este proceso establece relaciones semánticas entre las palabras y permite a los algoritmos comprender mejor el significado del texto, facilitando tareas como la búsqueda y recuperación de información.


Organoid Intelligence


La Inteligencia Organoide (OI) es un campo emergente que combina la biología y las ciencias de la computación para desarrollar sistemas de computación biológica mediante cultivos tridimensionales de células cerebrales humanas, conocidos como organoides cerebrales. Este enfoque busca aprovechar las características únicas de estos organoides para crear sistemas de computación capaces de superar a las computadoras tradicionales basadas en silicio en tareas específicas, especialmente aquellas que requieren procesamiento complejo de información y capacidades avanzadas de aprendizaje.


Infoxicación


Este concepto, introducido por el experto en gestión de la información Alfons Cornella en 1996, describe la sobrecarga o intoxicación informativa que sufren las personas ante el exceso de información. Esta sobrecarga puede causar dificultad para procesarla adecuadamente, especialmente cuando es repetitiva y no agrega valor, causando estrés y confusión. Los LLM's con tanta información se comportan de manera parecida a los humanos con toda la información que tienen, teniendo alucinaciones, respondiendo incorrectamente o con inconsistencias, pero eso si: sin estrés.


GAN


La Generative Adversarial Network, es un sistema neuronal de Deep Learning, compuesto por dos actores, el generador y el discriminador o inspector. El generador crea algo, el inspector verifica que tan real es la creación, y entre los dos se conversan para aprender de sus resultados. Las GAN son una herramienta de generación y autoaprendizaje - son como "artistas artificiales" que aprenden a crear contenido nuevo basándose en ejemplos reales y se usan por ejemplo para: generar rostros de personas que no existen, restaurar fotos antiguas o dañadas, aumentar la resolución de imágenes, rellenar partes faltantes en imágenes, crear obras de arte en diferentes estilos, detectar anomalías en radiografías, simular casos médicos raros, predecir patrones climáticos.


Metacognition


La metacognición es un concepto en el que los humanos tomamos conciencia de nuestros procesos de pensamiento; y esto mismo, está poco o poco siendo aplicado a la inteligencia artificial para que se auto evalúe y ajuste sus propios procesos de pensamiento y de razonamiento, para que el resultado que proporcione sea más preciso y "bien pensado".





39 visualizaciones0 comentarios

Entradas relacionadas

Ver todo

Comments


bottom of page