Conceptos de Inteligencia artificial | Xyclos
Actualizado: 1 dic
Veamos algunos términos y conceptos para familiarizarse con el entorno o entornos de las Inteligencias artificiales (IA) o Artificial Intelligences (AI):
GPT
GPT son las siglas de Generative Pre-trained Transformer.
GPT es una arquitectura diseñada por OpenAI para el procesamiento de lenguaje natural.
GPT como todos los modelos de lenguaje, ha sido entrenado con grandes volúmenes de contenido: texto, libros, artículos, sitios web.
Con este entrenamiento, los modelos aprenden la estructura y patrones del lenguaje y son usados para crear resúmenes, traducción y para responder preguntas que le hacen.
Chatbot
Es un programa que usa Inteligencia artificial y Procesamiento natural de lenguaje (Natural Language Processing - NLP), para simular una conversación con humanos.
ChatGPT (30.11.2022)
ChatGPT es una versión de GPT, ambos desarrollados con OpenAI; pero ChatGPT ha sido afinada para su uso como una aplicación de chatbot y diseñada para generar respuestas contextualmente relevantes y naturales a un input o Prompt de un usuario,
GPT-4 (14.03.2023)
También desarrollada por OpenAI, GPT-4 a diferencia de ChatGPT que solo acepta Prompts de texto, GPT-4 es más poderoso y complejo al realizar tareas y además a diferencia de ChatGPT acepta Prompts de imágenes y texto para construir respuestas textuales.
Prompt
Es un texto con un requerimiento específico, que activa al modelo o Inteligencia artificial para generar una respuesta contextualmente relevante, apropiada y gramaticalmente correcta.
Un Prompt o indicación puede ser largo o corto y puede incluir diferentes tipos de expresiones de lenguaje como: preguntas, comandos, oraciones o declaraciones.
Prompt Engineering
Es el proceso para crear un pedido claro, conciso y suficientemente contextualizado para que la Inteligencia artificial comprenda la intención del usuario y genere una respuesta relevante y satisfactoria.
Prompt injection
Es un ataque a una Inteligencia artificial para controlar los resultados de la respuesta, eludir la seguridad y manipular las respuestas
Hallucination
Una alucinación, es una respuesta proporcionada por una Inteligencia Artificial, que no tiene sentido, no se ajusta a contenido en el que ha sido entrenado, puede ser una desviación significativa del conocimiento en la cual fue entrenada o un desvío sin base en ningún conocimiento previo.
Actualmente en el 2024, todas las empresas que desarrollan LLM's están conscientes de esto, aceptan su existencia y trabajan para descubrir cual es la causa. Un tema muy complejo.
Como usuarios, ahora que conocemos este comportamiento de la IA's, debemos siempre validar o verificar las respuestas que nos dan las IA's.
Token
Es una secuencia de caracteres que representa una unidad significativa de texto.
Tokenization
Es el proceso para descomponer una frase en unidades menos complejas como oraciones, palabras o caracteres para luego ser enviados para su proceso por la Inteligencia artificial.
Prompt - Tokenización - Proceso de análisis de Inteligencia artificial - re-Tokenización - Respuesta
Reverse tokenization
Es el proceso de tomar una secuencia de tokens y reconstruir el texto original o la oración que representan. Esto implica revertir el proceso de tokenización, que generalmente implica dividir un fragmento de texto en sus tokens o palabras componentes.
Generative AI
Los Modelos de Lenguaje de Gran Tamaño (Large Language Models, LLM) de Inteligencia Artificial generativa utilizan redes neuronales para identificar patrones y estructuras en un Prompt definido, y generar nuevo contenido o resultados de diversos tipos, como texto, imágenes, sonidos, animaciones, videos y modelos 3D. Ejemplos de IA's generativas incluyen ChatGPT, DALL-E, Bard, Bing, Perplexity, You, entre otros.
Auto-GPT (10.04.2023)
Es una aplicación experimental de código abierto, desarrollada en Python, que usa GPT-4 para generar contenido en forma autónoma.
Crea un Agente a partir de un objetivo que nosotros le proporcionamos (Prompt).
El Agente crea un plan y a su vez genera Prompts hasta conseguir un resultado u objetivo. En principio podemos decir que ahora, solo necesitamos crear un Prompt con el objetivo y Auto-GPT realiza todo lo necesario hasta conseguir el objetivo.
Agent
Es una entidad o programa independiente que observa y analiza un ambiente, aprende, razona y toma decisiones en forma autónoma para lograr un objetivo. Auto_GPT usa agentes para conseguir el objetivo.
LAMS
Large Action Models.
Es un nuevo tipo de Inteligencia Artificial que toma acciones en el mundo real, a diferencia de los LLM (Large Lenguaje Model) que solo responden a prompts y no interactúan con el mundo real, como acceder a dispositivos, páginas web, aplicaciones y realizar acciones sobre ellos.
AI Agent device
Es un dispositivo que tiene integrado una Inteligencia artificial de tipo LAMS, a la que se le puede entrenar para interactuar con el propio dispositivo o también con otros dispositivos o aplicaciones. Rabbit R1 es un caso de este tipo de IA, otro es Humane de Open AI, Imbue y Adept Ai de otras compañías.
Artificial General Intelligence - AGI
Artificial General Intelligence es un modelo mas flexible, adaptable, amplio y avanzado que GPT, porque va a ser capaz de entender lenguaje natural, razonar, aprender, percibir y resolver problemas más complejos tal como lo hace el cerebro humano. La intención es que estos sistemas de AGI ,sean capaces de desempeñarse en forma autónoma, realizando tareas tal como lo hacemos los humanos. También se habla que hay dos tipos de inteligencias: Específicas como ChatGPT y Generales como Auto-GPT.
Artificial Narrow Intelligence (ANI)
Una Inteligencia Artificial Limitada, es un modelo de lenguaje diseñado para realizar una tarea en particular, por ejemplo ChatGPT interactúa via chat con el usuario via texto o voz y responde via texto o voz.
Otro ejemplo son las IA's que convierten texto a imagen, texto a video, texto a música. Solo están especializadas en una particular destreza.
BCI
Brain Computer Interface. Es un dispositivo implantado en el cerebro que entiende y analiza las señales del cerebro y que además está diseñado para comunicarse con un dispositivo externo para interactuar con el. Neuralink, empresa de Elon Musk, publicó el 29 de Enero, 2024, que ha realizado el primer implante de este tipo en un humano.
Computer vision
Visión por computadora o visión artificial (VLM - Vision_language Model), es un campo de la Inteligencia artificial enfocado en interpretar, entender, procesar y clasificar los componentes (pixeles) de una imagen o video para su posterior uso en diferentes aplicaciones que requieran usar esta característica.
Lip Sync
O Sincronización de labios, es una técnica desarrollada por varias IA's, que utiliza avanzados algoritmos para sincronizar el movimiento de los labios, la lengua y lss micros expresiones faciales con un dialogo.
Su usa también para realizar traducciones de voz a otros idiomas.
KPU
Knowledge Processing Unit o Unidad de procesamiento del conocimiento, es un término creado y patentado por Maisa (marzo, 2024), que consiste en optimizar el proceso que actualmente llevan a cabo los LLM's y VLM's, creando un nueva arquitectura que decopla o divide en dos partes el proceso de las consultas, queries o prompts: por un lado el proceso de razonamiento (Reasoning Engine) y por otro lado el proceso de los datos (Execution Engine).
Deepfake
O Ultra falso, es un contenido generado por una Inteligencia artificial, que suplanta rostros, acciones o palabras alterando el contenido original.
Voice cloning
O Clonación de voz, es un proceso que usa Inteligencia artificial para analizar los patrones de sonido de la voz de una persona, para generar una voz sintética y conseguir reproducirla sin que se pueda distinguir de la voz original.
Labelling
En Inteligencia artificial se refiere a: human labelling o etiquetadores humanos.
Es una de las etapas de afinamiento del conocimiento de las IA's, que consiste en realizar un proceso manual llevado a cabo por seres humanos, para identificar datos no procesados (raw data) en imágenes, texto, video y sonido; agregándoles etiquetas con información significativa para proveer contexto y facilitar a las IA's su aprendizaje.
Multimodal AI
Son Inteligencias artificiales que pueden procesar varios tipos de entradas de múltiples fuentes: texto, imagen, video y sonido; para producir salidas más completas y precisas.
AI Operating System
Un sistema operativo que integra Inteligencia artificial para manejar un dispositivo en forma similar a lo que hacen Windows, MacOS, IOS o Android, pero más eficiente, adaptable, intuitivo y enfocado en la interacción con el usuario.
C2PA
Es un estándar de código abierto, que permite incorporar metadatos (un conjunto de datos que describen el contenido del objeto) en medios digitales para verificar su origen; por ejemplo, un identificador o marca de agua para indicar que una imagen fue generada por una Inteligencia artificial.
API
Application Programming Interface: Es un software que actúa como intermediario para permitir la comunicación entre dos aplicaciones.
API KEY
Para acceder a una API, se requiere primero registrase con el proveedor de la API para luego obtener una clave compuesta de números y caracteres como mecanismo de autenticación de su identidad.
Una vez obtenida la API, estamos listos y podemos hacerle requerimientos para que la API a su vez acceda al software o aplicación y recibamos repuestas. Registro - API Key - Requerimientos - Acceso al software - Respuestas
Es una plataforma de mensajería instantánea que permite a los usuarios comunicarse entre ellos a través de diferentes canales usando: llamadas de voz, llamadas de video, mensajes de texto o imágenes, similar a los canales de Teams o Slack.
Discord incorpora un bot llamado Clyde que tiene integrado OpenAI ChatGPT para facilitar la interacción entre usuarios.
Es un sitio web y un servicio online que permite a desarrolladores de programación, colaborar en proyectos de desarrollo de software de código abierto (Open Source), almacenar, administrar, monitorear y controlar cambios en los códigos fuente.
Open Source
Son programas con una licencia de Uso libre (Free license), se publican para ser compartidos por ejemplo en GitHub; incluyen el código fuente del programa y por tal razón pueden ser modificados por cualquier persona o empresa para su uso.
LLM
Siglas de Large Language Models
ToT (Tree of Thoughts / Árbol de ideas)
Es un concepto en base al cual se programan las Inteligencias artificiales para descomponer los Prompts en partes o pasos intermedios, analizar cada resultado, analizar la mejor opción y conseguir mejores y más precisos resultados.
Deep Learning
Deep Learning es un tipo de Machine Learning, pre-entrenado con Datasets pre-etiquetados ya sea por humanos, etiquetados usando reglas/lógica o una combinación de las dos.
Por ejemplo en un auto con Inteligencia artificial, Deep learning se usa para reconocer los signos o símbolos de la carretera o reconocer peatones.
Reinforcement Learning (RL)
Por otro lado Reinforcement Learning (Aprendizaje por refuerzo) es otro tipo de Machine Learning, donde un algoritmo aprende por su propia cuenta realizando tareas de prueba/error. Por ejemplo en un auto con Inteligencia artificial, Reinforcement Learning se usa para optimizar el comportamiento de manejo y ajustar la estrategia del auto en base a experiencias pasadas. Entonces en un mismo auto, pueden coexistir dos tipos d enfoques complementarios de Machine learning: Deep learning y Reinforcement Learning, llevándonos a un tercer tipo que seria una combinación de los dos...el futuro lo dirá pero paree ser el camino que están desarrollando las grandes empresas de robótica, Google, Microsoft, Apple, OpenAI...
Tipos de inteligencias artificiales
Inteligencias específicas (Narrow AI systems) Están entrenados para realizar un solo tipo de tarea Por ejemplo ChatGPT en Nov 2022 solo estaba entrenado para aceptar texto y responder texto
Inteligencias multimodal Están entrenadas para realizar varias tipos de tareas Ahora (2023) las IA's de Bard, Microsoft, OpenAI, Claude, PI; además de aceptar texto, también pueden "leer imágenes", es decir tienen visión; aceptar voz como input y muchas de ellas no solo contestan en texto sino que también responden con voz 31.10.2023 ChatGPT en su versión de pago, anunció la integración en un solo menú el acceso a diferentes Inteligencias: Default Información hasta al año 2022 Browse with Bing Navegación en línea Advance Data Analysis Ex Code Interpreter Plugins Extensiones para ChatGPT DALL-E 3 Generación de imágenes
Seed
Es un código numérico que representa un ingrediente específico que se agrega a una imagen generada por una IA
Gen_id (Generation ID)
Es un identificador único para imágenes generadas por IA. Puede ser usada en un prompt para referirse a una imagen y mantener por ejemplo consistencia al usar una imagen en particular
Wereables
Dispositivos con Inteligencia artificial para vestir o usar en nuestro cuerpo. Tenemos las Ray-Ban Meta, los Apple Vision Pro, un pendiente de Limitless, Humane Pin de Humane.
ASI
Artificial Superintelligence o Inteligencia Artificial Super inteligente, teóricamente es una Inteligencia Artificial que supera en todos los aspectos al cerebro y comportamiento humano, en lo relacionado a razonamiento, creatividad, sabiduría y relaciones sociales.
Chain of though
CoT o Cadena de pensamiento, es una técnica aplicada en la ingeniería de prompts para que los LLM's (Large Language Models), demuestren su capacidad paso a paso, de como piensan y razonan para llegar a una solución.
RAG
Retrieval-Augmented Generation (RAG), es un método de elaboración de prompts en donde por un lado se alimenta a la Inteligencia artificial con una base de conocimientos y por otro lado se le solicita que integrando el conocimiento proporcionado más su propio conocimiento, genere una respuesta.
Latency
O Latencia, es el retraso en el tiempo de respuesta en la interacción con una Inteligencia artificial.
Context window
O Ventana de contexto en Inteligencia artificial, se refiere a la cantidad de texto en el prompt, que puede procesar a la vez para entregar una respuesta.
Re-timing
En el contexto de Inteligencia artificial, puede ser el proceso llevado a cabo para validar algoritmos, evaluación y ajuste de repuestas o el tiempo de respuesta.
Interpolation
O interpolación, en el contexto de procesamiento de imágenes y generación de videos, es un método matemático que basado en un contexto, genera cuadros intermedios que cambian progresivamente desde la imagen inicial hasta llegar a la imagen final, con una transición suave y continua entre cuadros.
RLHF
Reinforcement Learning from Human Feedback o Aprendizaje reforzado a partir de la retroalimentación humana, es una técnica usada para mejorar las respuestas de los LLM's, mediante la revisión y validación realizada por seres humanos.
Guardrails
O Medidas de seguridad, se refiere a las directrices de comportamiento de las IA's, establecidas para garantizar que los LLM's operen dentro de límites seguros y éticos para evitar sesgos, resultados no deseados y/o peligrosos.
LoRA
Low Rank Adaptation o Adaptación de Bajo Rango, es un proceso usando en inteligencia artificial para re-entrenar y ajustar solo una parte del modelo de lenguaje sobre algo en particular.
Vectorization
O Vectorización, es el proceso de convertir texto en una representación numérica que puede ser procesada por modelos de lenguaje, como los LLMs (Modelos de Lenguaje Extensos).
Este proceso establece relaciones semánticas entre las palabras y permite a los algoritmos comprender mejor el significado del texto, facilitando tareas como la búsqueda y recuperación de información.
Organoid Intelligence
La Inteligencia Organoide (OI) es un campo emergente que combina la biología y las ciencias de la computación para desarrollar sistemas de computación biológica mediante cultivos tridimensionales de células cerebrales humanas, conocidos como organoides cerebrales. Este enfoque busca aprovechar las características únicas de estos organoides para crear sistemas de computación capaces de superar a las computadoras tradicionales basadas en silicio en tareas específicas, especialmente aquellas que requieren procesamiento complejo de información y capacidades avanzadas de aprendizaje.
Infoxicación
Este concepto, introducido por el experto en gestión de la información Alfons Cornella en 1996, describe la sobrecarga o intoxicación informativa que sufren las personas ante el exceso de información. Esta sobrecarga puede causar dificultad para procesarla adecuadamente, especialmente cuando es repetitiva y no agrega valor, causando estrés y confusión. Los LLM's con tanta información se comportan de manera parecida a los humanos con toda la información que tienen, teniendo alucinaciones, respondiendo incorrectamente o con inconsistencias, pero eso si: sin estrés.
GAN
La Generative Adversarial Network, es un sistema neuronal de Deep Learning, compuesto por dos actores, el generador y el discriminador o inspector. El generador crea algo, el inspector verifica que tan real es la creación, y entre los dos se conversan para aprender de sus resultados. Las GAN son una herramienta de generación y autoaprendizaje - son como "artistas artificiales" que aprenden a crear contenido nuevo basándose en ejemplos reales y se usan por ejemplo para: generar rostros de personas que no existen, restaurar fotos antiguas o dañadas, aumentar la resolución de imágenes, rellenar partes faltantes en imágenes, crear obras de arte en diferentes estilos, detectar anomalías en radiografías, simular casos médicos raros, predecir patrones climáticos.
Metacognition
La metacognición es un concepto en el que los humanos tomamos conciencia de nuestros procesos de pensamiento; y esto mismo, está poco o poco siendo aplicado a la inteligencia artificial para que se auto evalúe y ajuste sus propios procesos de pensamiento y de razonamiento, para que el resultado que proporcione sea más preciso y "bien pensado".
#xyclos #chatgpt #midjourney #ia #ai #futurepedia #allfindy #copilot #microsoft365 #autogpt #token #agent #bard #microsoft #openai #claude #aria
Comments