Appen lanza soluciones de retroalimentación de Chat por IA y análisis comparativo para una mejor evaluación de LLM
Appen Enables Enterprises Desarrolla soluciones de IA conversacional más complejas
KIRKLAND, Washington, 23 de agosto de 2023 /PRNewswire/-- Appen Limited (ASX: APX), un proveedor líder de datos de alta calidad para el ciclo de vida de la IA, anunció hoy el launch de dos nuevos productos que permitirán a los clientes lanzar modelos de lenguaje grande de alto rendimiento (LLMs) cuyas respuestas son útiles, inofensivas y honestas para reducir los prejuicios y la toxicidad. Estas soluciones son:
- Retroalimentación de Chat por IA: eexpertos en el dominio mpower para evaluar una conversación en vivo de múltiples turnos, permitiéndoles revisar, calificar y reescribir cada respuesta.
- Análisis comparativo: una solución diseñada para ayudar a los clientes a evaluar el desempeño del modelo en diversas dimensiones, como precisión del modelo, toxicidad, etc.
El aumento de chatbots y asistentes de LLM-based ha acelerado la demanda de IA conversacional más sofisticada que pueda admitir múltiples tareas. Es importante probar una comprensión contextual y coherencia de LLMs en conversaciones complejas que se extienden en múltiples giros o diálogos, lo que refleja aplicaciones del mundo real. Esto ayudará a identificar fortalezas y debilidades en el manejo de interacciones extendidas, mejorando en última instancia la calidad de las experiencias de los usuarios y la utilidad práctica del modelo. Appen's AI Chat Feedback administra el flujo de datos de extremo a extremo a través de múltiples rondas de evaluación y ofrece a los clientes los datos requeridos para ayudar a mejorar los modelos.
La herramienta Appen's Benchmarking resuelve un punto de inflexión que enfrentan las empresas mientras se encuentran bajo presión para ingresar rápidamente al mercado de la IA: cómo determinar el LLM correcto para elegir una aplicación empresarial específica. La selección de modelos tiene implicaciones estratégicas para muchas dimensiones de una aplicación, incluida la experiencia del usuario, la facilidad de mantenimiento y la rentabilidad. Con la solución de análisis comparativo, los clientes pueden evaluar el rendimiento de varios modelos a lo largo de dimensiones de uso común o completamente personalizadas. En combinación con una multitud seleccionada de Appen's AI Training Specialists, la herramienta evalúa el desempeño a lo largo de dimensiones demográficas de interés como género, origen étnico e idioma. Un panel configurable permite una comparación eficiente de múltiples modelos en diversas dimensiones de interés.
"A medida que la IA Chatbots crece más avanzada, las apuestas son mayores para que las empresas las obtengan justo antes de ser liberadas al mundo, o corren el riesgo de prejuicios dañinos y respuestas peligrosas que podrían tener un impacto a largo plazo en la empresa", afirmó Appen CEO Armughan Ahmad. "Los nuevos productos de evaluación de Appen ofrecen a nuestros clientes una capa de confianza esencial que garantiza que estén lanzando herramientas de IA verdaderamente útiles y no dañinas para el público. Esta capa de confianza está respaldada por sólidos conjuntos de datos y procesos que han demostrado ser efectivos en nuestros' 27 años de trabajo de capacitación en IA, y un equipo de más de un millón de expertos humanos que están asistiendo a los matices de los datos".
Se ha demostrado que la retroalimentación humana es fundamental para el desempeño de los modelos LLM. La tecnología de clase mundial de Appen se ve reforzada por su multitud global de más de 1 millones de especialistas en capacitación en IA que evalúan conjuntos de datos para obtener precisión y prejuicios. La herramienta AI Chat Feedback conecta directamente una salida de LLM con especialistas para que pueda aprender de datos de chat diversos y naturales. Appen aprovechó sus más de dos décadas de experiencia con plataformas de anotación intuitivas y eficientes para diseñar una interfaz de chat que demuestre familiaridad y facilidad. Los especialistas conversan en vivo con un modelo, ya sea el modelo de un cliente o el de un tercero, y califican, marcan y proporcionan contexto para su evaluación. Este servicio de guante blanco se extiende a un personal dedicado al proyecto que analiza meticulosamente cada lote de datos, descubriendo casos de borde y optimizando la calidad de los datos.
Appen está iterando continuamente sus productos para permitir la certeza de la IA y próximamente se presentarán capacidades más avanzadas. Si le interesa obtener más información sobre los nuevos productos de Appen, visite nuestro sitio web en Appen.com o comuníquese con nuestro equipo de ventas.
Acerca de Appen
Appen es el líder global en datos para la AI Lifecycle con más de 27 años de experiencia en abastecimiento de datos, anotación y evaluación de modelos. A través de nuestra experiencia, plataforma y multitud global, hacemos posible que las organizaciones lancen los productos de inteligencia artificial más innovadores del mundo con rapidez y escala. Appen mantiene la plataforma de anotación de datos de AI-assisted más avanzada de la industria y cuenta con una multitud global de más de 1 millones de colaboradores en todo el mundo, hablando más de 235 idiomas. Nuestros productos y servicios hacen de Appen un socio de confianza para líderes en tecnología, automotriz, finanzas, comercio minorista, atención médica y gobierno. Appen tiene clientes y oficinas en todo el mundo.
Contacto: appen@codewordagency.com
FUENTE Appen
WANT YOUR COMPANY'S NEWS FEATURED ON PRNEWSWIRE.COM?
Newsrooms &
Influencers
Digital Media
Outlets
Journalists
Opted In
Share this article