LightTag es una plataforma de anotación de texto para científicos de datos que crean datos de entrenamiento AI – Vende Todito

[ad_1]

LightTag, un emprendimiento recientemente lanzado de un ex investigador de NLP en Citi, ha creado una "plataforma de anotación de texto" diseñada para ayudar a los científicos de datos que necesitan crear rápidamente datos de capacitación para sus sistemas de inteligencia artificial. Es un movimiento clásico de picks y n palas, en el sentido de que la empresa con sede en Berlín espera aprovechar el boom actual del desarrollo de la inteligencia artificial.

Específicamente, LightTag tiene como objetivo resolver uno de los principales cuellos de botella del 'aprendizaje profundo' basado en inteligencia artificial: lo que obtienes es tan bueno como los datos etiquetados que pones. El problema, sin embargo, es que los datos de etiquetado son laboriosos, y dado que es un trabajo llevado a cabo por equipos humanos, es propenso a la inexactitud y inconsecuencia. El flujo de trabajo basado en equipo de LightTag, la interfaz de usuario inteligente y los controles de calidad integrados son un intento de mitigar esto.

"Lo que he tomado de [my previous positions] a LightTag es una comprensión de que los datos etiquetados son más importantes para el éxito en la máquina aprendiendo que los algoritmos inteligentes ", dice el fundador Tal Perry. "La diferencia en un proyecto exitoso de aprendizaje automático a menudo se reducía a qué tan bien se ejecutaba y administraba la recopilación y el uso de datos etiquetados. Hay una gran brecha en las herramientas para hacer eso bien, por eso construí LightTag ".

Perry dice que la interfaz de anotación de LightTag está diseñada para mantener las etiquetadoras" efectivas y comprometidas ". También emplea su propia "IA" para aprender del etiquetado anterior y hacer sugerencias de anotaciones. La plataforma también automatiza el trabajo de administración de un proyecto, en términos de asignación de tareas a etiquetadoras y de asegurarse de que haya suficiente superposición y duplicación para mantener alta la precisión y consistencia.

"Lo hemos hecho muerto -simple de anotar con un equipo (parece obvio, pero nada más lo hace fácil) ", dice. "Para asegurarse de que los datos sean buenos, LightTag asigna automáticamente trabajo a los miembros del equipo para que haya una superposición entre ellos. Esto permite a los gerentes de proyectos medir el acuerdo y reconocer los problemas en su proyecto desde el principio. Por ejemplo, si un anotador específico tiene un rendimiento peor que otros ".

Mientras tanto, Perry dice que adquirir datos etiquetados es uno de los sectores de crecimiento silencioso en el reciente boom de la IA, pero para muchas industrias específicas del sector, como médica, legal o financiero, subcontratar el trabajo no es una opción. Esto se debe a que los datos a menudo son demasiado delicados o demasiado especializados para que los procesen los expertos que no pertenecen a la materia. Para solucionar esto, LightTag ofrece una versión local además de SaaS.

"Todas las empresas tienen grandes conjuntos de datos de texto que no están estructurados (registros de CRM, transcripciones de llamadas, correos electrónicos, etc.). El 'Aprendizaje profundo' ha hecho que sea algorítmicamente posible acceder a esos datos, pero para utilizar Deep Learning necesitamos capacitar al modelo con conjuntos de datos etiquetados. La mayoría de las empresas no pueden externalizar el etiquetado en texto porque los datos son demasiado complicados (biología, finanzas), regulados (registros CRM) o ambos (registros médicos) ", explica el fundador de LightTag.

Operando en varios programas piloto y en versión beta privada desde diciembre de 2018, y lanzado públicamente este mes, LightTag ya ha sido utilizado por el equipo de ciencia de datos en una gran compañía de tecnología de Silicon Valley que quiere que su inteligencia artificial entienda texto de forma libre en perfiles, así como por una compañía de energía para analizar registros de plataformas petrolíferas para predecir problemas de perforación a ciertas profundidades. La startup también realizó una prueba piloto con una compañía de imágenes médicas que etiquetó los informes asociados con las imágenes por resonancia magnética.

[ad_2]

Vende Todito