机器学习

机器学习

Tres cosas que es necesario saber

机器学习(aprendizaje automático) es una técnica de análisis de datos que enseña a los ordenadores a hacer lo que resulta natural para las personas y los animales: aprender de la experiencia。Los algoritmos de aprendizaje automático emplean métodos de cálculo para " aprender " información directamente de Los datos sin dependder de una ecuación predeterminada como modelo。Los algoritmos mejoran su rendimiento de forma adaptativa a medida que aumenta el número de muestras disponibles para el aprendizaje。

Por qué es importante el机器学习

Con el aumento de la cantidad de大数据, el Machine Learning se ha convertido en una técnica clave para resolver problemas en áreas tales como:

  • Finanzas computacionales:帕拉calificacion crediticiay厄尔交易algoritmico
  • Procesamiento de imágenes y visión人工的:Para el reconocimiento facial, la detección de movimiento y ladeteccion de objetos
  • Biologia computacional:para la detección de tumores, el descubrimiento de fármacos y la secuenciación del ADN
  • Produccion德公司:帕拉Previsión de la cargay el precio
  • Automoción,部门航空航天y fabricación:帕拉州埃尔mantenimiento predictivo
  • Procesamiento del lenguaje natural:Para aplicaciones de reconocimiento de voz
Descubra los tres tipos de Machine Learning(聚类,clasificación y regresión) con esta presentación de Loren Shure。
为什么机器学习很重要

Más datos, más preguntas, mejores respuestas

Los algoritmos de Machine Learning encuentran patones naturales en Los datos que generan conocimiento y contribuyen a ar mejores decision和a realizar mejores predicones。Se utizan a diario para tomar decisiones crucales en diagnósticos médicos, trading de acciones, previsión de la carga energética,等等。Por ejemplo, los sittios多媒体confían en el aprendizaje automático para cribar millones de opciones con objeto de recerle推荐aciones sobre cancciones o películas。少数人的新闻和新闻información严肃的新闻和我们的客户。

¿Cuándo se debe usar el Machine Learning?

“机器学习的考虑”(Considere el uso de Machine Learning cuando tenga una tarea o un problema compljos que impliquen una gran cantidad de datos y muchas variables), pero disonga de ninguna fórmula o ecuación。Por ejemplo, el aprendizaje automático es una buena opción si必要的环境和情况都是一样的。

手写的规则和方程太复杂了——就像人脸识别和语音识别一样。

Las reglas y ecuaciones escritas a mano son demasiado complejas, como en el reconocimiento facial y de voz。

任务的规则是不断变化的——就像从交易记录中检测欺诈一样。

Las reglas de una tarea cambian constantemente, como en el caso de la detección de fraudes en los registros de transacciones。

数据的性质在不断变化,程序需要适应——比如自动交易、能源需求预测和预测购物趋势。

La naturaleza de los datos cambia sin cesar y el programa debe adaptarse, como en el trading automático, La predicción de La demanda energética y La previsión de las tendencias de compra。

Cómo funciona el机器学习

El aprendizaje automático emplea dos tipos de técnicas: Elaprendizaje supervisado, que entrena UN modelo con datos de entrada y salida conocidos para que pueda precir salidas futuras, y elaprendizaje没有supervisado, que encuentra patones ocultos o estructuras intrínsecas en los datos de entrada。

图一:Entre las técnicas de aprendizaje automático se incluyen el aprendizaje confinado y el aprendizaje no confinado。

图一:Entre las técnicas de aprendizaje automático se incluyen el aprendizaje confinado y el aprendizaje no confinado。

Aprendizaje supervisado

埃尔aprendizaje automatico supervisadoCrea UN modelo que realiza predicciones en función de las pruebas en presencia de una incertidumbre。有一个算法,有一个预先确定的预先确定的,有一个预先确定的,有一个预先确定的,有一个预先确定的,有一个预先确定的,有一个预先确定的(salidas),有一个预先确定的,有一个预先确定的,有一个新的预先确定的。使用我们已经完成的任务,我们已经完成的任务,我们已经完成的任务,我们已经完成的任务está我们的前任。

El aprendizaje administrado emplea técnicas de clasificación y regresión para desarrollar modelos predictivos。

拉斯维加斯tecnicas de clasificacionpredicen respuestas discretas;Por ejemplo, si UN correo electrónico es legítimo o es spam, o bien si UN tumor es cancerígeno o benigno。Los modelos de clasificación organizan Los datos de entrada en categorías。Las aplicaciones más habituales son Las imágenes médicas, el reconocimiento de voz y la calificación credita。

Utilice la clasificación si sus datos se pueden etiquetar, categorizar o dividir en grupos o clases concretos。Por ejemplo, las aplicaciones para el reconocimiento de la escritura emplean la clasificación para reconocer letras y números。En el procesamiento de imágenes y la visión人工的,se emplean técnicas deReconocimiento de patrones sin supervisiónPara la detección de objetos y la segmentación de imágenes。

Algunos algoritmos habituales para realizar la clasificación son:máquina de vectores de soporte (SVM),arboles德决定提高了y袋装,k-vecino mas目的地是,clasificadores bayesianos (Naïve Bayes),分析discriminante,regresion logisticay红色的神经元

拉斯维加斯: tecnicas de退化predicen respuestas连续;Por ejemplo, cambios de temperature atura o inflaciones en la demanda energética。Las aplicaciones más habituales son la predicción de la carga eléctrica y el trading algorítmico。

Utilice técnicas de regresión si trabaja con un intervalo de datos o si la naturalza de la respuesta es un número real, como la温度o el tiempo que tardará una pieza de equipment amiento en fallar。

Algunos algoritmos habituales de regresión son:莫德罗直系,莫德罗没有直系,regularizacion,regresion为什么出来,arboles德决定提高了y袋装,红色的神经元yaprendizaje neurodifuso adaptativo

Uso de Machine Learning para precir ataques al corazón

Supongamos que los médicos quieren前人si alguien va tener un ataque al corazón en el plaza de un año。我的祖国,我们的祖国,我们的祖国,我们的祖国,我们的祖国tensión。我爱你,我爱你,我爱你corazón我爱你,我爱你añoPor tanto, el problema es comar los datos existentes en unmodelo que pueda前辈si tra persona tendrá un ataque al corazón en el plaza de un año。

Aprendizaje没有supervisado

埃尔aprendizaje没有supervisadoHalla patrones ocultos o estructuras intrínsecas en los datos。Se emplea para inferir información一个partr de conjuntos de datos que constan de datos de entrada sin respuestas礼仪。

埃尔聚类Es la técnica de aprendizaje no superiado más común。Se emplea para el análisis de datos exploratorio, con objeto de encontrar patarones o agrupaciones ocultos en los datos。"我们的一切都是美好的分析德集群Están el análisis de secuencias genéticas, la investigación de mercados y el reconocimiento de objetos。

Por ejemplo, si una empresa de telefonía móvil quiere optimizar las ubicaciones donde constrir antenas, puede recurrir al aprendizaje automático para calcular el número de clusters de personas que utizan sus antenas。Un teléfono单独的天线群通信系统和天线群ocasión,天线群通信系统和天线群通信系统和天线群通信系统和天线群通信diseñar la mejor ubicación天线群通信系统和天线群通信recepción de la señal用户群通信(o集群)。

Algunos algoritmos habituales para realizar el clustering son:k - means y k-medoids,集群jerarquico,Modelos de mezclas gaussianas,modelos de Markov ocultos,mapas autoorganizados,聚类difuso de c-meansy集群sustractivo

图2。聚类可以在数据中找到隐藏的模式。

图2:El聚类detecta patrones ocultos en sus datos。

¿Cómo se decide qué algoritmo de Machine Learning utilzar ?

La elección del algoritmo adecuado puede parecer abrumadora;Existen docenas de algoritmos de aprendizaje automático supervised ados y no supervised ados, y cada uno ofrece UN enfoque distinto del aprendizaje。

No hay ningún método mejor que otro ni ninguno que se pueda aplicar de forma universal。Para encontrar el algoritmo perfecto se tiliza en partte la técnica de ensayo y error;Ni siquiera los científicos de datos con mucha experiencia pueden saber si UN algoritmo funcionará sin probarlo。Pero la elección del algoritmo también depende del tamaño y el tipo de los datos con los que se trabaja, la información que se desea obtener de los datos y cómo se empleará dicha información。

面板的导航
图3。机器学习技术。

图3:Técnicas de aprendizaje automático。

一个continuación我们最近的指示,对挽歌的开端,我们的监督automático没有监督:

  • 以利亚埃尔aprendizaje supervisadoSi necesita entrenar UN modelo para realizar una predicción;Por ejemplo, el valor futuro de una variable continua (como la temperature atura o el precio de una acción) o una clasificación (Por ejemplo, identificar marcas de coches a partir de vídeo de una webcam)。
  • 以利亚埃尔aprendizaje没有supervisado我们必须探索我们的数据,我们的世界,我们的模式,我们的地方,我们的国家representación国际,我们的国家división我们的数据,我们的集群。

机器学习con MATLAB

¿Cómo se puede emplear la潜能del aprendizaje automático para utilizar los datos con objeto de tomar mejores decisiones?MATLAB hace que el aprendizaje automático resulte sencillo。Con herramientas y funciones para gestionar大数据,así como apps para que el aprendizaje automático resulte accessible, MATLAB es un entorno ideal para aplicar el aprendizaje automático a los análisis de datos。

Con MATLAB, los ingenieros y los analistas de datos tienen acceso inmediato a funciones prediseñadas,工具箱无穷无尽的应用程序,特别是izadas para laclasificacionregresiony厄尔聚类

MATLAB permite hacer lo siguiente:

  • Comparar enfoques tales como la regresión logística, los árboles de clasificación, las máquinas de vectores de soporte, los métodos combinados y elaprendizaje profundo
  • 实用técnicas de reducción y完美的模式,para crear, unmodelo, preciso, que,捕获,mejor, el, poder,预测,我们的数据。
  • Integrar modelos de aprendizaje automático en sistemas, clusters y nubes empresariales, así como dirigir los modelos a hardware embedbido en tiempo real。
  • general código automáticamente para el análisis de sensores embedbidos。
  • Emplear flujos de trabajo integrados desde el análisis de los datos hasta el despliegue。
面板的导航

Aplicaciones interesantes del机器学习

创建算法,可以分析艺术作品

罗格斯大学人工智能研究实验室的调查人员querían versi un algoritmo informático podía clasificar cuadros por estilo, género y artista con la misma facilidad que una persona。Empezaron por identificar las características visuales para classiificar el estilo de un cuadro。Los algoritmos que desarrollaron classiificaron Los estilos de Los cuadros de la base de datos con un 60% de precisión, lo cual supera las personas normales no expertas。

Los investigative adores prousieron la hipótesis de que las características visuales útiles para la clasificación por estilos (un problema de aprendizaje superiado) podrían usarse también para determinar las influencias artísticas (un problema no superiado)。

utizaron algoritmos de clasificación entrenados con imágenes de谷歌para identificobjetos concretos。Probaron los algoritmos con más de 1700 cuadros de 66个艺术家区分dentro de un intervalo de 550 años。El algoritmo identificó de inmediato obras conectadas,包括la流感del“老伊诺森西奥的还原”de Diego Velázquez en El“老伊诺森西奥还原的工作室Velázquez”de Francis Bacon。

117044 _wl_rutgers_fig1_wl。

优化大型建筑的暖通空调能源使用

Los sistemas de calefacción, ventilación y aire acondicionado (HVAC) de edificios de oficinas, hospitales y otros edificios comerciales de gran tamaño son ineficientes a menudo porque no tienen en cuenta Los patrones de climate variables, Los costes variables de la energía o las丙edades térmicas de Los edificios。

La plataforma de software basada en La nube de BuildingIQ hace fronte a este problema。一个平台的解决算法的方法métodos de aprendizaje automático para procesar continuamente g ytes de información medidores de势能程序,termómetros y sensores de presión HVAC, así como el climata y el coste de la energía。特别地,el aprendizaje automático se emplea para segmentar los datos y determinar las contribuciones relativas del gas, la electricidad, el vapor y la energía solar En los procesos de calefacción y refrigeración。La plataforma de BuildingIQ reduce el consumo de energía de climatización en edificios comerciales de gran tamaño en un 10%-25% durante el funciamiento normal。

优化暖通空调的能源使用

检测低速车祸

Con más de ocho millones de miembros, el RAC es una de las organizaciones automovilísticas más extensas del Reino Unido y比例ciciona asistencia en cartera, seguros y otros servicios a cutores privados y comerciales。

Con objeto de permitite una respuesta rápida cuando se产生的事件,减少colisiones y mitigar el costes de los seguros, el RAC desarrolló un sistema a bordo de detección de colisiones que emplea algoriitmos de aprendizaje automático avanzados para detecttar colisiones a baja velocidad y distinguir estos甚至de otros甚至de conducción más comescomo cuenir sobdes。Las pruebas独立的,mostraron que el sistema del RAC tiene una precisión del 92% en la detección de colisiones de prueba。

检测低速车祸
Baidu
map