Bienvenido!

Dic_images

Diccionario formado con imágenes de partes del rostro de una persona.

Lo que puedes encontrar en el blog son algunas entradas que espero te ayuden como pequeños ejemplos de temas de Machine Learning, Análisis de Datos y Deep Learning.

Agregué entre ellas algunos temas como procesamiento de series de tiempo, procesamiento gráfico o análisis exploratorio y un poco sobre algunos temas de estadística y otras áreas de matemáticas.

Un poco mi filosofía es “hazlo tu mismo”, siento que en ocasiones se vuelve pedante el modo en el cual nos enseñan, por eso decidí tratar de evitar ser formal o pretencioso con las explicaciones y compartir el código casi en su totalidad.

En cada entrada intento poner un ejemplo preciso y alguna breve explicación sobre el tema y comparto el  código en Python o en R para que se pueda replicar el ejemplo. En la mayoría de los casos el código compartido tiene algunas explicaciones o comentarios para tratar de hacer claro lo que hace cada algoritmo, recomiendo revisar al copiarlo que no afecte alguna de las líneas comentadas el buen funcionamiento de este. Fui probando cada código compartido, pero eso no me asegura que tenga algún error de escritura en el blog. Si detectas alguno, ten la confianza de notificar para corregirlo (también las falta de ortografía y redacción). 

Para la mayoría de ejemplos trato de compartir alguna fuente de datos donde pueden descargar el archivo que se requiere o indico cómo el código directamente adquiere los datos desde algún repositorio. En caso de detectar algún ejemplo donde no haya puesto la referencia puedes escribirme para corregirlo o compartirte el archivo.

SVM_Kernel_Polinomial_degree4

Aplicación de Suppor Vector Machine para clasificar

A tu lado izquierdo puedes encontrar la lista de categorías que se  encuentran hasta este momento, las cuales son:

 Mi recomendación de uso sobre las categorías.

Si deseas revisar temas de Machine Learning en R o Python, presiona sobre las categorías:

Machine Learning en R Project

Cuenta con un menú y con varios de los algoritmos estándar. Aún estoy agregando nuevas entradas y seguiré así por un buen rato. Lo que puedes encontrar  hasta ahora es lo siguiente:

ggplot_HW_plano_separador

Recta que separa dos clases

Para ver los algoritmos de Machine Learning en Python puedes pulsar sobre la siguiente categoría.

Machine Learning en Python

Contiene algunos ejemplos y estoy construyendo varios más, las entradas son algo extensas pero trato de explicar más detalles que en las entradas en R. Lamento agregar en varias términos, conceptos y ecuaciones sobre cada tema, pero pensé en hacer más formal la explicación en esta categoría. Lo que puedes encontrar  hasta ahora es lo siguiente:

Nota: Lo que dice “pendiente” o ” Por terminar”, implican lo que dice, aún no subo esas entradas pero pronto las termino.

Digitos2

Clasificación de dígitos del 0 al 9

Para revisar cómo usar varios métodos , técnicas y hacer algún comparativo entre ellas  puse otra categoría, que llamé:

Algunos Ejemplos

Contiene ejemplo con varias técnicas, que van desde gráficas exploratorias, para tratar al final de aplicar algoritmos de Machine Learning.

Estaré agregando ejemplos de manera frecuente donde trataré de usar varias técnicas, haciendo uso tanto de python, r project y Julia.

Si deseas revisar temas de series de tiempo, pulsa sobre la categoría:

Algo de series de tiempo

Contiene explicaciones de los métodos lineales,en los cuales trato de agregar la mayor cantidad de gráficos y ejemplos, esperando se aclare cómo se construyen los modelos y cómo interpretarlos.

Lo que puede encontrar es lo siguiente:

Ejemplo_Ajuste_Tendencias

Tendencia de una Series de Tiempo

Ejemplo2_regresion_lineal

Holt-Winter

Un tema que ha tenido ahora relevancia en la academia, sobre todo en los grupos de matemáticos del área de Topología Algebraica es el “Análisis Topológico de Datos”, el cual puede ser considerado como una técnica de aprendizaje no supervizado y estar en la lista de técnicas de Machine Learning. Agregué una entrada para comentar ejemplos de como usar esta técnica.

De topología a los datos

  • Esta categoría contiene información de unos métodos no estándar sobre análisis de datos, los cuales forman parte de lo que se llama Análisis Topológico de Datos.
Diagrama_de_persistencia_de_una_muestra_uniforme_aleatoria_sobre_el_plano

Diagrama de Persistencia

Exploración de  Datos y Data Analysis

Se pueden encontrar ejemplos de procesamiento de datos con R project y Python, algunas entradas son largas ya que replico la generación de gráficos o procesos de análisis de los datos con ambos lenguajes. Agregare también ejemplo con el lenguaje Julia conforme me de tiempo.

Lo que se puede encontrar en esta categoría es lo siguiente:

Serie_T1

Aplicación de la metodología Split-Apply-Combine

La única categoría que no he podido terminar el material es la siguiente:

NLP con Pytho y R project 

smngoz17ju2uc4v1bg.9c27179b

Diagrama para visualizar el rol del Científico de Datos

drew-conway-data-science-venn-diagram

Diagrama de Venn diseñado por D. Conway

En la entrada principal.

Lo que puedes leer como páginas, textos más largos que las entradas, son mis opiniones sobre temas relacionados software, información sobre ciencia de datos, tecnología y matemáticas. Por supuesto que solo me limito a los temas de cada área que me interesan, ejemplo en Matemáticas hay muchas áreas y las que me interesan solo son unas cuantas, sobre tecnología hay temas muy puntuales de mi interés por lo cual no puedo opinar sobre todo lo que pasa actualmente, respecto a software mi opinión se limita a los lenguajes que uso o manejo o sobre manejadores de bases que utilizo. En breve, es solo mi opinión y siempre puede ser antípoda a la tuya.

En todas las entradas suelo dejar algunas referencias o la liga de las fuentes que cito, ya sea en las páginas o en las entradas de las categorías.

Por su puesto que cualquier crítica o comentario en bien recibido y no me incomoda si es una crítica severa, así que siente la libertad de hacerlo.

Deseo agregar varias páginas, ya que hay varios temas en los cuales no estoy de acuerdo con lo que leo en otros foros respecto a matemáticas, ciencia de datos y cosas de tecnología, deseo tener tiempo para hacerlas.

Las páginas hechas hasta ahora son las siguientes:

Lo que falta.

Aun no termino de probar algunas cosas de Deep Learning, pero he estado avanzando, espero para Agosto 2016 tener termina el material y liberar algunas notas en pdf en la red.

large-icon

Imagen de aprendizaje Profundo( Deep Learning)

Lo que tengo pensado agregar más adelante  son dos categorías más para hablar de los siguientes temas:

-Modelos Bayesianos

-NLP y Deep Learning

Espero te sea útil la información o por lo menos las referencias. El incentivo principal para mantener el blog activo es el compartir lo poco que he aprendido sobre temas que considero cruciales en “ciencia de datos”, lo pongo en comillas porque me parece que se peca se soberbia con ese titulo. No espero que sea el blog tu única fuente y por supuesto espero que la gente de habla en español sea la que mejor utilice la información que comparto, ya que el incentivo principal es poner un poco de mi parte porque la gente que tenga interés de aprender de estos temas pueda consultar y guiarse un poco del material. 

Digitos2

Clasificación de una muestra de la base Handwritten Digit.

Si bien lo que encuentras en el blog no sustituye a una buena preparación en matemáticas, programación y manejo de datos; espero pueda ser un lugar de apoyo para la gente con poca preparación o que sea un lugar donde se puedan revisar referencias o parte del código.

Scatterplot-fligh

Scatter plot de un grupo de datos analizados.

Existen muchos y muy buenos foros donde uno puede acudir a revisar información, pero en general los mejores se encuentran en ingles. Mi intención con este blog es poner mi granito de arena con la comunidad de habla hispana, por lo cual doy explicaciones y trato de ejemplificar técnicas evitando hasta donde es posible explicaciones teóricas que  suelen requerir una preparación sólida en matemáticas o que oscurecen lo que realmente se trata de hacer con ciertos algoritmo o técnicas. Y reitero, la formación es fundamental porque por más que intento explicar de modos simples hay temas que requieren cierto nivel o conceptos.

Espero te sea útil este sitio, si detectas algún error en las entradas no dudes en hacerlo saber!

La bella Lena

La bella Lena y sus Clusters!

Puedes contactarme vía el blog para cualquier duda, sugerencia o comentario, siempre estoy abierto a escuchar opiniones sobre el material compartido!

Saludos. D.L.

 

10 comentarios sobre “Bienvenido!

  1. Hola

    He leído con mucho interés tus aportaciones, pero aún cuando no soy experto en estos menesteres si he podido con la información que presentas ampliar mi visión. Precisamente me gustaría dentro de lo posible que pudieras abordar el tema de árboles de clasificación y regresión.

    Gracias por compartir tus conocimientos y opiniones.

    Dan

    1. Gracias por tu comentario. Al final el material es para que lo usen y repliquen en su máquinas. Espero terminar la entrada sobre árboles y randomforest en las primeras semanas de Marzo. Lamentablemente por una u otra razón no he podido compartir los ejemplos. Te comento cuando los comparta. Saludos!

      1. Hola amigo,que tal,vi su post sobre procesamiento de lenguaje natural,esta muy bueno,quisiera saber si me podria ayudar con algunas cosas…
        vera hice un arbol de decisión que clasifica palabra sen python,pero quisiera implementar algo que pueda navegar la web o mejor dicho toda la red para que aprende de esta
        mi correo es bajo0123@gmail.com
        espero su mensaje
        saludos

      2. Bueno, “toda la red” es mucho, pero mucho, no se bien a que te refieres con “navegar”. Si la idea es extraer datos de ciertas páginas , ya sean numéricos o texto y luego analizarlo, o hacer algún tipo de procesamiento ya sea para algún sistema de recomendación o algo por el estilo, o solo almacenar datos yo te recomiendo eL framework de python para hacerlo es Scrapy, es bastante robusto y necesitas dedicarle un tiempo para entenderlo y ponerlo hacer cosas, pero python es de aprendizaje rápido. Una recomendación para conocer de esos temas dos textos, los cuales tienen sus código en github y lo puedes descargar libremente.
        Scrapy co Python
        Libros:
        Libro_1
        Libro_2
        Espero te sirva de ayuda y sin problema en lo que pueda te ayudo.

  2. Hola Estimado, quería ver si me podrías orientar un poco más acerca del alizado exponencial en R, necesito implementarlos con la herramienta power Bi , tal vez me podrías indicar tu correo para así poder hacerte unas consultas.
    espero tu respuesta muchas gracias
    saludos

Responder

Por favor, inicia sesión con uno de estos métodos para publicar tu comentario:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s