Data Science es una combinación multidisciplinaria de tratamiento de datos, desarrollo de algoritmos y tecnología para resolver problemas analíticamente complejos.

En el núcleo están los datos. Grandes cantidades de información sin procesar, transmitida y almacenada en  bases de datos. La ciencia de datos se basa en última instancia en el uso de estos datos de forma creativa para generar valor comercial.

Ciencia de datos: descubrimiento de la información de los datos

Este aspecto del data science se trata de descubrir que hay escondido dentro de los datos. Buceando en un nivel granular para extraer y comprender comportamientos complejos, tendencias e inferencias. Se trata de revelar información oculta que puede ayudar a las empresas a tomar decisiones comerciales más inteligentes.

Un ejemplo de Data science

Los datos de Netflix minan los patrones de visualización de películas para comprender qué impulsa el interés del usuario y lo usa para tomar decisiones sobre qué series originales de Netflix deben producir.
El Target identifica cuáles son los principales segmentos de clientes dentro de su base y los comportamientos únicos de compra dentro de esos segmentos, lo que ayuda a orientar los mensajes a diferentes públicos de mercado.

¿Cómo extraen información los Data Scientist?

Comienza con la exploración de datos. Cuando se les presenta una pregunta desafiante, los científicos de datos se convierten en detectives. Investigan pistas y tratan de comprender el patrón o las características dentro de los datos. Esto requiere una gran dosis de creatividad analítica.

Luego, según sea necesario, los científicos de datos pueden aplicar una técnica cuantitativa para obtener un nivel más profundo:

  • modelos p inferenciales
  • análisis de segmentación
  • previsión de series de tiempo
  • experimentos de control sintético.

Esta información basada en datos es fundamental para proporcionar orientación estratégica. En este sentido, los científicos de datos actúan como consultores, guiando a las partes interesadas comerciales sobre cómo actuar sobre los hallazgos.

¿Qué es Data Science?

El conjunto de habilidades requerido La ciencia de datos es una combinación de habilidades en tres áreas principales:

Computer Science

 

La «ciencia de computación», consiste en tratar de establecer cual es la mejor infraestructura posible para instalar las máquinas. Para hacer esto adecuadamente hay que tener en cuenta el volumen de datos aproximado que se va a mover y en que va a consistir el análisis.

Esta infraestructura es rápida y fácilmente escalable gracias a tecnologías como Hadoop o Spark y servicios como amazon Webservice, Azure o Google.  Los cuales nos permiten generar y destruir máquinas virtuales en funcion de nuestras necesidades.

El encargado de está parte del Data Science debería ser capaz de montar y gestionar estos servicios de forma eficiente.

Matemáticas estadística

Para poder analizar estos grandes volúmenes de datos, se hace completamente necesario, se capaz de encontrar modelos estadísticos capaces de sintetizar información y ayudar a proveer valores futuros.

Existen infinidad de modelos estadísticos, por lo que un buen Data scientis es capaz de manejar estos modelos y aprender cuales son los más útiles para cada ocasión

El análisis de datos consiste en describir el pensamiento crítico que es de naturaleza cuantitativa.

Conocimientos de negocio.

Esta es la parte menos técnica, y quizás más desconocida para mi, pero que se hace completamente necesaria, ya que es fundamental entender como funciona el negocio al que estás aplicando por ejemplo técnicas de regresión. Ya que si no es así no podrás aplicar modelos funcionales y eficaces.

Qué es un científico de datos – curiosidad y entrenamiento

La mentalidad

Un rasgo de personalidad común de los científicos de datos es que son pensadores profundos con una intensa curiosidad intelectual.

La ciencia de los datos tiene que ver con ser curioso: hacer nuevas preguntas, hacer nuevos descubrimientos y aprender cosas nuevas. Pregúntale a los científicos de datos que están más obsesionados con su trabajo qué es lo que los impulsa en su trabajo, y ellos no dirán «dinero».

El verdadero motivador es poder usar su creatividad e ingenio para resolver problemas difíciles y disfrutar constantemente de su curiosidad.

La resolución de problemas no es una tarea, es mas bien un viaje intelectualmente estimulante a una solución. Los científicos de datos son apasionados de lo que hacen y obtienen una gran satisfacción al aceptar desafíos.

Formación

Existe una idea errónea de que se necesita un doctorado en ciencias o matemáticas para convertirse en un científico de datos legítimo. Esa visión pasa por alto que la ciencia de los datos es multidisciplinaria. El estudio altamente enfocado en la academia es ciertamente útil, pero no garantiza que los graduados tengan el conjunto completo de experiencias y habilidades para tener éxito. P.ej. un estadístico de doctorado aún puede necesitar adquirir muchas habilidades de programación y adquirir experiencia comercial para completar su formación.

De hecho, la ciencia de datos es una disciplina relativamente nueva y creciente que las universidades no han alcanzado a desarrollar programas integrales de ciencias de datos, lo que significa que nadie puede decir que ha «hecho toda la educación» para convertirse en un científico de datos. ¿De dónde viene gran parte del entrenamiento? La inquebrantable curiosidad intelectual de los científicos de datos los impulsa a ser autodidactas motivadas, impulsadas a auto-aprender las habilidades correctas, guiadas por su propia determinación.

 

CONCLUSIÓN

Un Data scientis es una persona con curiosidad intelectual que busca resolver nuevos retos analíticos, y para ello necesitará controlar la trifecta del data science: Matemáticas estadísticas, modelos de negocio y ciencia de la computación.

Desde luego una de las disciplinas más completas y que mas llaman la atención hoy en día a las grandes empresas.

otro articulo interesante: Big Data: SAS Soluciones Analíticas, Qué es y Cómo instalarlo


Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

A %d blogueros les gusta esto: