Saltar al contenido principal

Si no sabe (o no está 100% seguro) qué El modelo de datos de Power BI es, Has venido al lugar correcto. Veo a mucha gente confundida en cuanto a este término «modelo de datos» y, francamente, no culpo a nadie por estar confundido; es un concepto extraño para la mayoría de los profesionales que no son de TI. En este artículo explico qué es un modelo de datos para que tenga sentido para usted. He aprendido lo que sé sobre el modelado de datos durante muchos años leyendo artículos de muchas y amplias fuentes (como usted también lo está haciendo ahora).

¿Qué es un modelo de datos?

En resumen, un modelo de datos es la recopilación de

  • tablas de datos cargadas

    • con una o más columnas que se han cargado por un motivo (no cargue ninguna columna de su fuente en su modelo a menos que tenga un motivo).
    • con una o más filas de datos que se han cargado por un motivo (no cargue filas desde su fuente en su modelo a menos que tenga un motivo).
  • relaciones entre las tablas cargadas
  • las medidas (fórmulas) escritas que aplican las reglas comerciales a los datos sin procesar para extraer información comercial (por ejemplo, el precio de venta menos el precio de costo es la ganancia), incluyendo

    • las fórmulas mismas
    • el formato aplicado a las fórmulas
    • los nombres comerciales dados a las fórmulas

Todo lo anterior conforma lo que se conoce como “el modelo de datos” en Power BI (también para Analysis Services Tabular, Power Pivot para Excel y sin duda muchas otras herramientas de BI).

¿Por qué necesito un modelo?

Power BI es herramienta de informes de BI basada en modelos, sin embargo, no todas las herramientas de BI se basan en modelos. Un ejemplo de una herramienta de BI no basada en modelos es SQL Server Reporting Services (SSRS). SSRS es una herramienta de BI no basada en modelos. Las herramientas de informes de BI no basadas en modelos requieren que el redactor del informe genere primero una consulta para obtener los datos de una base de datos (normalmente SQL Server) y devuelva los resultados de esa consulta a SSRS para que los resultados se puedan representar en un informe. Muchas herramientas de informes no basadas en modelos tienen una interfaz de usuario que ayuda con la generación de la consulta (si lo desea), o también puede usar un lenguaje de secuencias de comandos como T-SQL para obtener los datos que necesita para cada informe.

Un segundo ejemplo es Excel. Excel también es una herramienta de BI no basada en modelos. En el caso de Excel, el usuario carga los datos en la hoja de cálculo y luego relaciona y agrega lógicamente los datos usando fórmulas de Excel y crea un informe (a menudo en una hoja en blanco) para resumir y presentar los resultados (el informe).

No hay nada de malo en usar una herramienta de BI no basada en modelos, es solo que es un enfoque diferente a una herramienta basada en modelos. El mayor «problema» con las herramientas de generación de informes no basadas en modelos es que cada vez que necesita un nuevo informe, debe comenzar de nuevo, a menudo desde cero.

Los beneficios de una herramienta basada en modelos como Power BI son:

  • el autor de «el modelo» crea una capacidad reutilizable (el modelo) que se puede utilizar para resolver los requisitos de informes actuales, así como (a menudo) los requisitos futuros sin la necesidad de volver atrás y escribir más consultas para recuperar un nuevo subconjunto de datos.
  • El autor a menudo puede ser un usuario empresarial (normalmente con buenas habilidades en Excel): no tienen que ser un administrador de bases de datos capacitado profesionalmente o un profesional de SQL.
  • El modelo es de naturaleza «conceptual», apoyado por una interfaz fácil de usar que le permite «construir» el modelo lógicamente con el mínimo de codificación. Nota: Necesitarás hacer algo de codificación (fórmulas de escritura) para un buen modelo, pero no más difícil que la hoja de cálculo de Excel promedio una vez que tenga las habilidades.

La vista de modelo en Power BI Desktop

Dentro de Power BI Desktop encontrará la «vista de modelo». La siguiente imagen muestra la estructura tabular de la base de datos de Adventure Works que utilizo para la mayoría de mis demostraciones.

101320_0243_whatisapowe1-8104898

Arriba puedes ver:

  • Las mesas
  • Las columnas en las tablas (aunque esta no es la mejor vista para las columnas, es mejor usar la vista de datos para eso)
  • Las relaciones entre tablas (si existen)
  • Los tipos de relaciones (los anteriores son todos «1 a muchos»)
  • La dirección de propagación del filtro entre las tablas usando las relaciones

Lo que no puede ver en esta vista de modelo son las medidas (las fórmulas que generan los conceptos comerciales a partir de los datos sin procesar).

Las medidas son parte de su modelo

Como ya mencioné algunas veces, las medidas son parte de su modelo de datos. Las medidas son el conjunto de instrucciones estándar que le dicen a Power BI cómo extraer los conceptos comerciales y estos forman parte de su modelo de datos. Permítanme ilustrar con un ejemplo.

Considere la columna ExtendedAmount de la tabla de ventas (que se muestra a continuación).

101320_0243_whatisapowe2-9492378

Esta es una columna de números que se almacena en la tabla de ventas en el modelo de datos. Estos números representan el valor total de un artículo de línea de ventas (una fila en la tabla es un artículo de línea). Por ejemplo, si compró 2 productos a $ 5,00 cada uno, el ExtendedAmount sería de $ 10,00. Por tanto, se sigue que

  • Si sumo la columna, me dice el valor total de todas las transacciones de ventas
  • Si cuento los valores en la columna, me dirá cuántos artículos de línea de ventas hay en todas las ventas.
  • Si promedío los valores de la columna, me indicará el valor promedio gastado por los clientes en todos los productos.
  • Si encuentro el valor máximo en la columna, me indicará el valor de artículo de línea individual más grande que se ha producido.

Power BI es más que capaz de hacer todo lo anterior sin la necesidad de que escriba ninguna fórmula. Pero Power BI no tiene ningún concepto de lo que significa cada una de las fórmulas anteriores en un contexto empresarial. Puede hacer los cálculos, pero no puede darle un buen nombre comercial para el resultado, ni elegir el formato numérico más apropiado para el resultado. Si quieres esas cosas, debes hacerlo tú mismo. Necesita ampliar el modelo de datos para incluir medidas (fórmulas) para satisfacer sus necesidades. Podrías escribir las siguientes medidas:

Total Sales Value = SUM(Sales[ExtendedAmount])              format as Currency, 0 decimals
Total Line Items = COUNT(Sales[ExtendedAmount])             format as whole number, comma separated
Average Line Item Value = AVERAGE(Sales[ExtendedAmount])    format as Currency, 2 decimals
Maximum Line Item Value = MAX(Sales[ExtendedAmount])        format as Currency, 2 decimals

Estos son solo ejemplos simples que funcionan en una sola columna de datos. Todos estos pueden ser calculados por Power BI sin la necesidad de aprender el lenguaje de fórmulas de DAX. Pero si desea algo más complejo (y probablemente más útil), definitivamente necesitará aprender algo de DAX para aprovechar al máximo Power BI.

Tu modelo es un activo

A menudo pienso en un modelo de datos de Power BI como un activo, algo que se construye y mejora con el tiempo. Cuanto más esfuerzo ponga en su modelo, más valioso se vuelve. Cuando llega el momento de crear un nuevo informe sobre sus datos, no comienza de nuevo (como suele hacer con las herramientas que no están basadas en modelos). En lugar toma su activo (su modelo de datos) y lo reutiliza nuevamente. Si tiene suerte, no hay nada que cambiar y simplemente puede crear un nuevo informe sobre su activo existente. A veces, necesitará mejorar un poco su activo para satisfacer los nuevos requisitos.. En este caso, primero construye sobre el activo que creó anteriormente y luego crea sus nuevos informes en la parte superior.

Otras lecturas

Si desea obtener más información, le recomiendo leer algunos de mis otros artículos que se enumeran a continuación.

Si desea obtener más información sobre DAX, un excelente lugar para comenzar es con mi libro superventas Supercharge Power BI: Power BI es mejor cuando aprende a escribir DAX.

Si desea obtener más información sobre el modelado de datos, puede consultar el curso de capacitación en línea Modelado dimensional desarrollado por Ken Puls, Miguel Escobar y yo. Es un curso completo que cubre muchos detalles sobre cómo modelar sus datos para resolver sus problemas comerciales.